微软亚洲研究院提出全新大模型基础架构：推理速度 8 倍提升，内存占用减少

时间:2023-07-18 来源:区块链网络作者:邱祥宇

据量子位报道，来自微软亚洲研究院（MSRA）的学者在“Retentive Network: A Successor to Transformer for Large Language Models”论文中提出新的大模型架构 Retentive Network（RetNet），这被视作大模型领域 Transformer 的继任者。实验数据显示，在语言建模任务上：RetNet 可以达到与 Transformer 相当的困惑度（perplexity），推理速度达 8.4 倍，内存占用减少 70%，具有良好的扩展性。并且当模型大小大于一定规模时，RetNet 表现会优于 Transformer。

原文链接

知识： AIGC

微软亚洲研究院提出全新大模型基础架构：推理速度 8 倍提升，内存占用减少

时间:2023-07-18 来源:区块链网络 作者:邱祥宇

时间:2023-07-18 来源:区块链网络作者:邱祥宇