据品玩 9 月 26 日报道,HuggingFace 页面显示,微软 DeepSpeed 近日公布了一款名为 DeepSpeed-VisualChat 的框架,旨在通过整合多模式功能来优化大语言模型的能力。 据论文显示,DeepSpeed-VisualChat 的重点是提高大语言模型处理交错输入方面的熟练程度。为此,该框架引入了创新的多模式因果注意机制,在现有数据集上利用数据混合技术来确保无缝多轮、多图像对话中的交互。与现有框架相比,DeepSpeed-VisualChat 显示出高达 70B 参数语言模型大小的卓越可扩展性。 原文链接 —- 编译者/作者:东寻 玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。 |
微软正研发 DeepSpeed-VisualChat 框架,优化大模型多模态表现
2023-09-26 东寻 来源:区块链网络
LOADING...
相关阅读:
- 锐捷网络:推出 AI Fabric 智算中心网络解决方案2023-09-26
- 韩国成立生成式人工智能初创企业协会2023-09-26
- 韩国 SK 电讯宣布“AI 金字塔战略”,力争成为全球 AI 巨头2023-09-26
- vivo 短视频发布 AIGC 写真功能,由无界 AI 提供技术支持2023-09-26
- AI 炒股跑输沪指,止于至善基金 7 月以来净值跌幅超过 9%2023-09-25