首页 > 生活学习 > 生活学习 > 微软将推出自研 5000 亿个参数的大模型:MAI-1

微软将推出自研 5000 亿个参数的大模型:MAI-1

发布时间:2024-05-07 22:57:48来源: 15210273549

2024 年 5 月 7 日,《The Information》报道,微软正在开发一个拥有大约 5000 亿个参数的大语言模型(LLM)。

 

这标志着微软自从往 OpenAI 投资逾 100 亿美元,以便可以重复使用这家初创公司的 AI 模型以来,首次自行开发这等规模的 AI 模型。

该 LLM 在微软内部被称为 MAI-1,预计最早将于本月首次亮相。

OpenAI 在 2020 年年中推出 GPT-3 时,详细说明该模型的初始版本有 1750 亿个参数。该公司透露,GPT-4 更庞大,拥有更多的参数,但尚未透露具体数字。

一些报道显示,OpenAI 的旗舰 LLM 拥有 1.76 万亿个参数,而谷歌的 Gemini Ultra 据称拥有 1.6 万亿个参数,性能与 GPT-4 旗鼓相当。

微软的 MAI-1 拥有 5000 亿个参数,这表明它可能被定位为介于 GPT-3 和 GPT-4 之间的某种中档模型。这样的配置将允许模型提供高响应准确度,但耗用的功率比 OpenAI 的旗舰 LLM 低得多。言外之意,这将为微软带来更低的推理成本。

开发 MAI-1 的工作由 LLM 开发商 Inflection AI Inc.的创始人 Mustafa Suleyman 监管。

 

Mustafa Suleyman

 

今年 3 月,通过一笔价值 6.25 亿美元的交易,Suleyman 和这家初创公司的大多数员工一起加入了微软。这位高管早些时候与他人共同创立了谷歌的DeepMind AI 研究部门。

微软可能使用 Inflection AI 的训练数据及另外某些资产来驱动 MAI-1。

据称,该模型的训练数据集还包含多种类型的信息,包括 GPT-4 和互联网内容生成的文本。

为《The Information》提供信源的知情人士表示,微软尚未决定它将如何使用 MAI-1。如果这个模型确实拥有 5000 亿个参数,那么它太过复杂了,无法在消费级设备上运行。这意味着微软很可能会将 MAI-1 部署在其数据中心,那样 LLM 可以集成到必应和 Azure 之类的服务中。

据信,微软可能会在 5 月 16 日召开的 Build 开发者大会上展示MAI-1,如果到时候该模型的表现足够令人满意的话。这暗示该公司预计会在几周内推出该模型的工作原型(如果目前还没有工作原型的话)。

就在不到两周前,微软刚刚开源了一种名为 Pi-3 Mini 的语言模型。据微软声称,这种模型仅拥有 38 亿个参数,但性能却比参数多 10 倍的 LLM 更胜一筹。Pi-3 是一个 AI 系列的一部分,该系列还包括另外两个更庞大的、性能略胜一筹的神经网络。

开发 MAI-1表明微软内部对 AI采取了双管齐下的做法,既关注面向移动设备的本地运行的小型语言模型,也关注由云支持的大型先进模型。据报道,苹果也在探索类似的做法。这也凸显了微软不依赖OpenAI 探索 AI 开发的意愿,OpenAI的技术目前支持微软最雄心勃勃的生成式 AI 功能,包括嵌入到 Windows 中的聊天机器人。

生活学习更多>>

苹果可折叠手机iPhone Flip显示屏将更省电 有望成为顶尖折叠机 苹果iOS 19或将迎来重大界面革新 苹果开启无接口iPhone研发?最大障碍已扫清 招41人!衢江区事业单位招聘 南京市2025年事业单位 统一公开招聘工作人员公告 拟招聘139人!宜宾应届毕业生国资专聘行动正在报名 北京市人大常委会机关所属事业单位公开招聘2025年应届毕业生公告 通州区2025年事业单位拟招聘224人 运城市中心医院诚聘英才 20个岗位60人,期待您的加入 洛龙区、孟津区发布 最新招聘公告 公开招聘公益性岗位人员 共计138人 公安部新闻传媒中心 2025年度公开招聘公告(在职人员) 甘谷县中医医院2025年 公开招聘编外工作人员公告 TCL洗衣机再破行业天花板 发布会或将曝光洗衣黑科技,告别手洗 TCL C12K震撼上市,开启第四代液晶电视新纪元 TCL发布AI超级筒“大眼萌”Pro系列洗衣机 1.31洗净比 高铁1.5Gbps极速狂飙 辽宁移动携手中兴打造全国首条5G-A智算高铁 2025雄安未来之城场景汇国际机器人大赛对接推介会在江苏省苏州市召开 全球首次,宇树科技G1机器人完成侧空翻!王兴兴,拟获表彰!俞敏洪曾称:王兴兴是个天才 “流浪”长达286天之后,两名美国宇航员抵达地球,滞留期“加班费”约人民币8300元 Boss直聘崩了!网友:突然就什么都没有了,刷新都没用 特步创始人“90后”长女出任公司CFO,曾获伦敦大学学院经济学学士学位 苹果:主力合约跌 2.66% 库存去库放缓 TCL新品电视来袭,终于告别烦人的反光了! 深圳TCL智能家庭科技申请门锁交互专利,有效提升门锁使用性能 北京这晚,站在孟子义旁边的卢靖姗,把人情冷暖体现的淋漓尽致 北京市郊铁路东北环线启动环评,长59公里、设站16座 阅文集团2024年亏损2亿元,打造爆款“庆余年”“人世间”的新丽传媒成“吞金兽” 490余家单位提供2万余个招聘岗位 公开招聘!涉及机关、上市公司、学校! 科技日报社2025年度公开招聘7名应届高校毕业生