一举拿下“大模型五虎”,阿里为何要重押中国 AI 创业热潮?|钛媒体AGI

封面新闻记者 闫雯雯 谭羽清 梁家旗2023年6月,第十九届中国西部国际博览会上,一台FLASH放疗设备模型受到多方关注。这项“未来医疗”技术可将一个月的放疗过程压缩到1秒内,大幅降低副作用,提高治愈率。与此同时,四川玖谊源粒子科技有限公司的销售人员,正在与来自肯尼亚的客户磋商医用回旋加速器出...

阿里巴巴集团近期在人工智能(AI)大模型领域加速布局。

钛媒体App 3月7日消息,据彭博报道,阿里日前领投国内 AI 大模型独角兽MiniMax新一轮融资,总额至少为6亿美元,而投后估值超过25亿美元(约合人民币179.96亿元)。

报道称,除了阿里,红杉中国已确认将参与本轮融资,其余跟投者还在洽谈中,相关条款可能会有所调整。MiniMax老股东则包括腾讯、米哈游等。

不仅如此,早前阿里还领投月之暗面(MoonShot AI)10亿美元融资,红杉中国、小红书、美团等机构均有参与其中,成立不到1年投后估值高达25亿美元,一举刷新国内AI领域最大单笔融资记录。

如今,阿里巴巴集团不仅自家正开发通义千问等大模型产品,而且不断投资布局,一举拿下5大模型领域头部独角兽:智谱 AI、百川智能、月之暗面、零一万物和Minimax。

前经纬创投VP、知乎大V庄明浩3月4日评论称:阿里你这是在集邮呢吗?

截至目前,阿里方面对于上述两家的投资均未发表评论。针对此次融资,月之暗面、MiniMax两家公司均对钛媒体AGI表示“不予置评”。

事实上,早在2015年,阿里云开始推出AI产品,适用于语音识别、图像识别、视觉识别等多个领域。

随后,阿里投资入股深鉴科技、寒武纪、商汤科技、旷视科技、依图科技等一众 AI 公司,涉足更核心的技术领域,并弥补阿里在AI视觉识别方面的不足。

2020年初,阿里达摩院启动中文多模态预训练模型M6项目,同年6月推出3亿参数的基础模型;2021年1月模型参数规模到达百亿,成为世界上最大的中文多模态模型;2021年5月,具有万亿参数规模的模型正式投入使用,追上了谷歌的发展脚步;2020年10月,M6的参数规模扩展到10万亿,成为当时全球最大的 AI 预训练模型。

2023年4月,阿里云智能CTO周靖人正式宣布推出超大规模的 AI 大模型“通义千问”,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。时任阿里云CEO张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。

2023年10月,阿里云正式发布千亿级参数大模型通义千问2.0,以及基于通义大模型训练的8大行业模型和一站式大模型应用开发平台阿里云百炼、阿里 AI 平台PAI等,并透露阿里云上超过30款云产品已接入大模型能力。阿里云称,通义千问2.0的综合性能超过GPT-3.5,正在加速追赶GPT-4。

阿里巴巴集团董事长蔡崇信曾表示,中国有一半大模型企业跑在阿里云上,并为中国约80%的科技公司提供服务。

到了2024年,阿里在 AI 领域加速布局。

钛媒体App梳理发现,截至目前,阿里主要分为三个业务层去推进 AI 大模型技术落地:阿里投资、阿里巴巴集团智能计算研究院、阿里云。

首先是阿里投资。

据钛媒体AGI的不完全统计,目前阿里、腾讯两家公司已累计投资超过40家与 AI、数字化有关的初创企业。其中,阿里投资近期大爆发,一举拿下“大模型五虎”——智谱 AI、百川智能、月之暗面、零一万物和Minimax,甚至比腾讯、百度更快。

彭博认为,阿里与微软等公司一样,对生成式 AI 技术下重注,表明阿里正在恢复快速投资步伐,甚至转变新的投资赛道,入局 AI 这一中国最为鼓励的赛道。

The Information认为,阿里为何要这么做?一方面,中国的 AI 初创公司竞赛还没有像美国的OpenAI、Anthropic这样明显的领跑者,相反,由于数十家中国初创公司都在宣传自己的大模型,该行业很可能会经历一场重大洗牌。如果阿里只对一家中国初创公司投入数十亿美元,就像亚马逊投资Anthropic那样它有可能会押错。因此,阿里向众多 AI 公司提供资金是完全有道理的。

其次是阿里智能计算研究院。

近期,该团队上线 AI 图片视频生成模型技术EMO,引发广泛关注。而日前上线的一款“中国版Sora”——AI 视频生成模型AtomoVideo也是出自该团队。

公开信息显示,阿里巴巴智能计算研究院是中国科学技术大学与阿里巴巴达摩院合作的研究实验室,主要围绕 战略方向,开展 AI 、智能计算等领域的基础性、前瞻性和关键共性技术研究;发挥产研合作优势,共同培养“新工科”人才等。

最后是阿里云。

一举拿下“大模型五虎”,阿里为何要重押中国 AI 创业热潮?|钛媒体AGI

钛媒体AGI此前在报道中透露,今年1月阿里云Qwen-VL模型实现迭代升级,宣布 Plus 和 Max 两大版本升级,支持以图像、文本作为输入,并以文本、图像、检测框作为输出。阿里云方面称,相比于开源版本的 Qwen-VL,Plus 和 Max 版本模型在多项图文多模态标准测试中获得了堪比 Gemini Ultra 和 GPT-4V 的水准,并大幅超越此前开源模型的最佳水平。

不仅如此,阿里云还推出了一个类似于亚马逊的Bedrock平台,名为魔搭社区平台(Model Studio)。它可以帮助阿里云客户开发 AI 应用,让他们不仅可以访问阿里通义模型,而且可访问多个初创的基础模型如百川大模型、GLM-4等,以完成阿里大模型生态。

(图片来源:钛媒体App编辑拍摄)

阿里云曾透露,目前有280万AI开发者活跃在阿里云魔搭社区上。

所以从整体来说,阿里集团正加大对 AI 领域的投入,并且在最近一次文章中强调持续投资中国生成式 AI 领域以取得领先地位。

“我们正处于一场新革命的风口浪尖,这场革命涵盖人机交互、计算模型和 AI 辅助创作,”去年9月份就任的阿里巴巴集团CEO吴泳铭在3月5日的一篇文章中表示,通用 AI 正在从技术梦想一步步走向现实,大模型技术落地应用呈现星火燎原之势,全球已经出现了一批AI native(智能原生)的独角兽企业,将给人类的工作、生活带来翻天覆地的变化,同时也会深刻影响科学研究与产业发展的进程。

不过目前,阿里依然在 AI 领域面临两个重要挑战:一是阿里云增长缓慢、利润率低,例如截至12月的季度内,阿里云业务收入仅增长3%,最近阿里云宣布对其客户进行有史以来最大幅度的降价,称是“推动中国 AI 增长”举措;二是 AI 投资回报慢,所有 AI 企业很可能无法实现上市,而阿里也很难以此退出,或是难以通过并购进行更深入发展。

“我说如果没有反垄断,我愿意投王小川(百川智能)的。至少能卖给腾讯或者阿里。有了反垄断,我不知道怎么退了。”金沙江创投主管合伙人朱啸虎日前公开表示。

吴泳铭强调,面向未来,“云+AI”是支撑创新发展的底座。阿里将继续围绕 科技战略,加大技术、人才、资金等投入,持续增强 AI 的基础服务体系能力,不断拓展开源开放边界。

(本文首发钛媒体App,作者|林志佳)

关键词:阿里模型中国