由 GPT 引发的这波「大模型热」将会如何洗牌?
想象一下,未来每个人都能拥有一个 IQ 超过 300 的智能助理,Ta 知道你是谁、你想要什么,并且会精准地给到你想要的信息,并作为你的私人助理与你一起执行任务。这无疑会为人类社会各个领域带来新变革。很显然,大模型是这场技术革命的先导,也是新一轮产业变革的催化剂。
2022 年底,GPT-3.5 在 MMLU 上的准确率还仅仅在七成左右,但是不到两年的时间,OpenAI 便在 Scaling Law 的加持下相继推出 GPT-4、GPT-4o、OpenAI o1——OpenAI o1 在 MMLU 的准确率已经逼近了100%。
技术的迭代如此之快。尤其是 OpenAI o1 为 Scaling Law 带来新探索方向的当下,如果一个人说自己能够百分之百预测未来的 AI 走向,这毫无疑问是过于自大了。关于“未来会如何发展”这个问题,确实很难给出确切的答案。不过,我想我们可以聊聊“未来不应该是怎样”。
Scaling Law 的持续影响下,无论是硅谷还是国内,大模型赛道正在掀起一场 AI Infra 的“军备竞赛”。OpenAI 与微软合作打造 AI 数据中心;由 xAI 也在和英伟达合力打造训练集群。放眼国内,GPU 更是一度价格疯涨,“一卡难求”。
这是一场由 OpenAI、xAI、Google、Meta 等硅谷巨头引发的巨大赌局。以巨额计算资源为赌注,去赌 Scaling Law 的收益递减未来能够得到解决。这里我们暂且不论 Scaling Law 是否是通往 AGI 的正确路线,现在已经发生的事实是,这一竞争格局引导着大量资金流入芯片和数据建设等领域。
然而,这是一个健康的科技创新生态吗?我们不妨把生成式 AI 生态看成一个金字塔结构,从下到上分别是芯片、AI Infra 、应用。
梳理近代几波技术革命,从 PC 时代到移动互联网,我们可以看到,在创新生态中,只有当最终应用爆发,取得更多收入时,才能形成健康的良性循环——应用吸引用户(客户),推动基础设施改进,随后基础设施的改进支撑应用不断迭代,吸引更多用户(客户)加入,促使良性循环的产生。直观地说,这个金字塔应该是“倒三角”。
然而,当前的大模型生成式 AI 生态系统中,过多资金和利润被芯片层和 AI Infra 层分去了,特别是芯片层吸引并创造了巨大的市场价值,而大模型的应用层不论中外都还在持续地探索验证。如今的生成式 AI 生态更像是单纯追求 AGI ,真正能提高企业和个人生产力的应用层只是一个“副产品”。
这显然是不合理的。追求 AGI 与让模型能力落地并不矛盾,甚至应该说是相辅相成的。从行业角度来看,只有应用层的繁荣才能引导整个生态走向良性循环;从公司自身的角度来看,成功的应用能够带来稳定的经营现金流,成为支撑 AGI 探索的商业基础。
这就决定了,大模型公司本身不仅要关注基座模型的性能,不仅要关注算力储备,更重要的是 Make AI Work,让模型能力能够真正落地,形成 ToB/ToC 应用,产生商业价值。
那么,如何才能在模型、AI Infra 与应用之间把握平衡呢?我想,在这里我们可以尝试回看苹果的发展历程。在 iPhone 推出的时候,很多底层技术都已经存在了,但是为什么诺基亚、黑莓都没能做出 iPhone?就是因为乔布斯看到了未来,苹果一家就把软件、触屏等等技术全部垂直整合在了一起。
从 IOS 1 到 IOS 17,从 iPhone、iTunes 再到 iPad,苹果最终构建起了一个伟大的生态系统。但是不要忘记它的第一步不是在“坐等风来”,而是做了 “垂直整合”。
今天我们又看到了同样的机会。从成立的第一天起,零一万物就是模型、AI Infra、应用三端同步启用,构筑自身的垂直整合能力。这也是我之前多次强调的“三位一体”。我们希望模型和应用同时报捷,希望能带来中国的 ChatGPT Moment。让模型能力真正融入应用,让应用贴近用户一直是我们的目标。
垂直整合的优势就在于,基于模型、 AI Infra、应用等多方面的能力,零一万物无需等待其他环节准备就绪,就可以基于国际一流模型构建出优秀的应用,并且迅速推向市场。这种“多位一体”的垂直整合能力还会让应用速度更快、性能更优、成本更低。
ToC 方面的应用矩阵探索,零一万物自成立开始就在不断推进。今年,海外的专业生产力工具产品发展良好。同时,仰赖于国际领先的AI infra优势,我们的推理成本跟去年相比已经有了大幅下降,模型性能也有明显的提升,接下来我们就可以去尝试 DAU 更高、用户量更大的 ToC 应用,相信不久之后就会有好消息。
之前我曾讲过,做大模型时代 ToC 应用的一个堵点在于人才,找到一个既懂大模型又懂产品的 PM 很难;模型能力在 ToB 方面的落地同样如此,模型能力与行业 Know-how 缺一不可。
我们都知道,大模型的泛化性使得 AI 2.0 的大模型公司能够一定程度上摆脱 AI 1.0 时代面向特定场景、采用特定算法、解决特定问题”的交付窘境,但是面对复杂应用场景时,只靠裸模是无法满足客户需求的,相关的工具链条和训模方法论必不可少。
比如,我们走访了欧美、中东客户,发现国际市场上私有化定制模型的需求没有被很好的满足。定制模型需要结合企业数据做继续训练的,但是大部分企业内部的数据是不能直接拿来训练模型的,需要经过复杂的数据处理工作,好在我们有自研向量数据库可以进行高效的数据索引,有成熟的数据处理、配比等管线来支持模型的继续训练;再比如,在物流运筹场景下,Function calling 能力则直接影响着模型方案的最终效果,我们的 Yi-Large-FC 在权威评测榜单 Berkeley Function-Calling Leaderboard (BFCL)总榜排名也处于世界第一梯队。
与此同时,零一万物在 ToC 与 ToB 两个方向上所积累的交付能力已经实现了内部打通。如在海外已经取得阶段性成果的 ToC 产品的能力,就可以丝滑复用到企业端专业产品矩阵里。
这就构成了一套从模型到应用完整的企业级解决方案。我们可以帮助企业把行业数据提炼出来,搭建数据库,训练自己的专属模型;另一方面,基于各项模块化的能力,我们还可以帮助企业结合自身场景产出对内、对外的应用。目前已经与我们达成合作的企业客户中,不乏世界 500 强企业。
近期,我们还会正式对外公布 Yi 系列新的旗舰模型,它采用了创新的 MoE 架构,模型性能更上一层楼,推理成本却逼近行业最低。后续它会上线我们的 Yi 大模型开放平台,也会接入我们的数字人方案和全行业 ToB 解决方案中。在这款新模型的加持下,零一万物会在“Make AI Work”之路上走得更快、走得更远,让千行百业用得上 AI。
通过这些努力,我们希望能够将生成式 AI 当前的“三角形”生态转正,由半导体行业分得的利润应当回归到应用层,让整个行业生态回归到健康的良性循环。长期来看,这必然会发生,但是它需要时间。从这个角度来看,中国的团队庞大的市场、丰富的应用场景以及强大的执行力。这些因素结合在一起,为我们提供了一个独特的机遇,让我们能够在 AI-First 新时代中占据领先地位。
在接下来的两年内,我相信会有很多基于大模型的、令人惊艳的应用出现。现在,生成式 AI 能够帮你写作、绘画、制作视频,随着时间的推移,它将通过更深入地理解和处理多种模态的数据,如文本、语音、图像和视频,增强其对现实世界的感知能力,从环境中获取反馈,并据此进行自我优化。
未来,当你告诉 AI,我妻子的生日快到了,它不仅能帮你选出附近最好的花店、蛋糕店,甚至可能十分贴心地直接帮你准备好了鲜花、蛋糕和生日礼物。到那时,我们将会更加接近 AGI 的目标,原本只存在于科幻小说中的智能机器人也将真正融入并直接影响我们的生活。