首页 ›行业› 最新信息 › 查看内容

大模型创业，李彦宏公布标准答案

2023-11-17 11:15| 发布者: Leepar| 查看: 52| 评论: 0

摘要: 日前，原阿里首席AI科学家贾扬清的一条朋友圈截图在社交媒体传得沸沸扬扬。截图指出某国产大模型其实是LLaMA架构，只是更换了几个变量名而已。这也不是业内人士第一次发声质疑，在几个月前的Waves大会上，中国人民大 ...

日前，原阿里首席AI科学家贾扬清的一条朋友圈截图在社交媒体传得沸沸扬扬。截图指出某国产大模型其实是LLaMA架构，只是更换了几个变量名而已。

这也不是业内人士第一次发声质疑，在几个月前的Waves大会上，中国人民大学高瓴人工智能学院卢志武教授也曾表示，所谓“国产大模型的春天”，不过是很多公司在“微调国外底座模型”的假象。

虽然后续也有其他学者表达了不同的看法，但争论之下，一条有关大模型的暗线已然浮出水面——大模型，越多越好吗？

关于这个问题，百度创始人、董事长兼首席执行官李彦宏在11月15日举行的深圳2023西丽湖论坛上给出了自己的答案：

“目前中国的大模型太多，而模型之上开发的AI原生应用太少。”

“人类进入AI时代的标志，是出现大量的AI原生应用，而不是出现大量的大模型。”

大模型狂飙

要想回答开头的问题，首先需要搞清楚，我们需要怎样的大模型。

以去年11月底 ChatGPT的横空出世为分界线，国内大模型发展经历了从寒冬到盛夏的两级反转。不只是阿里、百度等巨头公司，越来越多的创业公司开始涌入这个赛道：截止今年10月，国内已经发布了238个大模型，而6月份的时候这个数字是79个，相当于4个月就翻了3倍。

但正如开头专家们所质疑的，大模型的风口并不好追。大模型的颠覆性来自其“智能涌现”的能力：简单解释就是触类旁通，通过训练，即便是没有教过的东西，大模型也会。以百度的文心一言为例，在此前的演示中，当李彦宏要求其现场根据一些关键词为一辆新能源汽车生成广告时，文心一言仅仅花了三分钟就生成了竖版广告、5条文案和一段30秒的数字人广告。

获得这样能力的前提是模型的参数规模足够大，训练数据量足够多并且能够不断投入，进行迭代。

一方面，这决定了大模型是典型的资金密集型赛道，要开发好用、可用的大模型，存在很高的技术和成本门槛。据OpenAI联合创始人布罗克曼等测算，训练大模型消耗的计算量，每 3、4 个月会翻一倍。据多位业内人士估算，OpenAI 训练 GPT-3 一年，仅算力成本就有 2000 万美元。

另一方面，这也使得缺乏“智能涌现”能力的专用大模型难言价值。在会上，李彦宏曾提到一个现象，很多行业、企业，甚至很多城市都在买卡、囤芯片，建立智算中心，想要从头训练自己的专用大模型，但大模型的产业化模式，应该是把基础模型的通用能力和行业领域的专有知识相结合。大模型更通用，但是成本高，小模型虽然只能应对特定场景的任务，但胜在成本低，实时性较强。在训练的过程中，大模型能够帮助小模型提升快速生成、标记样本的能力，而小模型则帮助大模型快速收敛，从而提升算法性能。

一个例证在于，文心大模型的API调用量。李彦宏表示：“自从8月31号开放以来，文心大模型的API调用量，呈现了指数级的增长。国内有200多个大模型，文心大模型一家的调用量比这200多家大模型的调用量加起来还要多。”

读到这里其实不难发现，大模型本质是一个基础底座，有些类似pc时代的Windows操作系统或者移动互联网时代的安卓或者ios系统。它的门槛和特性决定了，未来的竞争格局一定是一到两个技术底座占据行业的统治地位。这也是为什么李彦宏会强调：“不断地重复开发基础大模型是对社会资源的极大浪费”。

大模型的价值锚点

业界之所以把大模型视为第四次工业革命真正进入快车道的标志，是期待其所带来的效果和效率的跃迁。

还是以百度的文心大模型为例，自今年三月正式发布后基于文心大模型3.0的文心一言产品后，上个月，百度又发布了文心4.0版本。和前代相比，4.0是迄今为止最强大的文心大模型，在理解、生成、逻辑和记忆四大能力上，都有明显提升。比如，在生成能力上，文心一言除了生成文字内容，更包括了图片、视频、数字人等多模态内容，可实现的创作体裁超过200种，涵盖了几乎所有写作需求。在逻辑和记忆能力上，相比之前的版本也有了成倍提升。

但和过去诞生的许多新技术一样，大模型也需要解决应用场景的桎梏，寻找兑现商业价值的路径。就如同pc时代改变我们办公、游戏方式的软件，以及在根植于移动终端的抖音、微信这样的应用一样，同样具备技术底座属性的大模型如果不能形成繁荣的生态，那么也就难言价值。这也是大模型真正的价值锚点所在。

李彦宏在会上表示，“AI原生时代，我们需要的是100万量级的AI原生应用，而不是100个所谓的大模型。”

这需要从业者们共同努力。比如李彦宏提到一个情况，和国内百模大战的情况相比，国外虽然涌现了几十个基础大模型，但对于AI原生应用的探索也很火热，目前已经有上千个AI原生应用。例如微软、Adobe都根据自身业务推出了相对应的AI原生应用。

发力生态建设也是百度一直在做的事情，目前百度智能云千帆大模型平台2.0月活企业数近万家，覆盖了金融、教育、制造、能源、政务、交通等多个行业的400多个场景，拥有了800万AI开发者。

无论是PC时代还是移动互联网时代，技术变革往往也意味着那些大机会，比如通讯、娱乐、购物、工作等。这些人们最本质的需求往往会因为技术而焕发新的形式和生机，就好比当人们满足于互联网时代的图文阅读模式时，一定不会想到未来有一个叫抖音的APP改变了数以亿计人群的娱乐方式。

正如李彦宏所言，直到今天，无论是中国也好，美国也好，最好的AI原生应用还有没出现。就像移动时代诞生了像微信、抖音、Uber这样的“mobile-native”的应用一样，AI原生时代一定会有优秀的AI原生应用是基于这些大模型开发出来的。

也因此，对于大模型从业者们而言，和花大力气用于开发大模型相比，如何做出更好的AI原生应用显然是更大的机会。

如何迎接AI时代

在此前的百度世界大会上，李彦宏曾表示“企业竞争，不是大鱼吃小鱼，而是快鱼吃慢鱼，比竞争对手更快决策，很可能你就赢了。”

和这段发言相印证的，是过去 7 个月里，百度在大模型方面的推进速度——文心大模型大大小小的更新有数十次，提出了多个大模型生态计划，率先向全社会开放了大模型应用。

这里的逻辑有两个。

首先是CEO对于业务驱动的关键作用。现在AI和大模型会成为新的变革技术几乎已经成为共识，咨询机构麦肯锡预测：大模型和它掀起的生成式人工智能有望为全球经济贡献约 7 万亿美元价值。

但是作为企业应该如何拥抱AI时代呢？李彦宏表示，虽然许多企业上上下下都很重视这次机会，但对于问题的本质了解不深，“以为自己搞个基础模型，或者按照网上传播的评测方法来挑选一款评分高的大模型，就是拥抱AI时代了”。

实际上，大模型有没有对互联网公司的DAU、时长、用户留存这些指标产生正向影响，有没有对企业的收入、利润、成本产生影响，才是问题的本质，而这些是只有CEO才会关心的问题，做最适合自己公司业务的选择。

其次，强大的基础大模型，是AI原生应用的底层驱动力，而AI原生应用则会带动市场，倒逼市场变化。

基于自家的文心大模型，百度不仅把旗下各产品线进行了AI原生化重构，也孵化了全新的AI原生应用。比如智能代码助手Comate。百度现在每新增100行代码，就有20行是AI生成的。同时，得益于智能化的提升，AI原生化重构后的产品也取得了新的进展，比如百度文库的付费率提升明显。

这里李彦宏举出新能源汽车去做类比：“中国新能源车在全球的市场份额达到65%。因为国家政策扶持的就是应用端，通过减免车辆购置税，上路不限号不限行等手段，有效拉动了新能源汽车产业的快速增长。AI产业也是需求驱动，所以应该是在需求侧、应用层发力，就像补贴新能源汽车用户一样，鼓励企业调用大模型来开发人工智能原生应用，用市场推动产业发展。”

如果说此前几次工业革命，中国的主题是错过和追赶，那在大模型风起的当下，我们起码已经和国外站在了同一起跑线。在这场竞争中，我们有足够的技术和资源去做比拼，而更值得思考的，则是选择一条怎样的路。和百模大战相比，通过类比过去的技术浪潮，强调AI 原生应用或许是一个更好的路径。

毕竟就在当下，如何平衡收入和支出，已经成为大模型企业们头疼的问题。

鲜花

握手

雷人

路过

鸡蛋

上一篇：亚马逊将从明年起在自家美国官网上销售现代汽车新车可由当地经销商配送 ... ...下一篇：蔚来大收缩：拒绝重回2019

收藏邀请

扫一扫关注最新动态

大模型创业，李彦宏公布标准答案

Function

关于！