根据北京市经信局公布的数据,截止到2023年10月初,国内公开的AI大模型数量已经达到238个。
尽管学术界对大模型的参数量并没有明确的标准,许多10亿级参数的模型并不能和GPT4相提并论,国内大模型的爆发式增长,无疑揭示了一个既定事实:和每一次风口出现时一样,总有人一窝蜂地涌入,试图在新一轮的创业潮中搏一个机会。
就像创新工场董事长李开复的观点:AI大模型是绝对不能错过的历史机遇。因为这将是有史以来最大的平台革命,它将比Windows、安卓要大10倍甚至更多,它会让每个应用改写,会重构人类的工作,会让有创意的那些人的聪明才智被放大10倍或者更多......
为了不错过“百年一见”的历史机遇,一场“百模大战”正在上演,可问题在于:当前的大模型战场,当真是属于创业者的机会吗?
01 “插件”更像是一种过渡
大模型的爆火,属于多种因素叠加的结果,其中让大多数人印象深刻的标志性事件有两个:一个是ChatGPT的走红,月活用户量在两个月的时间里就超过一亿;另一个是英伟达CEO黄仁勋的比喻,认为“AI的iPhone时刻已经来临”。
冷静下来思考,这两个事件都有着鲜明的移动互联网色彩,将月活视为一个产品成败的标准,将某个产品的爆炸性增长视为市场需求被激活的晴雨表。这样的逻辑是否合理还不得而知,但深深影响了大模型商业模式的构建。
于是,很多大模型都在打造自己的“应用中心”。OpenAI上线了ChatGPT插件,付费用户可以调用插件解决某类需求,目前ChatGPT上已经有近1000个插件;国内的百度也在积极布局,发布文心一言插件生态平台“灵境矩阵”,并计划提供百亿流量、亿元基金等激励来扶持插件生态。
个中缘由并不难理解。
无论是站在移动互联网塔尖的苹果,还是出货量稳居前五的安卓厂商,无不构建了应用市场的变现模式,衍生出了广告排名、支付分成、游戏联运等多种盈利方式。甚至微信这样的超级APP,也通过小程序实现了类似的机制。
就现阶段来看,像手机厂商一样经营“插件生态”,可能是大模型平台当下的最佳选项,而开发者同样乐见其成。
就像移动互联网催生的流量红利,灌溉了大大小小的应用,倘若大模型可以沿着移动互联网的轨迹增长,大概率将带来了新一轮的红利。为大模型平台开发插件,可能会得到平台的流量倾斜,拿到大模型时代的门票,乃至通过“降维打击”的方式颠覆固有的市场格局。
问题在于,大模型平台能否成为占领用户习惯的入口?在互联网和移动互联网时代,入口一词频频被提及,可以细分为内容、应用、操作系统、硬件四个维度,充当着用户获取信息、解决问题的第一触点。
眼下的挑战在于,坊间普遍认为通用大模型会趋向寡头化,最终只剩下两到三家,开发者选择加入哪个大模型插件生态,就像是一场豪赌。毕竟ChatGPT的访问量已经连续三个月下滑,而且功能相似的聊天机器人应用仍层出不穷,在大多数用户的习惯养成前,无法断言哪个大模型会是最后的赢家。
把视野再放大一些的话,聊天机器人可能并不是大模型的终极应用,更像是一个启蒙产品。
比如华为已经将大模型和语音助手小艺融合,不排除越来越多的智能手机、智能音箱、智能家居类厂商有同样的计划,语音助手逐渐成为人们唤醒大模型的主流方式;再比如一些人鼓吹的Agent,即可以能自主理解、规划决策、执行复杂任务的智能体,自动帮主人处理一些繁琐的流程性工作。
无论是哪一种情况,都意味着插件不过是一种过渡,用户需要的只是连接某个服务,不需要知道服务来自哪个插件。先调用某个插件才能获得某项能力的交互,注定是大模型初级阶段的产物。
02 垂直大模型是金矿吗?
事实似乎也是如此。不管是ChatGPT还是同类产品,插件的主要贡献者集中在独立开发者和人数较少的小团队,那些手握上千万用户和海量数据的产品,好像对插件背后的机会窗口不太感兴趣。
毕竟插件生态的主导者是通用大模型,插件的作用可以归类为AI+的范畴,目的是为了扩展大模型的多元能力。借用百度集团资深副总裁何俊杰的观点:“如果说大模型是一颗聪明的大脑,那么插件就是大模型的手和脚。”
典型的例子就是文档处理类的插件,调用大模型的能力对用户的文档进行处理,再基于文档完成摘要、问答、创作等任务。插件扮演的终归是工具的角色,而工具类产品的宿命普遍不太乐观:风口期收获了大把的流量,但大多数工具没能走通变现的路子,风口过后还要买流量来维持增长。
有野心的开发者不甘心做插件,做通用大模型的“寄生品”,瞄准了更有吸引力的选择:
一种是基于大模型的能力开发独立应用,或为自己的应用接入大模型厂商的API,进而提升产品的服务能力;另一种是在通用大模型或开源大模型的基础上,训练适用于垂直场景的模型。据说北京市已经有115个AI大模型,其中垂直大模型占到了103个。
前者的挑战在于,目前的产品主要集中在对话型、绘画类产品上,且以To C场景为主。只不过C端用户仍以闲聊、娱乐为主,尚未产生实实在在的生产力,导致付费意愿通常比较低。同时还存在产品同质化的现象,以闲聊类产品为例,早期的产品普遍基于公开语料,假如用户的提问难以产生有价值的数据,差异化也就无从谈起。
To B渐渐成了行业内心照不宣的选项。
大模型的能力听起来很美好,大多数企业却用不起来,原因在于通用大模型无法很好地解决垂类问题。对于B端企业来说,可以将自己服务行业的专业知识灌输给大模型做进一步的训练与微调,训练完后在本地进行私有部署,再来解决对应垂类问题。
这就为垂直大模型提供了充足的想象空间,也是创业者扎堆的赛道。B端企业的场景比较明确,并且积累了海量的数据,既能为大模型训练提供数据,还提供了大模型效果的检验场。
相对不那么乐观的是,现阶段愿意为大模型付费的,还只有金融为首的个别场景,不少行业还在观望中。以金融大模型为例,目前发布了金融大模型的企业有蚂蚁集团、Bloomberg、MorganStanley、Lemonade、苏黎世保险、度小满、瑞穗金融集团等,要么手握海量金融数据,要么有自研大模型的背景,都不是靠一腔热血闯进市场的创业者。
简而言之,大模型的想象空间越大,想要从中寻找机会的企业就越多,留给创业者的机会窗口并没有太多。况且还有一个无法规避的问题:在和大厂同台竞争的过程中,创业者有资本试错吗?通往大模型的远方有千万条路,也意味着会有千万个死胡同。
03 创业者“无法承受之痛”
首当其冲的正是合规问题。国内在7月初出台了大模型备案要求,依靠API接口获取境外大模型能力的模式受到挑战,导致年初时就接入OpenAI做应用的团队,在不同程度上陷入了困境。
比如某在线设计平台,曾是国内最早推出AI生图的产品之一,并围绕AI生图搭建了社区生态。但在9月初的时候,这家平台突然宣布“网站维护”,一直到一个多月后,依然是“网站升级中”的状态。而在每天都有新事物出现的大模型行业,早期的先发优势正不可避免地随着时间消亡。
和过往几次“风口”最大的不同,在大模型的曙光面前,创业者很兴奋,监管却很理性,为了避免大模型市场重蹈野蛮生长的局面,避免大模型走向失控,相关政策和法规密集出台。
就在不久前,科技部、工信部、教育部等10部门联合印发《科技伦理审查办法(试行)》,明确提到:算法、模型和系统的设计、实现、应用等遵守公平、公正、透明、可靠、可控等原则,符合国家有关要求,伦理风险评估审核和应急处置方案合理,用户权益保护措施全面得当等。
几乎在同一时间,全国信息安全标准化技术委员会发布了《生成式人工智能服务安全基本要求》(征求意见稿),涉及语料安全、模型安全、安全措施、安全评估等多个方面。
其中在语料安全要求中,不仅明确提出语料可溯源,包括开源语料和自采语料,还提出要建立语料来源黑名单,不使用黑名单来源的数据进行训练。“应对各来源语料进行安全评估,单一来源语料内容中含违法不良信息超过5%的,应将该来源加入黑名单。”
也就是说,在监管趋严的背景下,等待开发者的不单单是备案问题,而是系统性的合规要求。无论是调用大模型API做创新的应用层开发者,还是想在垂直领域分一杯羹的垂类大模型,“蒙眼狂奔”的选项已经消失,必须要谨慎应对潜在的合规和安全风险。
如果开发者基于某个不合规的通用大模型训练产品,为了满足合规需求而切换大模型的话,需要重新处理数据,因为不同大模型的训练数据不同,开发者需要重新对数据进行清洗、预处理和标注;需要基于新模型训练和调优,包括训练算法、超参数,以及反复的实验和调整;在模型部署和应用过程中,还要考虑不同的部署平台和框架……
垂直大模型大发展需要应对的潜在风险更多。就像《生成式人工智能服务安全基本要求》中提到的,预训练、优化训练等环节的输入端数据均纳入“训练语料”的范畴,过去靠采集境外数据进行训练的方案已经行不通,势必要花更多的精力进行数据采集、清洗、标注。数据影响着大模型的“智商”,同时也左右着垂直大模型的生死。
相比于巨头们充沛的资源,大模型创业者面临的挑战将越来越多,现阶段是合规,下阶段可能就是盈利了。
04 写在最后
用一句话形容大模型时代的创业者:表面上鲜花着锦,实际上烈火烹油,从抢跑到碰壁,不过才半年时间。
也许大模型时代不缺少机会,但每一条赛道都不会是康庄大道,不缺少冲出一家家独角兽的机会,比例上注定是九死一生。结果大概率和一次次淘金热一样,淘到金子的人寥寥无几,卖水人悄悄发了财。
A5创业网 版权所有