出品|网易科技《态度AGI》栏目
作者|崔玉贤
编辑|丁广胜
在通往AGI的路上,需要超级模型+超级应用双轮驱动。2024年5月22日,成立一年多的百川智能发布了最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小应”。
百川智能创始人、CEO 王小川表示,模型技术变化很快。Baichuan4相比Baichuan3能力提升,Baichuan 4在SuperCLUE里理科目前排国内第一,文科明显有更大的优势,处于全球最好的位置。
百小应是百川智能推出的首款应用,定位AI助手。相比其他助手,百小应不是只在原来语音交互或图片识别、语音播报领域有进步,王小川认为百川智能提出了更为重要的概念:懂搜索,会提问。不过,王小川也坦言,这次发布的应用距离超级应用还是有段距离的。
对于日前火热的大模型价格战,王小川表示这是大厂的射程范围,是仅限于云厂商的动作,创业公司就不跟着凑热闹了。
“我觉得,首先大家实在太看好这个时代的前景了,不愿意失去任何机会,宁愿0价格也要卷进来入场。这侧面反映了大家对AI时代有足够的憧憬。另外,降价是仅限于云服务厂商的动作,对于创业公司而言,已经走出了射程。”
王小川表示,百川智能不会掺和到价格战当中,因为To B不是公司的主要商业模式。
以下为网易科技等媒体对话百川智能创始人、CEO 王小川部分内容(经整理):
1、超级应用:解决用户痛点 考虑收入还为时尚早
提问:现在其实市面上应用已经蛮多了,尤其很多大厂有的去年就发出来的,你们现在发,会不会有点晚了?
王小川:我正好觉得相反,发早了。大家发应用的时候,今天在模型应用里面还需要更多时间的打磨。
市场出来一个模型,如果说今天是一个百万级的DAU,其实远远够不上一个超级应用。我认为大家之前发的各种应用只是模型的展现,我们认为对我们来讲有足够的经验,像之前做输入法、搜索引擎、浏览器,我们深刻知道一个应用到什么度才能变成一个被广泛使用的产品,现在各家都没到。
我认为这次发布的“百小应”离我们心中要的形象还有距离,但是在这个行业中,我们也需要有一个机会把它发上去,让行业端有基础的了解,也能让团队转起来。这是第一个问题我的回答,不是我们早不早的问题,是整个行业都还没有到成熟的状态。
提问:超级应用的预期?
王小川:刚才进来第一句话说未来叫超级模型加超级应用,现在既不是超级模型,也不是超级应用。如果顺利的话在今年内会有大的升级变化,如果到超级应用的时候我认为使用人数在刚需满足,再到人数上应该还会有几个数量级的提升,这两个数量的提升,我认为不光是我们自己,而是行业今天各家的情况,从超级应用角度考虑,现在都没有到,但是我们自己心中有这个画面感,尤其经过从去年4月份工作到今年5月份这一年的时间,团队本身有足够的手感,本来之前做语言AI,也做过超级应用,这次对未来长什么样子有一个期盼。
发了这个模型之后,节奏感上,可以真正走向“双轮驱动”的模式,朝前迈进的时候会有里程碑,总得有这个“1”迈出去,使大家已经有经验和今天在试水中,能把两种信息都融汇在一起,能使这个团队走得更健康一些。
提问:刚才提到超级应用,提到100万DAU这个数据,是不是这个能定义为超级应用?
王小川:不是,我觉得超级应用应该还得再提升两个数量级才叫超级应用。这两个数量级从100万变成1亿,如果上浮下浮3.3倍,总得到三千万到三亿之间我觉得这个叫做超级应用。
提问:现在有吗?
王小川:现在100万大家就觉得挺嗨的,肯定是没有。
提问:超级应用的突破点?
王小川:我觉得超级应用首先它能突破的点是在职业里面,把这个职业里的数据密度,把职业里的思维度加进去。今天我们做了一些基本功课,我们看到能访问能搜索,在做一些组件级的工作,如果多讲的话,会知道我们的方向在哪个里面。
提问:“百小应”有没有更具体的场景,我们会有一些针对性的场景吗?
王小川:今天大家用起来,往职场打这个也不是一个新概念,GPT发布的时候发现工作日白天的东西会多很多,所以白天使用会多。但我认为在今天这个阶段里面往行业里打,下一个阶段是作为职业角色,再往下走需要多个职业角色每个角色覆盖更多的场景,今天不是服务场景就完了,服务直接场景这件事情在我看来是没有任何信息量的一句话。因此今天大家用起来之后,我们认为自然而然职业场景就会变多。刚才举的例子,一个是职业场景会用到,再往下我还是认为未来是在,我刚才提的三个词:创造、健康快乐,因此我们认为创造这件事情跟职场里你的工作可能相关,往健康快乐走我觉得这是更大的应用方向。
提问:关于今天发布“百小应”的商业化的问题,现在市面上已有的产品,像ChatGPT、文心一言都有收费版本,“百小应”用的是哪个模型,会不会未来走类似的商业化变现路径?
王小川:不仅有其他的考虑,而且提的两个都不在我们考虑当中。包括您刚才提到的文心一言,我觉得它还没有百度的文库收入多,我写个东西卖给你这个收入会多很多。今天API收入和模型本身的收入,都不叫成功实践,不是我们要追赶和类比的情况,我们认为这两个东西今天不是最性感的商业模式。文心一言也好,ChatGPT也好,都不是。
提问:在您看来最性感的商业模式是什么?
王小川:你有超级应用,解决用户的痛点,收入来讲,我持毫无疑问乐观的状态,但现在就收钱这件事情好像意义确实不大。
提问:刚才聊了很多关于超级应用的东西,您觉得ChatGPT算超级应用吗?
王小川:我觉得还不到。
提问:你觉得鸿沟是什么?
王小川:我觉得ChatGPT如果OpenAI足够用心,超级应用它能做,以它现在的技术是有机会的,但是由于这个公司自己的基因,没有往产品方向投入太多精力。
2、大模型价格战:百川智能不跟进
提问:怎么看巨头的大降价,这个场景在之前的商战中熟悉吗,百川怎么应对?
王小川:我帮他们想一下,大家实在太看好这个时代的前景,不愿意失去任何机会,宁愿0价格也要进来入场,我觉得侧面反映了大家对这个时代AI能力有足够的憧憬。
第二降价我认为核心要看你的商业模式是什么,如果你是做ToB服务的时候,你降价最后卖的不是模型本身,卖的是整套云服务,所以云厂商是比较偏传统的服务模式,进到一个新的战场。所以降价仅限于云服务厂商的动作。这个事情也挺熟的,像之前四小龙做ToB的时候大家也变成这样,有限场景打价格战,实际上对创业公司而言,已经走出他们的射程。今天大家为什么会特别重视降价,对这个比较敏感,在我们来看不是参与价格战,而是不把这样一种商业模式当成你的重点位置,如果商业模式建立的是API公开的服务理念,这样情况下,这不是一个创业公司本身该干的,也不在我们双轮驱动的理念里。
所以第一,我认为这个降价大家太看好未来。第二,确实很熟悉。我认为这波降价跟之前的滴滴美团还不一样,因为那会儿的价格战或补贴背后带有网络效应,是双边的网络,那个商业模式在改变生产关系,司机和乘客的关系,外卖员和用户之间的关系。所以那个是建立双边网络效应,而这次降价是B端更像四小龙的降价方法,而不是像滴滴美团这样的价格竞争,我觉得这并不像C端,这次不是生产关系改变,而是直接做生产力供给,将AI直接供给生产力.
我觉得这件事情对我们而言,就是别掺和进去。
提问:B端开发者通过降价之后的通用大模型去开发一些新的应用,在应用端的竞争会有明显的加剧吗?
王小川:现在两个公司都不能这么去竞争。一个是别在大厂射程范围内。第二个是,在今天这个情况下,大家快速地想拿这个模型去赚钱,会有些小的应用会起来,但是不在我们主要的方向里,我们现在并不要跟这些更小的创业公司做竞争,各有各的生态位,因为他们也不是做超级应用,他们可能想做某个垂直行业的小应用。
吃瓜看热闹,跟大家的心境是一样的。
提问:刚才川总提到未来百川新的模型发布节奏延长到每个季度,在百川看来无论是国内还是国外的公司,大模型技术方面是否遇到更大的挑战或瓶颈,前沿的探索是不是变得更难了?
王小川:我们去年提了一个概念,理想慢一步,落地快三步,这是针对美国的提法。其实在模型探索当中,从0到1的突破,美国从资金的储备也好,还有他们科学家的文化也好,是比国内会强很多。所以在探索的道路里确实成本会很高,可以简单讲,每一次重大的技术突破都是美国引领的,因此在这里面他们做到了,我们再去跟,在模型上有GPT4、GPT4o的发明之后我们再去跟,能使得我们能大大降低国内成本的投入,这样能把精力更多放到往下怎么能把用户端做好。所以在国内的区别是要需要做平衡。
我的基本判断,用同一代模型,百川更有机会把超级应用做出来,如果模型跨代这是一回事,但是同一代模型里面是我们的竞争优势。我们之前已经选择了自己的赛道,下次可能会讲一点如何能从今天的模型里面就能够更接近这样的超级应用,在模型有一定提升之后才能做出来,所以我们有自己应用端的储备,这是我认为跟在美国背后从应用上往前走的中国的做法。
模型的瓶颈,我听到的说法,至少在我心里Sora和GPT4o不代表最大的突破,传说中的GPT5也许在美国听到有一些delay的东西,但是到年底才能看得出来。
提问:您又提到相比于多模态可能百川更关注于文本能力。
王小川:我觉得更多是智力本身,我的意思是多模态没有智力。
提问:如果长文本卷到无限长以后,还有什么方向可以发展?
王小川:还有推理能力,做数学题,或者它中间能有更多的思考,今天的模型自洽性都不够,模型思考的严谨性,有足够好的逻辑,都是更加重要的事。我倒不觉得模型长是它唯一的事情,现在国内也知道模型长文本很重要,但是它只是做大的必要条件,也不是充分条件。在充分条件里面我认为模型本身往下更要强调内在的自洽性和它的推理能力,这两件事情并不是靠长窗口去解决的。