文章来源
5 月 25 日,一年一度的百度万象大会在广州开幕。
百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰在会上全面介绍、解读了百度移动生态的诸多新变化。他提到,百度将基于大模型技术,培养 AI 原生应用的思维方式和理念,重构移动生态的每一个产品,在新的时代中建立新生态。
在大会上包括“AI 伙伴”以及百度 App 新首页“一人一世界”等产品依次登场。
产品更新不仅带来新体验,而且 AI 原生应用的出现,预示着人工智能将重构移动时代的所有产品,例如百度搜索、百度 App、百家号、好看视频等产品以及正在研发尚未“露脸”的 AI 原生新应用“New App”。
由于这次大会百度在创作者端和用户端皆有不少更新,在内部沟通会上,何俊杰半打趣地说,一年一次的大会甚至都赶不上技术迭代的速度。
诚如他在万象大会上所言,大模型是在让 AI 变“大”,那么移动生态这一次重构,就是要致力于让 AI 变小,变得更具体,让它真正变得人人可用。
AI 重构移动生态
国民级应用屈指可数,而连续保持正增长的应用并不多,其中百度 App 连续数个季度都保持了强劲的增长动能。
财报显示,截至 2023 年第一季度,百度 App 月活已达到 6.57 亿,同比增长 4%。
如今,用户打开百度不再只是简单的“搜素”那么简单,综合来看包括了看、搜、听、问、购,这也构成了百度 App 的五个核心场景。事实上,正是靠着核心场景持续突破,百度 App 才能在互联网早已见顶的情况,依然保持了高位增长。
“看”是所有场景中增长最快的一部分。
百度 AI 对于创作者提供大量新工具和内容扶持,明显提升了平台在优质内容上的供给能力,加之全场景互通,用户在任何场景下皆可进入沉浸式体验,从而使得供、需两端同步增长。去年全年,百度 App 视频用户数增长了 31%,直播用户的增长更是超过 2 倍。
大模型提升了视频推荐的体验,百度 App 如今能够结合海量用户、多场景、跨时空的行为信号,加强对用户内容兴趣与关系的理解,从而更准确地推荐。
任何国民级应用都需要面临一个巨大挑战:如何适应千人千面的需求。为了适应更广泛的人群,特别是手机使用能力较差的人群,如老人,百度 App 作了字体与视频视窗大小、滑动方式等智能化设计。
此外,大图首页、视频首页、小说首页等多种可定制选项,在内容千人千面之后,如今百度还能够提供更深层次的定制服务。
“语义检索技术 + 大语言模型”双重能力迭代下,搜推融合将能够更准确、快速地响应用户需求,而且对于用户搜索心智的洞察,百度搜索能后进一步满足用户潜在需求,从而实现一次搜索,长期满足。
不同于“看”,一天中还有晨起洗漱、驾驶通勤、户外运动等许多需要“听”的场景,音频内容有着无可替代的优势。今年百度 App 在“听”方面做了大幅升级,图文、视频等形式的内容都能以音频方式呈现。截至目前,百度 App 用户的人均播报时长已经增长 25%。
人们早已习惯使用百度搜索解决问题,然而搜索并不能解决所有问题,比如用户在百度检索法律、医疗、生活等领域问题时,很难从全网搜索中找到适合自己的答案。这时,百度“问一问”则承接了那些搜索无法覆盖的需求。
依托于百度沉淀的知识垂类和专业领域创作者,使得百度 App 能为用户高效连接到“解决问题的人”,提供一对一的实时线上咨询服务。以法律咨询为例,百度 App 已经成为用户规模最大的法律咨询服务平台,平台上法律问答内容已经突破 8000 万条,每天有 2000 万用户访问,更有多达 2 万的职业认证律师入驻问一问提供服务。
高效的响应使得“问”相关的数据有了大幅增长。据了解,百度 App 每天通过平台发起的咨询量超过 500 万次,年同比增加 155%;过去一年,付费咨询次数超过 2 亿次。
看、搜、听、问四个核心场景满足需求的同时,有相当一部分还存在“购”的情况,比如浏览视频与观看直播时顺手下单一件好看的衣服,在搜索目的地时下单旅游服务等,内容所触发的带货订单数量取得了明显增长。
何俊杰提到,“百度对于电商有自己的理解,态度上会更开放。”过去一年,百度电商的总 GMV 同比增长 152%,月交易用户数增长 100%,复购率增长 25%,入驻百度电商的商家数增长 53%,这既表明百度强化五个核心场景具有叠加效应,同时我们也看到“搜推逛”一体化智能电商的潜能。
需要指出,用户在百度电商的购物心智有着较高的复购和忠诚度,目前有不少商家愿意把百度作为一个经营阵地。
相比于移动生态上经 AI 重构后的势能,更有趣的是万象大会上百度所披露的未来。
为何必须 AI 原生?
百度在万象大会上提到的未来,是基于文心一言能力打造的 AI 原生应用“New App”。
基于大模型能力或是新应用都不新鲜,新鲜的是 AI 原生。如今主流的移动互联网生态,AI 类应用分化出两条落地路径,一是基于移动互联网时代已然成熟的操作系统及 API 构建,二是摸索 AI 原生道路。
两条路径的优劣之分明显,第一条显然是相对更轻松的道路,也就是将 AI 产品接入移动应用的 API 接口,用户“借道”以访问 AI 应用及其功能,而第二条则困难许多,尤其是在如今尚未对 AI 原生有明确定义的情况下。
例如,就算某个应用宣称其是“AI 原生”,但为了触达用户,其载体大概率仍是我们所熟知的操作系统,无论是 Windows、iOS 亦或是 Android。
但这并不是我们放弃对真正 AI 原生进行探索的理由。
可以参考新能源车的案例,在新能源车产业中,存在这么一个看着有些“不伦不类”的品类,并非是为了在新能源性能未能满足多样的出行需求时诞生的油电混动,而是传统车企入局新能源时所采取的“油改电”。
其根本目的在于顺应趋势下的成本控制,而未经新能源专属设计而导致的续航、安全性、车辆性能等方面弊端不少,在如今的中国市场中正在被逐步淘汰。
AI 应用中也有响当当的相似案例——搭载了 ChatGPT 的 new bing。
其成色经过全球友人多日的使用也暴露无遗,其中最为诟病的是 new bing 受限于搜索引擎逻辑。由于需要承担搜索生成的内容存在潜在法律风险的问题,new bing 交互生成的内容往往是在一定内容过滤机制下,通过搜索整合而成,或是直接摘录网页上的现成信息并附上链接,这是典型的二维平面的点对点逻辑。
在交互性上,new bing 不支持多轮对话,也无法和 ChatGPT 一样进行人工“驯化”的过程。至于 ChatGPT 开放的 API 和 plugin,在 new bing 上更是天方夜谭。
如果百度以移动时代的产品形态为基础做 AI 应用,即使忽略微软自封测后可能限制了 new bing 性能,新应用的市场反馈也大概率如 new bing 一般。更值得深究的是搜索引擎的盈利模式主要是广告,AI 接入后的个性化生成内容天然与广告业务存在冲突,这也是两年前谷歌在发现 GPT 应用时未像 OpenAI 一般全力跟进的原因之一。
看来,AI 原生已经是百度必须推进的路线,但要做 AI 原生,百度也不得不考虑触达与易用性问题。例如目前市场反响良好的 AI 原生应用 Midjourney,其垫图、prompt、SEED 参数等工作流门槛阻碍了 C 端的增长。
对此,李彦宏早在 1 月 10 日的 2022 百度 Create 大会上便给出了解法,通过百度在芯片层、框架层、模型层和应用层的全栈布局,自上而下,通过技术积累来解决通用性问题。有别于移动时代的芯片层、操作系统层与应用层的三层布局,新的四层架构中最重要的是框架层,即 AI 大模型赖以开展训练的深度学习框架。
根据 GitHub 前 CEO Nat Friedman 为在世界范围内构建 AI 原生的产品矩阵所创立的 AI Grant 基金会对基于大模型的 AI-native (AI 原生)产品的预期,大模型生成的内容往往处于古怪与奇幻之间,因此在产品设计上需要模型“不犯错误”并且减少因模型错误生成而造成的用户流失成本,而深度学习框架的构建便是通往这个解决方案的途径。
李彦宏在 2023“百度骄傲”颁奖礼上表示,文心一言内测一个多月便 4 次大的技术升级,推理性能提高近 10 倍。推理能力在应用层的具现化即是语义理解能力,这意味着 AI 应用不再需要过多的工作流来获取可用的内容。
深度学习框架有助于 AI 深化语义理解能力,在百度试图发力的搜索领域,这一方面减少类似 Midjourney 应用的工作流门槛;另一方面也帮助搜索这一功能的迭代——从二维点对点的搜索变成基于语义理解的三维搜索,让互联搜索做到类似向量检索工具 vearch 的效果。
如今的百度 App 能告诉我们“谁是莎士比亚”,而百度的 New App 要做到的是“像莎士比亚一样说话”。因此,百度必须做“纯电”,重做 App 的路径只能走 AI 原生的道路。
AI for everyone
AI 应用的落地方向足够多,给予我们充分想象空间的同时也带来了选择困难症。
据 AI Grant 基金会给出的 AI-native 应用方向,仅现有的方向中便存在私人助理、AI 社交、创意工作、UI 生成、chatbot、mturk/upwork、AI 搜索等。New App 是哪一种?
根据百度万象大会上的 New App demo 演示,其功能至少包含了私人助理、chatbot 与 AI 搜索三项功能。New App 在演示中以演员黄景瑜的声音与演示人交互并在原有的日程安排下重新规划日程,还在交互中识别了“再给我两根葱,让我把鲫鱼煎成饼”的空耳歌词,为周杰伦做了一次曝光。New App 的隐藏功能是打造“数字分身”,可以根据语音生成任何形象,像大热电影《流浪地球 2》中的涂丫丫一样,作为虚拟的生命长期存在和陪伴。
诚然,演示内容受到时间局限,并未能向我们展示太多,但相比下来,“私人助理”一项功能却蕴藏了很多可能。日程规划仅仅是最基本的应用,更深入的还有数据处理、文本撰写与检索等。更通俗点说,就是 AI 秘书。
这需要的不仅仅是 AI 快速检索语料库并生成内容的能力,更需要的是 AI 落地到个人,在交互中逐渐熟悉个人并根据个人的工作、生活、情绪等特点,将个人从繁杂事务中解放的能力。
New App 可能跟以前的应用已经不是一个时代的产品了。它不是原有搜索 App 的升级,这就是完全两个不同的时代,New App 完全代表的是一种新的时代。“我们希望它正式推出来的时候,能让大家眼前一亮的,而不是一个简单的优化、升级、迭代。当你打开它的一瞬间,用户能感受到一个新的时代到来了,这是我们最想要实现的目标。”李小婉说。
从万象大会的故事中,百度 App 到 New App 的嬗变是自移动时代的搜索向 AI 时代的个人解放,从点对点的单点反馈中到点对面。人不必再去主动适应搜索框,而是要让搜索适应于人。
只是,如果要保障模型精度以及 AI 的学习记忆,考验的是算力及芯片储备。New App 面向个人使用者开放的 API 是中小模型还是文心一言我们尚不清楚,但毫无疑问,对于面向海量 C 端用户的 New App 而言,从 demo 到落地的路程将远远大于 ChatGPT 3.5 到 ChatGPT plugin。
这个时代我们见证了太多有着革命性的新想法诞生,例如 New App 的出现,预示着产品有了回归本原的可能——应用本质上是为人服务的。尽管“人本”概念在既往的技术创新中屡被提起,但受限于时代,无论是技术还是盈利模式,其发展路径中与人性的冲突与迎合在矛盾对立中持续存在。
李彦宏曾说,我们要有意识地培养 AI 原生应用的思维方式和理念,需要我们用新的理念去重构我们现在的每一个产品,每一个业务。
例如 AI 是否会真的抢走我们的工作?回顾历次工业革命,虽然新的生产方式诞生淘汰了一部分人,但也造就了基于该生产方式的岗位并成就了另一部分人。AI 大模型带给我们的是“反向图灵测试”,是对创造力的解放而非扼杀。
AI 原生是否能真正解决技术是否真正服务于人的问题还有待考证,以应用形式来触达用户也未能让 AI 摆脱移动设备的限制。但可以肯定的是,无论是开发者、经营者亦或是使用者都需要重新构建 AI 原生的思维模式,这折射出整个移动互联网的一次转折。
百度万象大会作为转折的一个契机,我们看到百度 App 作为超级 App 之一,以 AI 大模型为基础拓宽场景与使用空间,打响了 AI 时代“应用回归人本”的第一枪。