自去年起,大模型世界可以说是风起云涌,不断有大模型升级和涌现如果说 2023 年,AI 大模型给所有人都带来了一种前所未有的震撼,那么到了 2024 年,AI 大模型竞争的核心焦点已经转移到了落地的应用上。
作为国内最早推出通用大模型的公司,百度在去年 3 月就发布了国内第一个大模型——文心大模型 3.5,并推出了以此为基础的文心一言 App今天,百度文心一言 App 再次迎来升级全新 4.0.0 版本下,文心一言升级为 " 文小言 ",App 将提供问问题、陪聊天、写文章、画图片和下任务五大核心场景能力。
同时,所有用户都可以免费使用文心 4.0 大模型,有效期为整个 9 月份图源:文小言文心 4.0 上线初期,雷科技就做了上手体验,当时评价是足够让人眼前一亮了特别是在 AI 搜索方面,不仅在中文语义理解又有了一定的提升,在逻辑推理、知识问答方面也更多避免了大模型 " 幻觉 " 的出现。
可以说,文心 4.0 在综合能力上确实与 GPT-4 不分上下在 2024 百度万象大会上,百度副总裁、AI 创新业务负责人薛苏表示过去一年,用户在文心一言 App 上进行了超过 14.3 亿次的调用,其中调用最频繁的功能就是问答,这也是其最核心的能力:AI 搜索。
搜索是百度的老本行了,在用户心智上,百度之于中国人如同搜索,谷歌对海外用户而言也早已成为搜索的同义词,这使得其他竞争对手很难在传统搜索时代对百度形成威胁而以 ChatGPT 为代表,生成式 AI 被无数人和公司视为颠覆和改变搜索引擎的关键,从巨头到新创,几乎都在引入生成式 AI。
按百度、谷歌等公司的定义来看,目前大多数支持联网检索数据的 AI 大模型都可以算是 "AI 搜索 ",只不过受限于搜索引擎的数据来源和 AI 大模型的数据规模,给出的回答质量参差不齐图源:OpenAI目前 AI 搜索赛道已云集 Google、百度、OpenAI、字节跳动、腾讯、360、天工 AI、秘塔 AI 搜索等玩家。
支持多模态输入、具备多步骤推理能力、能够处理带有多种限制条件的长提问,这些已经成为 AI 搜索产品的标配功能,信息集成能力进一步提升更重要的是,AI 搜索几乎杜绝了过去充斥广告和内容农场的问题,用户不必再从广告堆里翻答案。
当然,AI 扭转用户心智,颠覆搜索引擎市场的前提是:回答足够可靠所以雷科技也很好奇,全新的文小言 App 在 AI 搜索上到底有多少进步?对比其他具备 AI 搜索功能的产品区别在哪?带着以上问题,雷科技将文小言与其他 AI 搜索产品进行了一番 PK,看看现阶段 AI 搜索到底表现如何。
相比传统搜索,AI 搜索最大的特点是用户开始可以像日常聊天一样询问机器,寻找信息和答案面对涉及确切地点或复杂要求的提问时,最能考验 AI 搜索能力于是,雷科技以 " 坐地铁到某地 " 为要求,向各个 AI 发起提问,并得到了以下回答:。
从左到右依次为:文小言 / 通义 / 天工 AI图源:雷科技制作从不同 AI 搜索的回答中,我们可以很简单的看出各个 AI 搜索产品的区别虽然所有产品都能准确识别出正佳广场的地理位置,并给出正确的乘坐地铁方案,但文小言通过调用百度地图插件,直接给出了基于用户当前位置的各种交通路线,包含公交、地铁、驾车、步行。
而阿里通义、天工 AI、秘塔 AI 搜索、360 AI 搜索等 AI 搜索产品均未能识别用户当前位置,提供回答都是基于互联网的常规答案不过也可以理解,要想实现文小言这样的场景功能无缝衔接,必须得有地图插件的支持,个人目前只在文小言和支付宝智能助理上看到过类似的功能。
同理,AI 搜索产品想要从搜索界面直接提供交通、餐饮等生活服务,一样需要生态支持,门槛确实有点高,并不是所有 AI 搜索产品都能做到一旦实现,用户体验将得到极大提升雷科技继续发起 " 寻找附近美食 " 的提问,文小言直接甩出了一串西餐厅,不仅有对应评分,点开卡片还能看到路线、评论等信息。
与之相比,阿里通义的回答稍显逊色,回答中提及信息分别来自于 2020 年和 2021 年尽管 AI 提醒信息可能过时,但这显然不是用户想要的答案文小言 / 图源:雷科技制作其他几个 AI 搜索产品的回答中规中矩,除了在西餐厅中混入咖啡厅外,基本没有出现大的错误。
雷科技用地图软件进行搜索,所有餐厅地点均在设定地点附近,范围不超过 5 公里这或许也是 AI 搜索的潜在发展方向之一,雷科技在文小言身上看到了一个以 AI 搜索为中枢,连接各种生活场景和服务的 AI 生态雏形。
潜力归潜力,目前在实际体验方面,文小言还有不小的优化空间比如涉及到多个关键词的大段自然语义提问,AI 会出现识别不全的情况作为基于 AI 大模型打造的 AI 搜索,这表现显然不够智能,并不是说它没有完成的能力,只是还需要根据用户需求做进一步的信息筛选与推荐。
作为用户,雷科技对 AI 搜索的期望远不止单一的搜索引擎,而是能与 AI 助手结合,能在不断交互中逐渐熟悉用户,有记忆能力,有个性化服务能力,将用户从繁杂 App 中解放出来我们在前面说到过,谷歌、百度、腾讯、OpenAI 等企业都在推动 AI 搜索发展。
从产品角度来看,市面上 AI 搜索产品大致可分为两类一是专门的 AI 搜索引擎,只提供 AI 搜索功能,比如 360AI 搜索、秘塔 AI 搜索、谷歌 AI Overviews 等;另一类则是复合型 AI 助手,集成了 AI 搜索、AI 生成、智能体等 AI 功能。
里面有一开始就定位 AI 助手的文小言、腾讯元宝、Kimi 等,也有一开始只做 AI 搜索,后面加入了其他 AI 功能的天工 AI要回答标题的问题,我们得先确认搜索应该出现在什么场景中大伙平常遇到问题会去哪里寻找答案,是搜索引擎,还是抖音、小红书、微信等平台?答案必然不会统一。
但我想说的是,移动互联网发展至今,用户获取答案的渠道不再局限于的搜索引擎比如小红书官方透露,有 60% 的日活用户每天都会在平台主动搜索,日均搜索查询量接近 3 亿次图源:百度从长远来看,产品只具备单一搜索功能或许很难吸引用户留存,这意味着用户需要在本就繁杂的应用海中再添一个。
个人认为最理想化的手机环境应该是尽可能少的应用解决尽可能多的需求,而文小言以 AI 搜索为核心组建的多模态全能 AI 产品路线,恰恰符合这一趋势就目前来看,百度对于文小言的产品方向是可行的改名文小言也只是为了更亲近用户,更好地面对接下来的 AI 搜索竞争。
但其面临的最大挑战是如何平衡功能的宽度与深度,究竟是新增功能数量为先,还是优先深挖 AI 搜索等功能的实际表现,这或许是百度接下来需要考虑的地方此外,文心 4.0 大模型免费使用一个月相信能给文小言带来不少新用户。
大伙使用时需要注意 AI 默认使用 4.0 Turbo 模型,不同模型会给使用带来不一样的体验,可以按需切换9 月 6 日 -10 日,IFA(柏林国际电子消费品展)2024 盛大开幕联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、绿联、Insta360 ( 影石 ) 、大疆、徕芬等中国科技巨头云集柏林,即将在世界舞台上发布新品秀肌肉。
雷科技 IFA 2024 报道团前往现场探展,进行全程追踪报道,敬请关注查看原文