当前位置: 万象 >> 万象景点 >> AI与搜索的双螺旋取之于搜索,用之于搜索
“搜索是AI规模最大的应用场景”,在日前举办的WISE新经济之王大会上,百度集团资深副总裁、百度移动生态事业群组(MEG)总经理何俊杰表示,目前,百度搜索、百度APP是AI规模最大的应用场景,随着AI预训练大模型、AIGC、数字人等新技术的规模化落地,其AI带来的创新优势将更加凸显。
近十年来,AI与搜索结合得愈发紧密,AI从搜索获取数据和反馈不断进化,反过来也在大幅提升搜索的智能化水准,两者形成类似于DNA的“双螺旋”结构,可谓取之于搜索也用之于搜索。
当AI技术渗透到千行百业的传统产业时,它在互联网业务上也一直在持续落地,搜索引擎就是最重点的一个场景,也可以说是目前应用最早、最广、最深的场景。
搜索引擎进入AI大模型时代
作为最广泛的基础互联网应用,搜索一直伴随用户左右,也正因为此,它日积月累的进化很难被用户感知。不过,如果将时间线拉长,人们将很容易感受到这样的变化。把同一个关键词键入搜索引擎,今天的搜索结果和10年前的已大不一样。
10年前PC时代的搜索引擎长什么样?联想一下我们用得最多的百度:简洁的白色页面有一个搜索框,键入关键词后,就会得到一个网页列表,而决定用户体验的只有一个因素:结果是否足够多,排序是否足够准。彼时的搜索引擎背后的原理也相对简单:爬虫服务器持续爬取海量网页内容形成“关键词-结果页”的索引数据库,搜索引擎收到请求后拆解关键词再到索引数据库查找答案,根据算法对结果进行筛选、排序,最后给出用户看到的搜索结果页。
不过,今天在人们普遍使用的百度App,搜索结果页已不再是简单的网页列表,而是个性化、智能化的聚合内容,比如搜索“马云”,聚合页除了马云的百科、新闻,还有相关的互联网大佬,马云演讲视频等等;再比如搜“天气”,我可以看到身处地广州的天气组件,以及科普、天气小程序等等。
除了搜索结果页面更个性化外,搜索也更能理解用户的问题了。
用户可以像问身边朋友一样用口语提问,比如“韩国有部电影野兽轮船在空中飘着叫什么名字”,搜索引擎可基于深度语义理解问题并匹配答案。
用户可以直接搜索导购这样的服务,比如问“智能锁哪个品牌好”,结果中就是品牌榜单。
搜索还能理解视频内容,基于AI可智能节选视频中能够回答搜索问题的片段。比如当用户问“扬子鳄多长”时,就能得到更直观的视频内容。
今天用户使用百度App已不再需要任何“专业搜索技巧”就能进行“傻瓜式”提问。除文字外,用户也可以图片、声音进行更简单的搜索,在语音搜索这一功能上,除了普通话外,百度App还支持了粤语的提问与回答。中华语言博大精深,有些地方还有“五里不同音,十里不同调”的说法,百度App未来支持更多方言是可预见的。
上面这一切的搜索进化都得益于AI技术的应用。AI技术一方面更好地理解内容,另一方面更好地理解用户搜索请求,结果就是可以给出更加精准的答案,这对移动搜索至关重要。随着IoT时代搜索入口的多场景化,用户对搜索的准确性要求越来越高,比如语音助理就只会给搜索引擎一次回答机会。因此搜索的终极发展目标是只给用户一个答案——他最需要的答案,少即是多。要做到这一点很难,但方向却一直都很明确:做AI技术驱动的搜索引擎,这正是百度搜索这10余年进化的方向。
这两年,在深度学习经过10余年发展后,预训练大模型成为AI产业新的技术热点。由于工业化阶段的AI需支撑更广泛普适的场景、满足更大更复杂的AI计算需求,人工标注的数据模型训练模式已捉襟见肘,具有“巨量数据、巨量算力、巨量算法”特性的AI预训练大模型成了产业智能化的基础工具,其可采取自监督学习的方式对海量无标注数据中的规律和知识进行提炼、学习。百度、谷歌等巨头的探索表明,基于预训练大模型的NLP技术的效果已超过过去最好的机器学习能力。年红极一时的AI作画、AI作文、AI外交官等应用,背后都是AI大模型在驱动。
百度也已将AI大模型应用在搜索这一核心业务中,在年万象大会上,百度发布了跨模态大模型“知一”和新一代索引“千流”。“知一”可理解视频、文字、图片、信息流等全网形态各异的资源,使得搜索不再受限于信息的形态。“千流”则可对海量内容进行索引,更快地筛选出搜索相关的答案,相较于传统搜索引擎而言,成本降了一半、速度快了两倍。
在“智能搜索+智能推荐”的双引擎模式下,百度搜索每天响应来自多个国家、几十亿次的搜索请求。由于搜狗等老牌搜索玩家出局,很多人以为搜索行业在走下坡路。但百度数据却给出了相反的结论。百度财报显示,今年9月百度AppMAU已达到6.4亿,同比增长5%。而据何俊杰在WISE大会上介绍,“过去一年,百度搜索的规模有增无减,年同比实现了17%的增长。百度APP也强劲增长,第三季度移动端搜索查询次数同比实现两位数的增长,百度App信息流内容分发量同比增长2%。”
搜索引擎是最古老的互联网应用之一,到今天为止也是最基础的互联网应用之一。从百度给出的最新数据来看,搜索引擎“国民刚需应用”的属性并未改变。不论短视频、直播等媒体内容形态如何变迁,人们都需要用搜索。而从百度发布的跨模态大模型“知一”和新一代索引“千流”来看,搜索引擎一直都在“吃”着最前沿的AI技术,不断进化。
何俊杰说“搜索已经成为AI规模最大的应用场景”,这可能在一些人的意料之外,但在罗超频道看来却是情理之中。一直以来,搜索都是AI最核心的练兵场。AI技术生于实验室,但却发展于搜索。时至今日,搜索引擎仍旧是AI技术的核心练兵场。
搜索是AI的核心练兵场
AI有着多年发展历史,年物理学家约翰·霍普菲尔德就发明了Hopfield神经网络,年深度学习之父杰弗里·辛顿提出BP算法加速了神经网络发展,不过因为缺乏对应的算力、场景与数据,AI并未迎来爆发。年前后随着谷歌大脑项目被曝光,深度学习开始为大众
转载请注明:http://www.mabulili.com/wxjdd/26161.html