AI大模型加持,生成式搜尋來了

夢晨 發自 凹非寺量子位 | 公眾號 QbitAI

最近有兩件事,讓

搜尋引擎

重回聚光燈下。

百度釋出“文心百中”

,用AI大模型技術驅動的產業級搜尋系統。構建企業內部搜尋引擎的人力成本減少90%以上,同時只需要極低資料。

幾乎同一時間,

OpenAI最新發布聊天機器人ChatGPT

,網友發現用它來尋找問題的答案雖然有時會出錯,但直接得到完整回答的感覺要比從搜尋中再去挑選爽快多了。

搜尋引擎這個經典技術,就要迎來一輪變革了嗎?

想當年,搜尋引擎是PC網際網路時代的流量入口,絕對的王者。

進入移動網際網路時代後,雖然不再是最受關注的焦點,但搜尋也仍舊是

高頻剛需

,逐漸融入人們的日常生活。

當人們重新把目光看向搜尋引擎,也會注意到它這些年並沒有停止進化。

搜尋變了

過去一提到搜尋,肯定離不開

關鍵詞

。前幾屆世界盃時,人們更習慣於搜“世界盃 直播地址”,關鍵詞之間用空格隔開。

就好像把所有網頁當成一個大文件,用類似Ctrl+F的方式去

對關鍵詞做匹配

隨著手機、移動網際網路的普及,人們的需求也在變化,現在更傾向於提出一個問題,並期待搜尋引擎能

直接給出回答

如搜尋“世界盃直播在哪看?”,更口語化也更復雜,甚至一些時候就是語音轉換出來的。

AI大模型加持,生成式搜尋來了

搜尋引擎也在適應這種變化,給出的結果不再是單純的頁面排序。

針對一些問題,會給出對內容深入理解後的

答案抽取

AI大模型加持,生成式搜尋來了

有時會給出更直觀、更容易跟著操作的

影片內容

AI大模型加持,生成式搜尋來了

甚至在理解需求的基礎上出現配套的

服務跳轉

AI大模型加持,生成式搜尋來了

這些變化看起來並不複雜,背後卻要有很多技術做支撐。

在這裡要重點講一下百度今年亮相的兩項新技術,

“知一”

“千流”

先看跨模態大模型知一,AI技術在搜尋場景落地的代表。

簡單來說,知一大模型可以從全網形態各異的資源中持續學習,無論是文字、圖片、影片還是結構化資訊都可以融會貫通。

打破了資源形態的界限,就更容易理解使用者的搜尋需求。

從技術層面講,知一使用了百度文心大模型技術。大規模預訓練技術提升模型效能,蒸餾壓縮率高達99%的模型小型化技術以降低成本,得以在搜尋場景全面應用。

據瞭解,目前知一在百度搜索的各場景中每天要進行上萬億次的推理。如此巨大的使用規模又帶來新的問題,如何把滿足需求的結果高效呈現給使用者。

這就要提到

新一代索引技術千流,負責把不同維度的資訊進行智慧有序的組織。

千流與之前的索引技術相比,主打多領域、多維度表達的立體柵格化索引。

如何理解柵格化?

在過去,搜尋引擎為提高效率會把內容按質量橫向分層。先從高質量內容開始檢索,滿足需求就可以及時返回結果,還未滿足再進入下一層。

如今,在千流中又把質量最高的一批內容按領域垂直分層。質量分層+內容命中結合,一橫一縱把內容切分成柵格按需檢索,大大減少每次檢索的計算量。

AI大模型加持,生成式搜尋來了

百度工程師透露,這樣節省下的計算量也沒有閒著,而是對內容進行精耕細作,用不同的演算法從多維度提高索引的質量。

還有一個額外好處,在不同柵格之間可以應用個性化演算法。就好比“一魚多吃”,不同的部分使用不同的烹飪方法。

知一和千流配合起來,整個系統還會根據模型最新學習到的知識,進行實時動態調整,確保最優檢索效果。最大程度避免無效計算,最終把滿足需求的結果高效呈現給使用者。

這些新技術,在實際業務中是否起到了效果呢?

答案或許可以從資料中找。

反饋驅動創新

9月份舉辦的永珍·百度移動生態大會,百度指出,過去一年,百度搜索規模

逆勢增長17%

最新的百度第三季度財報也顯示,移動端搜尋查詢次數同比實現兩位數的增長。

百度集團資深副總裁、百度移動生態事業群組(MEG)總經理何俊傑指出,其中的關鍵是

“反饋驅動創新”

一方面反饋來自智慧搜尋。百度搜索每天響應來自100多個國家、幾十億次的搜尋請求。

另一方面則來自智慧推薦。2022年第三季度百度App資訊流內容分發量同比增長23%,其中的使用者點贊、評論、分享也都是使用者最直接的反饋。

使用者的高頻需求,驅動著AI技術變革。新技術又能激發新使用者需求表達,兩者構成

“雙輪驅動”

,持續推動搜尋進化。

AI大模型加持,生成式搜尋來了

比如虛擬人技術加持下,可以實現互動式對話,單純的搜尋之外又有了聊天、陪伴需求。

AI大模型加持,生成式搜尋來了

正如百度研究院在年初的十大科技趨勢中所預測的,AIGC(AI Generated Content,人工智慧生成內容)在今年大放異彩。

未來AIGC繼續與搜尋深度結合,還將帶來“搜尋即生成”甚至“搜尋即創造”。

不會再有“抱歉,沒有找到相關的網頁,請檢查您的輸入是否正確”,而是使用者點下搜尋按鈕的一瞬間,本不存在的內容由AI即時創造出來。

百度CEO李彥宏前段時間也說過:

隨著技術的突破,AI作畫、AI影片、甚至AI構建一個虛擬世界可能都會像手機拍照一樣簡單。

而一切技術的突破和創新,都離不開人才。

為了更好推動技術和演算法創新、促進產學研交流、培養人才,百度舉辦了首屆搜尋技術創新挑戰賽。

大賽提供30萬元總獎金池、提供英偉達A100算力資源,更是有機會接觸到百度海量搜尋業務的脫敏資料。

AI大模型加持,生成式搜尋來了

本屆大賽分為兩個賽道:

搜尋問答,

旨在探索開放領域搜尋場景。面對網頁文件質量參差不齊、長短不一,問題答案分佈零散、長度較長等問題,希望參賽者能進一步提升深度智慧問答效果,給使用者提供更好的搜尋體驗。

搜尋模型推理最佳化,

對於保障億萬使用者流暢的搜尋體驗、控制算力成本開銷至關重要。希望參賽者透過各種最佳化技術,挑戰最優的模型推理效能。

大賽期間,百度還提供了豐富的相關課程和學習資料,搜尋技術與GPU加速計算專家也將提供全程的技術輔導。

本次大賽對全社會開放,訊息一出立即吸引了大量高校學生、企業團隊或個人開發者,目前已有1500+隊伍報名參加,成為搜尋技術領域一次盛會。

大賽地址:

https://sti。baidu。com

— 完 —

量子位 QbitAI · 頭條號簽約

關注我們,第一時間獲知前沿科技動態