一、AI 搜索:開啟信息獲取新時代
AI 搜索正逐漸成為信息獲取領域的新興力量,重塑著信息獲取的方式,引得各大公司紛紛布局。隨著人工智能技術的飛速發展,AI 搜索已不再是傳統搜索引擎的簡單升級,而是通過深度學習和自然語言處理等技術,為用戶帶來更為智能和個性化的搜索體驗。
目前,包括微軟、OpenAI、Perplexity、百度、阿里、360、昆侖萬維、秘塔等在內的眾多科技公司都已涉足 AI 搜索賽道。據統計,截至 2024 年 5 月,Perplexity 日度用戶訪問量達到 300 萬,較之 2023 年增長 5 倍以上。百度在 2024 年第二季度財報電話會上,百度創始人、董事長兼首席執行官李彥宏也表示,已有 18%的搜索結果由 AI 生成。
AI 搜索之所以能吸引眾多公司布局,主要在于其具有諸多優勢。首先,它能更準確地理解用戶的搜索意圖,像一個“答案引擎”,當用戶提出問題時,會給出一個簡潔明確的答案,且所有答案都標明了來源,并給出系列聯想問題,與用戶形成進一步的互動。其次,AI 搜索不局限于文字,還能理解和索引視頻、圖片、語音等多樣化內容,這種多模態的處理能力,使得它能夠從更廣泛的數據源中提取信息,為用戶提供更豐富和準確的搜索結果。同時,AI 也重塑了搜索的產品形態,可以實現 AI 寫作、AI 文件總結等,讓搜索從工具變為全能 AI 助手。
在 AI 搜索的浪潮下,傳統搜索引擎也在積極尋求變革,通過引入智能體來實現“AI 化”升級。智能體能夠與環境互動、收集數據,利用數據去自主決定完成預設任務,在一定程度上可以視為搜索引擎的延伸和升級。在生成式 AI 的時代,搜索引擎成為“智能體中樞連接器”的角色,面對復雜問題,AI 搜索可以拆解、推理用戶意圖,檢索、分析和總結全網信息,生成和聚合多模態的回答。搜索結果不是目的,解決問題才是核心。因此,AI 搜索可以提供更加豐富的內容形態和交互方式,在一定程度上進化成為各類用戶場景中的 AI 助手。
二、AI 搜索的技術特點與優勢
(一)智能語義理解
AI 搜索采用先進的自然語言處理技術,能夠深度解析用戶的搜索意圖。在傳統搜索引擎中,用戶往往需要通過輸入準確的關鍵詞來獲取信息,但這可能會導致搜索結果不夠精準或遺漏重要內容。而 AI 搜索能夠捕捉隱含的語義關系,例如當用戶輸入“適合周末旅游的地方”時,AI 搜索不僅會匹配包含“周末”“旅游”“地方”這些關鍵詞的結果,還能理解用戶的真正需求是尋找一個在周末適合進行休閑旅游的目的地。它可以通過分析大量的文本數據,理解詞語之間的關聯和語境,從而為用戶提供更相關的搜索結果。據統計,使用智能語義理解的 AI 搜索能夠將搜索結果的準確性提高 30%以上。
(二)個性化結果推薦
AI 搜索會根據用戶的瀏覽歷史和興趣偏好進行個性化推薦,極大地貼合用戶需求。隨著用戶在網絡上的活動不斷增加,AI 搜索可以收集和分析用戶的行為數據,了解用戶的興趣愛好和需求。例如,如果用戶經常搜索科技新聞和電子產品評測,AI 搜索就會在用戶下次搜索時優先推薦與科技相關的內容。這種個性化推薦不僅節省了用戶尋找感興趣內容的時間,還能為用戶提供更加貼心的服務。有研究表明,個性化推薦可以提高用戶的滿意度 40%左右。
(三)豐富多媒體支持
AI 搜索不僅支持文本搜索,還可搜索圖像、視頻、語音等多種媒體格式。在當今數字化時代,信息的形式越來越多樣化,用戶對于不同類型媒體的搜索需求也在不斷增加。AI 搜索能夠整合各種媒體資源,為用戶提供更全面的信息獲取體驗。比如,用戶可以通過上傳一張圖片來搜索相關的產品或景點,或者通過語音輸入進行搜索。據統計,支持多媒體搜索的 AI 搜索平臺的用戶活躍度比僅支持文本搜索的平臺高出 50%以上。
(四)強大知識融合能力
AI 搜索具有將不同信息源知識融合推理的能力,能夠為用戶提供深入全面的搜索結果。傳統搜索引擎通常只能提供單一來源的信息,而 AI 搜索可以整合來自多個渠道的知識,進行融合和推理。例如,當用戶搜索一個復雜的醫學問題時,AI 搜索可以結合專業醫學文獻、醫生的博客文章、患者的經驗分享等不同來源的信息,為用戶提供更全面的解答。這種知識融合能力使得 AI 搜索能夠滿足用戶對于深度信息的需求,為用戶提供更有價值的搜索結果。據調查,使用具有強大知識融合能力的 AI 搜索的用戶,在解決復雜問題時的效率提高了 60%以上。
三、AI 搜索如何處理復雜查
(一)優化提示詞
在 AI 搜索中,寫好提示詞至關重要。首先,要明確問題,盡量避免使用模糊不清的詞匯,如“好”“壞”“怎么樣”等,同時避免使用復雜的句式或過多的修飾語。例如,不要問“這個產品怎么樣?”,而可以改為“我想了解這個產品的性能、優缺點和用戶評價”。這樣能讓 AI 搜索更準確地理解用戶的需求。
其次,可以將復雜查詢任務拆解為更簡單的提示,分步驟提問,一步步引導 AI 搜索理解問題。比如,對于“人工智能在醫療領域的應用及未來發展趨勢”這個問題,可以先問“人工智能在醫療領域有哪些具體應用?”,再問“人工智能在醫療領域面臨哪些挑戰?”最后問“人工智能在醫療領域的未來發展趨勢是什么?”
再者,在一個提示中可以多次重復重點單詞或短語,增強這些詞匯的信號強度,使模型更容易注意到它們。例如,在搜索“最新的智能手機技術特點”時,可以多次強調“智能手機”,如“我想了解最新的智能手機的技術特點,智能手機在性能、拍照和續航方面有哪些提升?”
(二)RAG 大模型優化實踐
RAG(檢索增強生成)大模型在處理復雜查詢方面有著重要作用。通過文檔結構化,可以提高文檔解析的準確性,確保輸入數據無誤,從而輸出準確的結果。例如,在處理大量文檔時,將文檔進行切片處理,使其與向量模型或索引兼容,以便大模型能夠進行有效總結。
大模型微調也是一種優化方式,可以減少幻覺問題,使模型集成一些領域知識。但這種方法可能面臨領域數據不足或預訓練效果不佳的問題,需要進一步調整領域知識,這會增加成本。不過,像阿里云在實踐中發現,采用 RAG 方法,不改變大模型本身,而是通過檢索領域知識,結合問題和檢索到的知識,用大模型生成答案,這種方法幻覺問題較少,且能提供生成答案的依據,解決可溯源的問題。
同時,Agent 技術也能提升 RAG 的效果和性能。例如,在多輪對話中,考慮歷史信息進行查詢改寫,形成語義完整的查詢后進行搜索;對于復雜的查詢,進行改寫和拆解,以便更準確地搜索到相關信息。
(三)多智能體與系統結合
多智能體加系統的方式能有效解決復雜信息性能下降問題,構建下一代 AI 搜索。受到人類專家解決現實問題方式的啟發,提出了如 MindSearch 這樣的多智能體框架,包括 WebPlanner 和多個 WebSearcher。WebPlanner 首先將用戶查詢分解為可以并行解決的多個原子子問題,并將它們分派給相應的 WebSearcher。
例如,當用戶查詢“中國高鐵發展”時,WebPlanner 將查詢細化為“中國高鐵技術的發展歷程”“中國高鐵網絡的現狀”和“中國高鐵技術的未來規劃”等子問題,然后每個 WebSearcher 針對各自的子問題,采用分層檢索過程提取有價值的數據,最后 WebPlanner 生成最終的響應,回答用戶的原始問題。
復雜智能系統中還可以通過將多智能體視為一個不斷進行內外部信息交互的群體,將系統中單個智能體視為沒有質量和體積的粒子,每個粒子能夠獨立獲取環境信息并進行交互。不同智能體之間能夠根據環境對其自身行為和其它智能體的行為所做出的反饋信息對自身進行調整與優化,以群體最優為目標,相互協作,提高多智能體協作的靈活性和優化效率。
基于多智能體的復雜信息系統開發方法研究中,將復雜信息系統看成一個多主體組織,依據組織學原理分析多主體系統組織特性,建立多主體組織模型,從而形成多主體系統宏觀結構和功能需求的嚴格規范。確定承擔各類組織職能的多個主體,依據組織模型,采用信念 - 愿望 - 意圖結構設計各類主體的概念模型,為系統的機上實現建立清晰的可操作的開發模式。
四、AI 搜索的未來前景
(一)產品力核心競爭力
工信部賽迪研究院發布的《AI 搜索行業發展報告》以夸克為例,指出簡約化的產品設計和一站式服務能夠有效滿足用戶更快、更精確、更易用的搜索需求,成為 AI 搜索發展的重要趨勢之一??淇艘苿佣松墶俺壦阉骺颉保S后正式發布 PC 端全面升級 AI 搜索、AI 寫作、AI 文件總結等功能。簡約化設計降低了產品使用門檻,極大提升了用戶搜索效率,從而更加高效地實現新用戶的引流和現有用戶的留存??淇说囊徽臼椒蘸蜔o縫銜接的用戶體驗,讓用戶沉浸狀態中完整地完成個性化任務,極大簡化了復雜的搜索流程,在提升搜索效率和用戶滿意度方面發揮顯著作用。例如,在教育領域,學生可以通過夸克快速找到學習資料、解答難題;在辦公場景中,職場人士可以利用夸克進行文件總結、撰寫報告等,一站式滿足多種需求。
(二)產品形態躍遷
AI 時代下的搜索框已經突破了傳統搜索的束縛,不再僅僅局限于簡單的文字搜索,而是可以提供包括文本、圖片、音視頻等在內的跨模態搜索體驗,并在逐漸演化為集搜索、存儲、整合、提煉、創作于一體的全能型智能助手。此外,AI 搜索還呈現出從手機端向平板、PC,甚至智能家居、智能網聯汽車等多端協同趨勢??梢灶A見的是,未來隨著多端協同能力的不斷增強,AI 搜索將突破不同設備之間的邊界,走進更多全新的應用場景。例如,當用戶在手機上進行搜索后,回到家可以通過智能音箱繼續獲取相關信息,或者在開車時通過智能網聯汽車的語音助手查詢路線和周邊信息。
(三)搜索場景專業化
用戶使用需求和行為習慣的變化導致搜索場景趨向垂直化、細分化和專業化。相較于泛化信息搜索,垂類搜索更加專注于特定領域的搜索結果,面對復雜問題能夠提供獨有的、專業化內容,不僅讓用戶體驗得以優化,也在一定程度上成為了 AI 搜索的“護城河”。以夸克為代表的 AI 搜索新勢力把搜索技術重點從傳統基于關鍵字的簡單理解轉移到了對用戶意圖的復雜理解上,在垂類、細分場景表現優秀。目前,夸克基于在教育、辦公、醫療、高考等垂類細分場景的長期積累與積淀,構筑起了獨特的內容優勢。在 2024 年高考期間,夸克 AI 搜索使用量突破了 1 億次,用戶規模創下歷年新高。
(四)PC 端新入口
《報告》援引 QuestMobile 數據指出,泛學生人群和新生代職場人是 AI 搜索的核心用戶群體。將寫論文、寫簡歷、畫思維導圖、制作 PPT、翻譯文獻等需要在 PC 端完成的學習、工作任務交給 AI 搜索完成,已經在這些年輕人中成為新興潮流。與此同時,年輕人的搜索方式也從搜索框延展到了快捷鍵、截屏、劃線等方式??淇俗钚?PC 端的“系統級全場景 AI”能力,將 AI 能力無縫融入用戶整個電腦的使用體驗中。無論是在桌面、文檔還是網頁中,用戶都能通過上述方式隨時喚起夸克 AI 能力,實現搜索、寫作和信息總結等功能。數據顯示,近期用戶在夸克 PC 端使用快捷鍵進行搜索的漲幅最快。對于年輕用戶而言,學習和辦公場景是最常見的 AI 搜索場景,此類場景對搜索結果的精確性、個性化程度和知識更新頻率要求較高,PC 端產品為處理此類復雜任務提供了施展空間。以夸克為核心代表的具備在 PC 端提供全面、系統級 AI 能力的產品將成為新的入口級應用。
(五)重塑行業生態
AI 搜索的崛起不僅僅是對搜索算法的優化,更是對用戶信息檢索方式的一次根本性重塑。隨著新玩家先后入場,傳統搜索市場的“寡頭效應”正在被逐步打破。根據 Gartner 的預測,到 2026 年,傳統搜索引擎的訪問量可能下降 25%。另據 StatCounter 數據顯示,截至 2024 年 4 月,傳統搜索巨頭谷歌的搜索引擎市場份額似乎已降至 86.99%,達 2009 年以來的最低點。國內方面,AI 搜索新勢力代表夸克多次登上 App Store 應用下載榜單第一名,開學季 PC 端下載量環比上漲 173%,實現暑期新增用戶數量行業第一。在眾多 AI 能力中,AI 搜索、AI 寫作、AI 講題是夸克用戶使用頻次最高的三大功能。AI 搜索與傳統搜索之間并非簡單的取代與被取代關系,而是自然發展與演進的結果。預計短期內,AI 搜索將分流部分傳統搜索用戶,雙方之間的市場份額差距將逐步縮小。
五、AI 搜索面臨的挑戰與應對
(一)準確率問題
AI 搜索在準確率方面面臨著大模型幻覺的挑戰。大模型至今很難避免幻覺問題,這自然也成了 AI 搜索的一大隱憂。例如,當用戶進行搜索時,可能會得到不準確或不相關的答案,影響用戶體驗。目前,科學家們采取了多種方法來減少幻覺的產生。一是提高訓練數據集質量,確保數據的準確性和多樣性,為大模型提供更可靠的學習資源。二是強化 RAG(檢索增強生成)能力,通過優化檢索和生成的過程,提高搜索結果的準確性。三是完善溯源檢查,讓用戶能夠了解答案的來源,增加信任度。四是拓展上下文窗口長度,使大模型能夠更好地理解問題的背景和語境,從而給出更準確的答案。
(二)商業模式難題
AI 搜索需要考慮商業模式以實現正向發展?,F階段大部分 AI 搜索產品或許可以零成本不限次使用,但隨著用戶量和推理成本的增加,選擇合適的商業模式至關重要。目前,AI 搜索服務商正在探索多種商業變現路徑。以 Perplexity 為代表的企業針對 C 端用戶收取訂閱費,以提供高質量、個性化的搜索服務;針對 B 端提供定制服務,布局私有數據庫的信息搜索和交互等。(據報道:截至 2024 年 5 月,Perplexity 日度用戶訪問量達到 300 萬,較之 2023 年增長 5 倍以上。)以 Genspark 為代表的企業將目光轉向了旅游和商品兩個搜索頻次高、自帶消費屬性的賽道,提升廣告業務在其收入中的比重。此外,一些 AI 搜索服務可能并非作為獨立產品在創收,而是和其他業務捆綁,以共同服務于各類應用場景。比如司普智能搜索覆蓋關鍵詞搜索、語義向量搜索、知識圖譜搜索,同時支持聯網搜索與私有數據庫檢索多種形態,在實際客戶應用中,共同服務于業務問答、內容創作、報表生成等場景。搭載 AI 搜索功能的聊天機器人,則更多為學習、社交、娛樂、客服等場景提供豐富的語料數據支撐,或通過 AI 搜索收集和整理材料,匯總上下文搜索結果,生成各類提示詞和文稿,主要通過訂閱費分攤成本。而基于大模型基礎能力提供 AI 搜索服務的廠商,搜索服務與模型業務關聯,一般按大模型實際調用或使用量合并計費等。利用 AI 搜索生成答案的同時,通過搭載各類 AI Agent,推動其和關聯業務的互動和對接,也被視為和 AI 搜索更匹配,更具發展潛力的商業模式。
(三)信息準確性核實與隱私保護
在 AI 搜索中,對關鍵信息進行核實至關重要。由于搜索結果可能來自不同的來源,其準確性和可靠性需要進行驗證。用戶在使用 AI 搜索時,不能完全依賴單一的搜索結果,而應該參考多個權威來源,確保信息的可靠性。例如,在進行重要決策或獲取專業知識時,可以查閱學術文獻、專業網站和權威機構的發布內容。同時,AI 搜索也需要注意保護個人隱私。隨著人工智能技術的廣泛應用,眾多 AI 模型收集并處理了海量數據,其中大部分包含用于提供定制化服務的個人信息。然而,數據量的激增帶來了隱私和安全方面的內在風險。為了保護個人隱私,可以采用數據加密傳輸、差分隱私、同態加密、安全多方計算、聯邦學習、匿名化和去標識化、數據最小化原則、訪問控制和權限管理、審計和監控等方法。例如,使用 SSL/TLS 等協議加密數據在傳輸過程中的安全性,防止數據在傳輸過程中被截獲;對存儲在服務器上的敏感數據進行加密,即使數據被非法訪問,也無法輕易解讀;通過對數據進行匿名化處理,去除可以直接或間接識別個人身份的信息,從而降低數據泄露的風險。實施嚴格的訪問控制機制,確保只有授權人員才能訪問敏感數據,并根據最小特權原則分配權限。定期審計數據訪問和使用情況,監控系統中的異?;顒樱皶r發現并響應潛在的安全威脅。遵守 GDPR、CCPA 等國際和地方的數據保護法律法規,確保數據處理活動符合法律要求。對員工進行定期的安全意識培訓,提高他們對數據隱私和安全的認識,減少人為錯誤造成的風險。制定應急響應計劃,一旦發生數據泄露等安全事件,能夠迅速采取行動,減少損失。