OpenAI 為什么沒敢推AI搜索

來源：極客公園編輯：非小米時(shí)間：2024-05-13 07:42人閱讀

本周，OpenAI 搞了一個(gè)大花活。

整整一周，不斷有外媒獲得最新消息，報(bào)道 OpenAI 即將推出搜索產(chǎn)品，甚至前幾天，已經(jīng)有媒體拿到了 ChatGPT Search 的提前體驗(yàn)版本——界面仍然是對(duì)話交互，但 GPT 回答時(shí)會(huì)使用網(wǎng)絡(luò)信息進(jìn)行回答。

不過，在預(yù)熱了一整周后，5 月 11 日最新消息，OpenAI 在下周將舉行發(fā)布會(huì)，但將不會(huì)發(fā)布 GPT-5，也不會(huì)發(fā)布 AI 搜索引擎。

AI 搜索目前是海內(nèi)外 AI 創(chuàng)業(yè)團(tuán)隊(duì)的重要方向之一。在海外，主打 AI 搜索的 Perplexity 目前估值已經(jīng)超過 10 億美元。

OpenAI 為什么會(huì)選擇這個(gè)時(shí)間點(diǎn)做了一波這樣的宣傳？如果 OpenAI 真的入局搜索，會(huì)對(duì)搜索格局帶來什么影響嗎？對(duì)于創(chuàng)業(yè)者來說，AI 搜索是一個(gè)好的方向嗎？

5 月 10 日，極客公園創(chuàng)始人&總裁張鵬、推出國(guó)內(nèi)第一款融入大語(yǔ)言模型的搜索引擎-天工 AI 搜索的昆侖萬維董事長(zhǎng)兼 CEO 方漢，和投資了最近幾個(gè)月數(shù)據(jù)飆升的秘塔搜索的獵豹移動(dòng)董事長(zhǎng)兼 CEO、獵戶星空董事長(zhǎng)傅盛，在極客公園「今夜科技談」的直播中，共同聊了聊這個(gè)話題。

兩位嘉賓都是經(jīng)驗(yàn)豐富，身經(jīng)百戰(zhàn)的創(chuàng)業(yè)者，在外媒傳出確切消息之前，就明確指出了 OpenAI 此次傳出要推出 AI 搜索引擎的消息，大概率并不是要在此投入巨大的精力，做成一項(xiàng)驚人的產(chǎn)品，而更多的是一場(chǎng) PR 戰(zhàn)術(shù)。

兩人共同對(duì) AI 搜索背后所需的技術(shù)儲(chǔ)備、AI 搜索的成本結(jié)構(gòu)和商業(yè)模式進(jìn)行了分析，并對(duì) AI 搜索的未來進(jìn)行了展望。

極客公園對(duì)此次直播進(jìn)行了整理，分享如下。

OpenAI 做搜索，能做出什么新的花樣？

極客公園：OpenAI 為什么在這個(gè)時(shí)間點(diǎn)上，傳出要推出搜索引擎？

傅盛：前天我和朱嘯虎一起參加了投中的論壇，他當(dāng)時(shí)有一個(gè)觀點(diǎn)就是覺得 OpenAI CEO Sam Altman 是一個(gè)非常能吹牛的人。我覺得無論怎么說，我們要意識(shí)到，Sam Altman 的 PR 能力確實(shí)是非常強(qiáng)的。

從歷史上來看，他每一次 PR 的時(shí)間點(diǎn)都拿捏地非常準(zhǔn)確。當(dāng)時(shí)發(fā)布 Sora 的時(shí)間點(diǎn)，就是 Anthropic 的 Claude3 和其他幾個(gè)大模型上線的時(shí)刻。它們?cè)谖谋灸芰ι贤贿M(jìn)地很快，那 Altman 立即給你升維一下，說你看你還在講陸軍的事，我都到空軍了，然后立即輿論又都在關(guān)注 Sora，OpenAI 又成了業(yè)界唯一的明星。

其實(shí)你現(xiàn)在回頭想想，Sora 從頭到尾就是一場(chǎng) PR，現(xiàn)在都五月了，還是沒有開放給公眾使用。

傳聞中的 OpenAI Search 測(cè)試界面 | 圖片來源：賽博禪心

我的觀點(diǎn)是，GPT-5 的研發(fā)，肯定遇到了一些問題。如果不是這樣，直接上 GPT-5 就好了?？萍计髽I(yè)，永遠(yuǎn)都是能早一天就早一天，絕對(duì)不能晚的。GPT-5 要不就是性能沒有提升地那么驚艷，要么就是成本上特別高。

但以我對(duì) OpenAI 的理解，即使成本再高，只要效果特別驚艷，它一定會(huì)往外放，先震你一下再說，哪怕 GPT-5 一天就能用 5 條，那也讓你先用一下，讓所有的人的目光都過來。所以我覺得 GPT-5 的研發(fā)可能還是遇到了一些問題，不管是成本，還是所謂安全性問題，或者幻覺問題，反正多少遇到了問題。

作為 OpenAI 來說，現(xiàn)在這么燒錢的情況下，用戶量增長(zhǎng)就是它的核心命脈，一旦不增長(zhǎng)，融資下筆錢的時(shí)候，估值上不能再上一個(gè)臺(tái)階，就會(huì)很麻煩。

所以我覺得這次說要做搜索引擎，就是圍魏救趙，我最近經(jīng)常唱衰 OpenAI，因?yàn)槲矣X得，從一個(gè)商業(yè)公司角度，其實(shí) OpenAI 走到這里，現(xiàn)在有點(diǎn)騎虎難下。

方漢：我首先非常贊同傅盛老師一個(gè)觀點(diǎn)，就是 Sam Altman 的確是一個(gè) PR 高手，而且是是絕頂高手。

我認(rèn)為在 OpenAI 里面，權(quán)力最大的其實(shí)是 PR 團(tuán)隊(duì)，或者說負(fù)責(zé)去融資的團(tuán)隊(duì)，其次是技術(shù)團(tuán)隊(duì)，再其次是產(chǎn)品團(tuán)隊(duì)。我認(rèn)為這個(gè)排序?qū)е铝?OpenAI 做出了種種行為。

GPT-4.5 和 GPT-5 為什么遲遲不發(fā)？根據(jù)我得到的消息，OpenAI 已經(jīng)訓(xùn)出來了，也不是能力不行，但是它現(xiàn)在沒有把握在工程上把這個(gè)東西效益最大化。

這個(gè)的意思是什么？剛才我們也聊到了，用戶漲不上去是 OpenAI 現(xiàn)在最頭疼的事情。如果發(fā)布了一個(gè)新的大模型，它沒有把握一次性、瞬間獲得足夠多的用戶，那它就不會(huì)上，這是它根本性的原因。

那么發(fā)搜索產(chǎn)品呢？我們目前看到的產(chǎn)品形態(tài)上來講，OpenAI 的搜索產(chǎn)品，并沒有對(duì)海內(nèi)外所有的搜索引擎產(chǎn)品，形成碾壓，形成 SOTA（state-of-the-art，最佳表現(xiàn)），發(fā)布這個(gè)產(chǎn)品，可能會(huì)讓用戶有一點(diǎn)增長(zhǎng)，但不會(huì)讓用戶翻倍增長(zhǎng)。所以我認(rèn)為，這是在 Google I/O 前一周對(duì)谷歌的一次戰(zhàn)略狙擊，它的根本戰(zhàn)術(shù)上，還是在等待和籌備 GPT-4.5。

極客公園：OpenAI 如果推出搜索引擎，會(huì)解決 OpenAI 的什么問題嗎？會(huì)使搜索引擎的格局有變化嗎？

方漢：我覺得它應(yīng)該能提升用戶使用上的體驗(yàn)，但是對(duì)大盤影響不大。

最早 Bing 推出 new Bing 的時(shí)候，把谷歌都嚇?biāo)懒?，但最后?duì)于 Bing 的大盤其實(shí)沒有什么影響，谷歌過了半年一看市場(chǎng)份額好像沒什么變化。我覺得搜索引擎對(duì)于 OpenAI 的用戶增長(zhǎng)也不會(huì)有根本性的變化。

傅盛：我還沒看到它的具體頁(yè)面會(huì)是怎么設(shè)計(jì)，但我覺得如果它變成一個(gè)默認(rèn)功能的話，還是多少會(huì)增加一些用戶的這個(gè)感知點(diǎn)的。未必是能帶來多少新用戶，但是老用戶的留存活躍這件事可能能夠變得好一點(diǎn)。

OpenAI Search 測(cè)試界面 | 圖片來源：賽博禪心

搜索這個(gè)功能，對(duì)于用戶日常將其從好玩，變成當(dāng)作生產(chǎn)力工具使用，是非常重要的。我其實(shí)之前一直不明白為什么 ChatGPT 在發(fā)布之初沒有增加這個(gè)功能，我懷疑，原因可能在于成本。

它本來成本已經(jīng)很高了，也一直在努力降成本。不加搜索時(shí)，本來用戶問一個(gè)問題，然后模型去預(yù)測(cè)下一個(gè)字，都需要這么多推理成本。

如果加上搜索后，用戶問一個(gè)問題，你先去啪啪啪搞出幾十個(gè)網(wǎng)頁(yè)，抓取下來幾千個(gè)字，傳給模型再讓模型總結(jié)，那這個(gè)成本就高很多了。

極客公園：在部分灰度用戶的測(cè)評(píng)中，我們看到此次 OpenAI 所說的搜索產(chǎn)品，其實(shí)產(chǎn)品形態(tài)和現(xiàn)有的搜索產(chǎn)品很接近。是不是 AI 搜索的產(chǎn)品形態(tài)，沒有太多的創(chuàng)新空間了？

傅盛：現(xiàn)在這個(gè)形態(tài)的 AI 搜索，我覺得創(chuàng)新空間不大。

AI 搜索，是讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過程，而把這個(gè)過程用大模型，用 AI 去替你做這件事情。

這里面涉及兩個(gè)技術(shù)問題，一個(gè)是把網(wǎng)頁(yè)收集回來，一個(gè)是把網(wǎng)頁(yè)內(nèi)容傳遞給大模型讓大模型進(jìn)行總結(jié)。

前者涉及到要建立網(wǎng)頁(yè)索引庫(kù)，而不是簡(jiǎn)單地去百度搜幾個(gè)網(wǎng)頁(yè)，然后拿回來加工——百度肯定是不讓你這么干的。秘塔搜索也是自建了索引庫(kù)。而后者涉及到 AI 算法和模型能力。

我覺得形態(tài)上大家都是比較類似的，而從模型能力角度講，目前看來，整理網(wǎng)頁(yè)內(nèi)容把它輸出出來，需要的 AI 能力，其實(shí)也不是那么高，百億參數(shù)的模型已經(jīng)夠了，那后面就是涉及到，誰(shuí)能把工程化、產(chǎn)品化做的更好。

工程化是什么意思？

技術(shù)，我們指的是算法啊等等的進(jìn)步。比如原來是用牛、馬來進(jìn)行運(yùn)輸，那我現(xiàn)在在算法層面，做出一個(gè)超級(jí)算法，相當(dāng)于我做了一個(gè)蒸汽機(jī)，把這些東西統(tǒng)統(tǒng)搞定，仍然能保證有很強(qiáng)的運(yùn)載力。

而工程化，指的是，有時(shí)候現(xiàn)在沒有這么強(qiáng)的一個(gè)技術(shù)出來，我們?cè)趺慈ザ喔闩?、馬，協(xié)調(diào)這一千頭牛、一萬匹馬，來完成一件事，保證它不出錯(cuò)。

AI 搜索，現(xiàn)在雖然是大一統(tǒng)了，在很多細(xì)微的地方，就能看到不同的產(chǎn)品，是不一樣的。

PerplexityAI 的搜索界面 | 圖片來源：截圖

比如用戶在問不同問題的時(shí)候，看似在做同一件事，其實(shí)不同的搜索產(chǎn)品背后，會(huì)用不同的分類策略，對(duì)問題先進(jìn)行分類。哪些問題深度要求高，哪些問題實(shí)時(shí)性要求高，再做對(duì)應(yīng)處理，不同的產(chǎn)品就會(huì)體現(xiàn)出區(qū)別。

再比如一個(gè)回答，是從知識(shí)庫(kù)里調(diào)出來只是進(jìn)行回答，還是純網(wǎng)頁(yè)的信息整合？那天我問秘塔搜索，第三次世界大戰(zhàn)會(huì)不會(huì)打起來？你會(huì)發(fā)現(xiàn)它的回答，不完全是忠于網(wǎng)頁(yè)內(nèi)容做出來的報(bào)告，它給了我三種可能：打、不打、說不清楚。但是同時(shí)它搜了很多網(wǎng)頁(yè)，為選項(xiàng)做了支撐。這個(gè)如何保持一定的客觀性，分配權(quán)重，是很細(xì)的活。

再比如，AI 搜索引擎怎么去做排序？這也是一個(gè)點(diǎn)，而且可能未來和傳統(tǒng)搜索引擎的點(diǎn)完全不一樣。比如傳統(tǒng)搜索引擎，一般不會(huì)把一篇很專業(yè)的，非常長(zhǎng)的論文，直接推到用戶面前。但是在 AI 搜索下，為了提供更準(zhǔn)確的回答，它在搜索引擎所依賴的背后內(nèi)容的排序上，可能反而是很靠前的。

所以我覺得，未來 AI 搜索產(chǎn)品，拼的應(yīng)該不是誰(shuí)的技術(shù)特別牛，拼的是如何讓搜索結(jié)果能夠更忠于網(wǎng)頁(yè)內(nèi)容，如何做出更體系化的整理這種工程能力和產(chǎn)品設(shè)計(jì)能力。

方漢：我認(rèn)為現(xiàn)在的 AI 搜索的產(chǎn)品形態(tài)只是一個(gè)暫時(shí)的一個(gè)形式，為了讓傳統(tǒng)搜索引擎用戶，能夠很順暢地遷移到新形態(tài)的 AI 搜索上去。但是隨著技術(shù)和產(chǎn)品的迭代，我相信新的交互形式、新的產(chǎn)品形式都會(huì)在 AI 搜索上展現(xiàn)。

比如我們可以看到這次 OpenAI 的搜索 GPT，里面含了一個(gè)功能叫 wikis，我認(rèn)為可能就是用 GPTs 這種 agent（智能體）來實(shí)現(xiàn)的。在搜索的時(shí)候，可以調(diào)用各種各樣的模型解決用戶的問題，將是 AI 搜索的上限所在。

也就是說，根據(jù)用戶的特定需求，我可以調(diào)用各種各樣的模型，我可以調(diào)用翻譯模型，我可以調(diào)用總結(jié)模型，我還可以調(diào)用 tts 模型，把它轉(zhuǎn)成語(yǔ)音輸送給你。如果用戶想在論文方向搜索，我專門做一個(gè)論文的智能體，調(diào)用這個(gè)智能體來回答你的問題，這個(gè)上限我覺得是非常高的。

在我們的實(shí)踐過程中，我們的天工 AI 搜索里面已經(jīng)集成了大量的官方的制作的智能體來提升 AI 搜索的效果，且推理成本其實(shí)還是可控的。

但是我這里要吐槽一下 OpenAI。因?yàn)槲铱戳?OpenAI 的使用界面之后，我心里的想法是，他們的技術(shù)話語(yǔ)權(quán)遠(yuǎn)遠(yuǎn)超過產(chǎn)品的話語(yǔ)權(quán)。

search.chatgpt.com 的網(wǎng)頁(yè)存檔目前該網(wǎng)站無法打開 | 圖片來源：X 用戶 Tibor Blaho

為什么這么說？

它們的產(chǎn)品里，要搜索，首先要選模型，兩到三個(gè)模型，還要選是否使用圖像搜索等等，我覺得復(fù)雜度比谷歌還高。我一個(gè)做技術(shù)的人，我看沒有問題，但很多用戶一定是用不明白的。他們的所有技術(shù)細(xì)節(jié)都沒有藏起來，我開個(gè)玩笑，這樣做產(chǎn)品的，在張小龍手下，一定活不到第二天。

所以總的來說，我認(rèn)為 AI 搜索的形態(tài)仍然有非常大的進(jìn)化空間，但具體怎么變，說實(shí)話我也很難預(yù)測(cè)。

OpenAI 也沒有帶來太多產(chǎn)品形態(tài)方面的驚喜，最多就是這個(gè) GPTs，但我覺得在國(guó)內(nèi)的人看來，比起我們熟悉的微信小程序什么的，看起來也還是挺落后的。

AI 搜索好在哪？從設(shè)計(jì)原理上解決幻覺問題

極客公園：AI 搜索相對(duì)于傳統(tǒng)搜索引擎有哪些區(qū)別，有哪些優(yōu)勢(shì)？

方漢：傳統(tǒng)的搜索引擎是通過爬蟲，把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取回來，然后經(jīng)過清洗跟排序，最后在用戶打出查詢?cè)~的時(shí)候，搜索引擎按照自己的邏輯，對(duì)網(wǎng)頁(yè)進(jìn)行排序，給到用戶。整個(gè)過程，用戶需要自己選點(diǎn)那個(gè)網(wǎng)頁(yè)，點(diǎn)開之后也要自主去看。

而 AI 搜索，讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過程，你直接看到的，就是它對(duì)現(xiàn)有網(wǎng)頁(yè)的一個(gè)總結(jié)結(jié)果，相當(dāng)于一個(gè)搜索小秘書。

它最大的作用是什么呢？是降低了用戶的搜索時(shí)間，以及提高準(zhǔn)確性。

我們都使用過傳統(tǒng)搜索引擎。要去打開網(wǎng)頁(yè)看內(nèi)容，看完了靠人腦去總結(jié)，耗時(shí)其實(shí)是蠻長(zhǎng)的，基本上都要幾分鐘，但現(xiàn)在大模型替你做這個(gè)事情，它可以在幾秒鐘之內(nèi)就可以給你一個(gè)總結(jié)，基本上天工搜索的用戶基本上都會(huì)反映它極大地提高了大家的工作效率，甚至它一些總結(jié)，包括腦圖 PPT 你可以直接用。

天工 AI 搜索的增強(qiáng)模式（共有簡(jiǎn)潔、增強(qiáng)、研究三個(gè)模式）| 圖片來源：截圖

在傳統(tǒng)搜索引擎中，最早谷歌搜索引擎除了搜索按鈕以外，還有另外一個(gè)按鈕 I feel lucky，點(diǎn)一下就直接進(jìn)入第一個(gè)搜索結(jié)果，實(shí)際上是傳統(tǒng)搜索引擎降低交付的走成本的一個(gè)嘗試。本質(zhì)上我們現(xiàn)在所有的 AI 搜索就是 I feel lucky 那個(gè)按鈕所起到的作用，只不過我們做的比他們要好得多。

另外就是準(zhǔn)確性。AI 搜索解決了大模型的幻覺問題。大家一開始用 ChatGPT，其實(shí)很多人是把它當(dāng)搜索引擎用的，但實(shí)際上它是會(huì)經(jīng)常一本正經(jīng)的胡說八道。AI 搜索通過 RAG 這些技術(shù)，先找到事實(shí)，12345，限制大模型根據(jù)以上事實(shí)來回答問題，能極大地抑制甚至徹底消除大模型的幻覺。

傅盛：我們一定要意識(shí)到一點(diǎn)，就是搜索用戶在搜索的時(shí)候，其實(shí)抱著非常多的目的。有的搜索，就是尋址，我懶得記一個(gè)網(wǎng)頁(yè)的網(wǎng)址，我要去那個(gè)網(wǎng)頁(yè)，我就去搜索引擎上搜索一下。不知道大家知不知道，以前百度搜索的第一名，是 Hao123，是一個(gè)匯集其他網(wǎng)址的導(dǎo)航網(wǎng)站。

還有一些搜索，只需要一些及時(shí)的簡(jiǎn)單內(nèi)容，這種也不太需要 AI 搜索。我覺得現(xiàn)在的 AI 搜索，更側(cè)重于一些特定的搜索需求——在一個(gè)相對(duì)復(fù)雜的問題下，對(duì)網(wǎng)絡(luò)上的結(jié)果進(jìn)行綜合分析，更偏向于形成某個(gè)東西的一份調(diào)查報(bào)告那種感覺。

秘塔搜索的研究模式（共有簡(jiǎn)潔、深入和研究三個(gè)模式）｜圖片來源：截圖

當(dāng)然它從客觀上克服了幻覺的問題，但理解 AI 搜索，一個(gè)更好的理解是把它理解為個(gè)大模型的一個(gè)非常垂類的場(chǎng)景，大模型作為主力，去幫我研究一下比如新能源車最近價(jià)格是如何變化的，這個(gè)助理就幫你去在搜索引擎上找了一堆的文章，然后給你整理了一份報(bào)告。

極客公園：用戶愿意信任 AI 搜索嗎？AI 搜索是不是只是一小波用戶的需求，而不是一個(gè)大眾需求？

傅盛：用戶愿不愿意信任 AI 搜索，AI 產(chǎn)品能做出怎樣的體驗(yàn)非常非常關(guān)鍵。

比如秘塔搜索，在產(chǎn)品中，它生成的回答，會(huì)列出參考的資料，12345，列給你看，增強(qiáng)你的信任感。我看到有些競(jìng)品，也列了 12345，但實(shí)際上，引用的不是列出來的最新內(nèi)容。

秘塔搜索的深入模式（共有簡(jiǎn)潔、深入和研究三個(gè)模式）｜圖片來源：截圖

所以我覺得，用戶的信任，可能是需要通過不斷地通過品牌的行為，去強(qiáng)化和獲得的。

不產(chǎn)生幻覺，我覺得技術(shù)上是完全可以做到的。這時(shí)候就要看，是不是因?yàn)榇蠹易霎a(chǎn)品做的比較快，細(xì)節(jié)上做的不夠，另外任何搜索引擎，包括傳統(tǒng)搜索引擎，也會(huì)出現(xiàn)一些誤差，能不能把這個(gè)比率控制在不影響體驗(yàn)的范圍內(nèi)。

這也是我前面說，AI 搜索現(xiàn)在是比拼工程化、產(chǎn)品化的時(shí)候的原因。不是弄一堆文章過來，整理一下，就算做好了。

對(duì) AI 搜索引擎來說，其實(shí)用戶對(duì)于 AI 不信任的問題，反而是其次的。更多的是，如何去用 AI，滿足更多的搜索需求。

比如百分之八九十的搜索，可能不需要用到深度分析，我在傳統(tǒng)搜索引擎下，搜一下得到一個(gè)電話或者地址就好了。這可能是 AI 搜索需要解決的更大的問題。

不過長(zhǎng)期來說，所有的搜索，肯定都是 AI 搜索。包括傳統(tǒng)的搜索引擎，他們也在看，也在推出 AI 搜索的功能，大家最后肯定是殊途同歸的。

方漢：我認(rèn)為 AI 搜索首先是沒有幻覺問題的，因?yàn)閺募夹g(shù)原理上來說，它是先搜索再總結(jié)，然后再通過智能體去處理。在這個(gè)流程過程中，我們從源頭杜絕了這個(gè)欺詐的問題。

同時(shí)傳統(tǒng)搜索引擎，要列出更多網(wǎng)頁(yè)，需要保證這所有網(wǎng)頁(yè)都不是欺詐網(wǎng)頁(yè)。而我們只需要把這些網(wǎng)頁(yè)里面我們認(rèn)為最可靠的三個(gè)，互相交叉驗(yàn)證之后最可靠的三個(gè)的內(nèi)容進(jìn)行總結(jié)，展現(xiàn)在網(wǎng)頁(yè)上給用戶去看，那么一定是可靠性是增強(qiáng)了的。

我們都有能力鑒別一個(gè)網(wǎng)頁(yè)是不是欺詐，但并不是所有用戶都這樣。我們的父母輩，他們真的是沒有能力鑒別這一點(diǎn)的。天工搜索有合規(guī)小模型，反欺詐模型來篩選網(wǎng)頁(yè)，也會(huì)從 prompt 端優(yōu)化讓模型輸出多數(shù)網(wǎng)頁(yè)認(rèn)可的價(jià)值，那鑒別能力低的用戶用 AI 搜索，效果一定是正向的。

我們這些很熟悉技術(shù)的人，自己很熟悉傳統(tǒng)搜索，能夠主動(dòng)地去合適的網(wǎng)站找到合適的內(nèi)容，所以有時(shí)候覺得一部分需求好像 AI 搜索滿足不了。但我們不要忘記，AI 搜索從出現(xiàn)到現(xiàn)在也就一年多的時(shí)間，隨著時(shí)間的推移，我認(rèn)為 AI 搜索在體驗(yàn)、準(zhǔn)確性等問題上都會(huì)遠(yuǎn)遠(yuǎn)超過搜索引擎，

我們的用戶數(shù)據(jù)里看到，天工搜索的用戶的粘度是非常高的，非常信任我們。為什么？因?yàn)樗麄儠?huì)看我們給出的索引。

比如說體制內(nèi)的人用我們的搜索幫助寫公文，他會(huì)發(fā)現(xiàn)我們索引，引用的都是官方媒體的，他用了幾次之后就會(huì)非常信任我們，所以我認(rèn)為，信任會(huì)隨著時(shí)間的推移而逐漸增強(qiáng)。

天工 AI 搜索的研究模式（共有簡(jiǎn)潔、深入和研究三個(gè)模式）｜圖片來源：截圖

至于用戶群體，我剛才也提一下，new Bing 出現(xiàn)后，Bing 搜索引擎的市場(chǎng)份額只有小幅增加。那是因?yàn)樗?dāng)時(shí)的智能體的技術(shù)不成熟。

用戶上來就是搜一首歌、搜個(gè)電視劇、看個(gè)八卦什么的，我認(rèn)為這部分需求用智能體一定是可以解決得非常好的。

有了智能體的技術(shù)，用戶更多的長(zhǎng)尾需求可以得到滿足，那么我認(rèn)為用戶量的增長(zhǎng)是指日可待的。

我完整的經(jīng)歷了中國(guó)搜索引擎的發(fā)展過程。當(dāng)初百度搜索在那個(gè)北大燕園資源樓辦公的時(shí)候，我還去參觀過。其實(shí)最早用搜索引擎的人，也全是像我們這樣的一些技術(shù)極客，但慢慢的它就會(huì)泛化到全人群。我認(rèn)為 AI 搜索也是這樣。

現(xiàn)在使用我們 AI 搜索的主要用戶應(yīng)該還是白領(lǐng)用戶以及技術(shù)極客居多。隨著時(shí)間推移，AI 搜索也一定會(huì)逐漸被更多樣的人群使用。

AI 搜索的商業(yè)前景：成本低于 5 美分就能盈利

極客公園：傳統(tǒng)的搜索引擎，用戶免費(fèi)使用而 B 端投放廣告，形成了成熟的商業(yè)模式。AI 搜索中，用戶直接得到搜索結(jié)果，會(huì)不會(huì)改變商業(yè)模式？能夠盈利嗎？

方漢：上個(gè)時(shí)代的搜索成本，它首先有個(gè)固定開銷，就是你的爬蟲集群的開銷，這個(gè)爬蟲集群，如果索引全球的網(wǎng)頁(yè)的話，那基本上在 3, 000 臺(tái)服務(wù)器到 1 萬臺(tái)服務(wù)器之間，這是個(gè)固定開銷。

另外一部分成本就是做 page rank（網(wǎng)頁(yè)排名），這個(gè)服務(wù)器規(guī)模是更為龐大的，且是動(dòng)態(tài)開銷。你的用戶越多，你這個(gè)集群就需要越大。

在這兩個(gè)開銷之外，還有人員成本，還有保護(hù)費(fèi)的成本——比如說谷歌每年要給蘋果交錢，讓蘋果保留使用谷歌作為默認(rèn)搜索。

所有這些都加起來之后，谷歌每年搜索引擎查詢次數(shù)是 3.3 萬億次，單次搜索的成本是 0.2 美分。然后整個(gè)谷歌搜索廣告的收入是 1, 500 億美金左右，去年可能是 1, 600 億差不多，可以算出來差不多一次搜索產(chǎn)生的收入是 5 美分左右。

然后再跟大家說一個(gè)數(shù)字，OpenAI 早期的成本，注意不是現(xiàn)在的成本，早期的成本，一次對(duì)話的成本是 36 美分，就是你可以看到這里面有幾個(gè)數(shù)字差，36 美分、 5 美分、 0.2 美分。可以看出來，推理成本，是 AI 搜索商業(yè)模式中非常關(guān)鍵的因素。

我再跟大家分享另外一個(gè)數(shù)據(jù)，文生圖有一個(gè)開源模型，叫 Stable Diffusion。我記得非常清楚，在 2022 年的時(shí)候我開始使用它，當(dāng)時(shí)一張 4090 的卡平均是跑 3 分鐘出一張圖。今天我用 4090 還是同一張卡，我一秒鐘能出 100 張圖?？梢钥闯?，推理的優(yōu)化速度非?？臁Ｎ艺J(rèn)為跟摩爾定律是有點(diǎn)像的，推理成本的下降速度跟摩爾定律是一樣的，非?？?。

甚至未來，端側(cè)推理變得足夠成熟之后，在端側(cè)去做這件事情，幾乎不存在推理成本了。我認(rèn)為 AI 搜索商業(yè)模式應(yīng)該很快就可以打正，這只是一個(gè)時(shí)間問題。

在商業(yè)模式上來說，最基礎(chǔ)的 AI 搜索的商業(yè)模式，一定是靠廣告信息流，那么這個(gè)商業(yè)模式也是非常成熟的。實(shí)際上國(guó)內(nèi)的單個(gè)搜索，能夠收到的錢比國(guó)外高很多，但基本上也是在 5 美分或者是幾十美分這種量級(jí)，我們認(rèn)為這個(gè)東西短期內(nèi)也不會(huì)有太大的變化，所以我們也在一直優(yōu)化，一定要把我們的推理成本打到 5 美分以下，整個(gè)商業(yè)模式才會(huì)成立。

我認(rèn)為這個(gè)現(xiàn)在也不是特別難的事，這一天遲早會(huì)到來。

我們還會(huì)做智能體，智能體實(shí)際上屬于 VIP 服務(wù)了，還可以收到更高的費(fèi)用。

傅盛：在商業(yè)模式的問題上，首先每次搜索成本的價(jià)格必須降下來。

Transformer 那種大架構(gòu)，如果你千億參數(shù)，你每一個(gè)網(wǎng)頁(yè)你都送進(jìn)去喂一把，來一下上下文，那最后它就是很貴，搜索成本不降下來，你找用戶收錢，每月收你 100 塊錢，我還得限制你用多少次呢，商業(yè)模式就是算不過來賬。

秘塔搜索的創(chuàng)始人是獵豹移動(dòng)以前專門負(fù)責(zé) NLP 的首席科學(xué)家。秘塔搜索特別值得一提的是，他們做產(chǎn)品的時(shí)候，思路非常清晰，搜索成本一定不能高。

秘塔在搜索背后的這個(gè)模型，大概也就是百億參數(shù)，是自己訓(xùn)的一個(gè)模型，所以使得秘塔搜索的每次的搜索成本是非常低的。現(xiàn)在有的大模型，幾百萬字上下文，可能一次搜索的成本要幾十塊錢。

秘塔搜索的深入模式（共有簡(jiǎn)潔、深入和研究三個(gè)模式）｜圖片來源：截圖

我覺得由于需求的這個(gè)場(chǎng)景越來越明確，然后大家如果在這個(gè)網(wǎng)絡(luò)框架或者算法上去發(fā)力，整個(gè)行業(yè)一起努力，我覺得成本會(huì)降得很快，可能最后降到一個(gè)和傳統(tǒng)搜索成本差不多，或者稍微高一點(diǎn)點(diǎn)的水平，這是我個(gè)人一個(gè)判斷。

而真正未來的商業(yè)模式，也許是一個(gè)復(fù)合模式。比如秘塔搜索里面，有個(gè)功能叫深度分析，可能以后那種深度分析的功能就是會(huì)員享受的。具體的秘塔商業(yè)模式會(huì)怎么發(fā)展，我不能替創(chuàng)始人回答，只是一個(gè)想法。去年秘塔這個(gè)團(tuán)隊(duì)都是盈利的，它沒有像 AI 公司一樣去燒錢，是非常務(wù)實(shí)的團(tuán)隊(duì)。

極客公園：AI 搜索是創(chuàng)業(yè)者的好機(jī)會(huì)嗎？

傅盛：AI 搜索，我們叫大搜索創(chuàng)業(yè)，肯定不適合大部分創(chuàng)業(yè)者。競(jìng)爭(zhēng)對(duì)手都是巨頭，壓力很大。

其實(shí) AI 出現(xiàn)對(duì)搜索大廠本身是增強(qiáng)的。

為什么大家現(xiàn)在開始用小紅書搜索一些娛樂內(nèi)容，講難聽點(diǎn)，就是因?yàn)榻裉彀俣炔缓靡馑脊_地去抓人家不讓抓的數(shù)據(jù)。但有了 AI，大廠可以偷偷抓，變成自己的內(nèi)容吐出來，像是洗稿，那其實(shí)是增強(qiáng)了它的能力。

而且大廠其實(shí)不是沒有 AI 的能力，AI 的能力是傳統(tǒng)搜索團(tuán)隊(duì)的覆蓋范圍之內(nèi)的。傳統(tǒng)的搜索引擎公司，想做 AI 搜索，核心是成本問題，不是能力問題。創(chuàng)業(yè)者盡量不要去打人家火力范圍內(nèi)的事情。

對(duì)于大廠來說，它不著急。這波人工智能下，我認(rèn)為即使英偉達(dá)的股價(jià)泡沫破滅了，谷歌可能都是比較穩(wěn)的。它只要不斷地做 Gemini，等到整個(gè)商業(yè)模式變好了，再開始大力推。

只要大廠不犯重大錯(cuò)誤，大搜索格局上，很難有大的變化。

但是我覺得 AI 搜索的這個(gè)模式，對(duì)于很多垂類來說，是可以做的。隨著一些基礎(chǔ)技術(shù)和 AI 的普及，比起以前，創(chuàng)業(yè)者做一個(gè)垂類搜索的速度快了非常多。

搜索可以無處不在，它不一定要以一個(gè)大搜的形式存在，所以創(chuàng)業(yè)者可以考慮在你的各種產(chǎn)品當(dāng)中去加一些 AI 搜索模塊。因?yàn)?AI 搜索它整個(gè)的能力已經(jīng)上來了，成本也降下來了。做模塊可能比以前要簡(jiǎn)單得多、也會(huì)多得多。

方漢：首先我認(rèn)為 AI 搜索不是創(chuàng)業(yè)者一個(gè)好的方向。很簡(jiǎn)單，AI 搜索，如果你要想做到成本最低，你一定要自建搜索引擎索引庫(kù)，這個(gè)成本是非常高的，我不覺得一個(gè)小創(chuàng)業(yè)者能解決這個(gè)問題。

我們公司做這個(gè)事情是因?yàn)槲覀冊(cè)瓉碓诤Ｍ庾?Opera News 這個(gè)新聞推薦產(chǎn)品的時(shí)候，從 16 年開始就自建了一個(gè)比較小的一個(gè)搜索引擎，我們當(dāng)時(shí)每天大概索引 5, 000 萬個(gè)新聞網(wǎng)站，我們整個(gè) AI 搜索的引擎團(tuán)隊(duì)是一脈相承的，也就是說我們做這個(gè)搜索引擎的集群已經(jīng)做了有七八年了。

索引庫(kù)實(shí)際上就是爬蟲集群和存儲(chǔ)集群。比如有做個(gè)人站的，你能看到的個(gè)人站上，有幾個(gè)網(wǎng)站帶著 bot 的標(biāo)志來爬蟲你的個(gè)人站了，你就知道有哪幾個(gè)公司是有自己的爬蟲集群的。

這一塊其實(shí)是一個(gè)比較大的成本，因?yàn)槿绻銢]有的話，你就得去買第三方的服務(wù)，比如調(diào)用 Google 的或者是 Bing 的索引庫(kù)，給他們錢。那基本上，購(gòu)買第三方服務(wù)就可以把你所有的利潤(rùn)都吃完了。谷歌自己的成本是 0.2 美分，那你覺得它會(huì)賣你多少錢它覺得合適？

這個(gè)成本遠(yuǎn)比你的推理成本要高，而且推理成本在迅速地下降。

看未來的話，AI 搜索最后可能不會(huì)取代市場(chǎng)上的老大，但它有可能把市場(chǎng)上的老二老三給擠下來。

即使現(xiàn)在有谷歌搜索，其實(shí)同時(shí)仍然還有很多的搜索引擎。垂類的搜索引擎活得很好，比如 DuckDuckGo。我認(rèn)為這種引擎反而是未來受到威脅最大的。

另外我反復(fù)強(qiáng)調(diào)智能體，你的智能體如果能夠滿足一部分垂類用戶的需要，那你這個(gè) AI 搜索就能夠長(zhǎng)期存在，而這些特定領(lǐng)域，搜索巨頭未必能覆蓋的到。舉個(gè)例子，搜論文，谷歌做了一個(gè)學(xué)術(shù)搜索，但是在中國(guó)有知網(wǎng)，然后在海外還是有 Arxiv，垂類領(lǐng)域我們認(rèn)為 AI 搜索通過智能體的賦能空間還是非常大的。

天工 AI 的智能體廣場(chǎng) ｜圖片來源：截圖

極客公園：未來搜索這個(gè)形態(tài)本身，還有搜索的市場(chǎng)格局，會(huì)發(fā)生變化嗎？

方漢：一個(gè)比較少被討論的點(diǎn)是，在現(xiàn)在的搜索格局下，谷歌和百度這兩個(gè)搜索巨頭，都在自建內(nèi)容閉環(huán)。谷歌給 Wikipedia 捐了很多錢，20% 的流量落在 Wikipedia 上。百度有百度百科、問答等等。

大模型可能會(huì)完全顛覆內(nèi)容閉環(huán)這件事。Wikipedia、百科都需要人工編輯，只要需要人工編輯，維護(hù)成本就非常高，而目前看到，大模型是有機(jī)會(huì)自己去生成 Wikipedia 的。我覺得下一段時(shí)間 AI 搜索都會(huì)聚焦的一個(gè)方向，是內(nèi)容生成。

包括我們看到，微軟的新模型，是使用 GPT-4 生成的教科書來訓(xùn)練的。大模型現(xiàn)在已經(jīng)可以生成教科書了，雖然這個(gè)教科書用來訓(xùn)練模型，我們實(shí)際看到其實(shí)效果不太好，但仍然可以側(cè)面說明，我們離生成合成數(shù)據(jù)越來越近了。

傳統(tǒng)意義上的搜索，它只是一個(gè)很長(zhǎng)一段時(shí)間最適合我們獲取信息的一種方式。然后隨著大模型的進(jìn)步，隨著 AI 的進(jìn)步，我們認(rèn)為我們有能力給用戶提供更方便、更直接的這樣一個(gè)體驗(yàn)。只要你能夠讓用戶真正的省時(shí)間，真正的能提高準(zhǔn)確性，變方便，那么你的使用率自然會(huì)上升，你的留存自然會(huì)變好。

大家都現(xiàn)在都在卷模型的指標(biāo)。以后當(dāng)技術(shù)進(jìn)步放緩的時(shí)候，我認(rèn)為產(chǎn)品就會(huì)介入?，F(xiàn)在這一波 AI 創(chuàng)業(yè)中，產(chǎn)品的話語(yǔ)權(quán)是遠(yuǎn)遠(yuǎn)低于技術(shù)的，我認(rèn)為這個(gè)情況是不太正常的，長(zhǎng)期來看一定是改變世界的是產(chǎn)品。

未來的搜索市場(chǎng)份額，我認(rèn)為新產(chǎn)品一定是能拿到的。谷歌這樣的大公司，沉沒成本太高了，行動(dòng)速度一定是比新產(chǎn)品慢的。但是能不能守住這個(gè)市場(chǎng)份額，以及能不能顛覆這個(gè)市場(chǎng)，是不一定的。

2023 年搜索引擎市場(chǎng)份額｜圖片來源 YouTube Data Wrap可能顛覆市場(chǎng)的是做操作系統(tǒng)的，或者是做別的產(chǎn)品的公司，一下子降維打擊，把搜索引擎的市場(chǎng)搞沒了。端側(cè)推理和智能體，都可能帶來顛覆創(chuàng)新。

傅盛：五年之內(nèi)，搜索的形態(tài)可能會(huì)發(fā)生一些變化，可能真的會(huì)從一個(gè)純服務(wù)端的變成本地化的。意思是，我真的不再去打開一個(gè)網(wǎng)站了，我就在手機(jī)上問我的 Siri 就行了，每個(gè)回答給我 20 字，直接滿足我 90% 的需求。

我不知道這件事會(huì)不會(huì)真正發(fā)生。但是端上運(yùn)行的大模型，將變成一個(gè)非常重要的變量。像我剛才講的，搜索市場(chǎng)本身，在原來的格局下，我看不到第一名被顛覆會(huì)有很大可能性發(fā)生。234 名可能會(huì)有些變化，誰(shuí)在這個(gè) AI 上懟的快，可能市場(chǎng)份額就上去了。

但是我覺得，明年我們可能會(huì)看到一個(gè)結(jié)果，就是端側(cè)推理，會(huì)不會(huì)給整個(gè)搜索形態(tài)帶來重大的變化。蘋果六月份就要發(fā)布他們涉及到端上模型的方案。當(dāng)時(shí)財(cái)報(bào)會(huì)，有人問蘋果公司，你這么大一個(gè)公司，買 GPU、卡買的不夠多。

蘋果的回答是我們是混合模型，大模型我們用合作伙伴的，端側(cè)本地模型我們自己研發(fā)。它對(duì)本地模型是極度重視的。行業(yè)里現(xiàn)在已經(jīng)分兩派了。

OpenAI 那派推 7 萬億 GPU 小鎮(zhèn)，在擴(kuò)云端模型。而另一派，就是關(guān)注本地。微軟，到蘋果，到高通，現(xiàn)在都在推 AIPC 了。