OpenAI 為什么沒(méi)敢推AI搜索
本周,OpenAI 搞了一個(gè)大花活。
整整一周,不斷有外媒獲得最新消息,報(bào)道 OpenAI 即將推出搜索產(chǎn)品,甚至前幾天,已經(jīng)有媒體拿到了 ChatGPT Search 的提前體驗(yàn)版本——界面仍然是對(duì)話交互,但 GPT 回答時(shí)會(huì)使用網(wǎng)絡(luò)信息進(jìn)行回答。
不過(guò),在預(yù)熱了一整周后,5 月 11 日最新消息,OpenAI 在下周將舉行發(fā)布會(huì),但將不會(huì)發(fā)布 GPT-5,也不會(huì)發(fā)布 AI 搜索引擎。
AI 搜索目前是海內(nèi)外 AI 創(chuàng)業(yè)團(tuán)隊(duì)的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已經(jīng)超過(guò) 10 億美元。
OpenAI 為什么會(huì)選擇這個(gè)時(shí)間點(diǎn)做了一波這樣的宣傳?如果 OpenAI 真的入局搜索,會(huì)對(duì)搜索格局帶來(lái)什么影響嗎?對(duì)于創(chuàng)業(yè)者來(lái)說(shuō),AI 搜索是一個(gè)好的方向嗎?
5 月 10 日,極客公園創(chuàng)始人&總裁張鵬、推出國(guó)內(nèi)第一款融入大語(yǔ)言模型的搜索引擎-天工 AI 搜索的昆侖萬(wàn)維董事長(zhǎng)兼 CEO 方漢,和投資了最近幾個(gè)月數(shù)據(jù)飆升的秘塔搜索的獵豹移動(dòng)董事長(zhǎng)兼 CEO、獵戶星空董事長(zhǎng)傅盛,在極客公園「今夜科技談」的直播中,共同聊了聊這個(gè)話題。
兩位嘉賓都是經(jīng)驗(yàn)豐富,身經(jīng)百戰(zhàn)的創(chuàng)業(yè)者,在外媒傳出確切消息之前,就明確指出了 OpenAI 此次傳出要推出 AI 搜索引擎的消息,大概率并不是要在此投入巨大的精力,做成一項(xiàng)驚人的產(chǎn)品,而更多的是一場(chǎng) PR 戰(zhàn)術(shù)。
兩人共同對(duì) AI 搜索背后所需的技術(shù)儲(chǔ)備、AI 搜索的成本結(jié)構(gòu)和商業(yè)模式進(jìn)行了分析,并對(duì) AI 搜索的未來(lái)進(jìn)行了展望。
極客公園對(duì)此次直播進(jìn)行了整理,分享如下。
OpenAI 做搜索,能做出什么新的花樣?
極客公園:OpenAI 為什么在這個(gè)時(shí)間點(diǎn)上,傳出要推出搜索引擎?
傅盛:前天我和朱嘯虎一起參加了投中的論壇,他當(dāng)時(shí)有一個(gè)觀點(diǎn)就是覺(jué)得 OpenAI CEO Sam Altman 是一個(gè)非常能吹牛的人。我覺(jué)得無(wú)論怎么說(shuō),我們要意識(shí)到,Sam Altman 的 PR 能力確實(shí)是非常強(qiáng)的。
從歷史上來(lái)看,他每一次 PR 的時(shí)間點(diǎn)都拿捏地非常準(zhǔn)確。當(dāng)時(shí)發(fā)布 Sora 的時(shí)間點(diǎn),就是 Anthropic 的 Claude3 和其他幾個(gè)大模型上線的時(shí)刻。它們?cè)谖谋灸芰ι贤贿M(jìn)地很快,那 Altman 立即給你升維一下,說(shuō)你看你還在講陸軍的事,我都到空軍了,然后立即輿論又都在關(guān)注 Sora,OpenAI 又成了業(yè)界唯一的明星。
其實(shí)你現(xiàn)在回頭想想,Sora 從頭到尾就是一場(chǎng) PR,現(xiàn)在都五月了,還是沒(méi)有開(kāi)放給公眾使用。
傳聞中的 OpenAI Search 測(cè)試界面 | 圖片來(lái)源:賽博禪心
我的觀點(diǎn)是,GPT-5 的研發(fā),肯定遇到了一些問(wèn)題。如果不是這樣,直接上 GPT-5 就好了??萍计髽I(yè),永遠(yuǎn)都是能早一天就早一天,絕對(duì)不能晚的。GPT-5 要不就是性能沒(méi)有提升地那么驚艷,要么就是成本上特別高。
但以我對(duì) OpenAI 的理解,即使成本再高,只要效果特別驚艷,它一定會(huì)往外放,先震你一下再說(shuō),哪怕 GPT-5 一天就能用 5 條,那也讓你先用一下,讓所有的人的目光都過(guò)來(lái)。所以我覺(jué)得 GPT-5 的研發(fā)可能還是遇到了一些問(wèn)題,不管是成本,還是所謂安全性問(wèn)題,或者幻覺(jué)問(wèn)題,反正多少遇到了問(wèn)題。
作為 OpenAI 來(lái)說(shuō),現(xiàn)在這么燒錢(qián)的情況下,用戶量增長(zhǎng)就是它的核心命脈,一旦不增長(zhǎng),融資下筆錢(qián)的時(shí)候,估值上不能再上一個(gè)臺(tái)階,就會(huì)很麻煩。
所以我覺(jué)得這次說(shuō)要做搜索引擎,就是圍魏救趙,我最近經(jīng)常唱衰 OpenAI,因?yàn)槲矣X(jué)得,從一個(gè)商業(yè)公司角度,其實(shí) OpenAI 走到這里,現(xiàn)在有點(diǎn)騎虎難下。
方漢:我首先非常贊同傅盛老師一個(gè)觀點(diǎn),就是 Sam Altman 的確是一個(gè) PR 高手,而且是是絕頂高手。
我認(rèn)為在 OpenAI 里面,權(quán)力最大的其實(shí)是 PR 團(tuán)隊(duì),或者說(shuō)負(fù)責(zé)去融資的團(tuán)隊(duì),其次是技術(shù)團(tuán)隊(duì),再其次是產(chǎn)品團(tuán)隊(duì)。我認(rèn)為這個(gè)排序?qū)е铝?OpenAI 做出了種種行為。
GPT-4.5 和 GPT-5 為什么遲遲不發(fā)?根據(jù)我得到的消息,OpenAI 已經(jīng)訓(xùn)出來(lái)了,也不是能力不行,但是它現(xiàn)在沒(méi)有把握在工程上把這個(gè)東西效益最大化。
這個(gè)的意思是什么?剛才我們也聊到了,用戶漲不上去是 OpenAI 現(xiàn)在最頭疼的事情。如果發(fā)布了一個(gè)新的大模型,它沒(méi)有把握一次性、瞬間獲得足夠多的用戶,那它就不會(huì)上,這是它根本性的原因。
那么發(fā)搜索產(chǎn)品呢?我們目前看到的產(chǎn)品形態(tài)上來(lái)講,OpenAI 的搜索產(chǎn)品,并沒(méi)有對(duì)海內(nèi)外所有的搜索引擎產(chǎn)品,形成碾壓,形成 SOTA(state-of-the-art,最佳表現(xiàn)),發(fā)布這個(gè)產(chǎn)品,可能會(huì)讓用戶有一點(diǎn)增長(zhǎng),但不會(huì)讓用戶翻倍增長(zhǎng)。所以我認(rèn)為,這是在 Google I/O 前一周對(duì)谷歌的一次戰(zhàn)略狙擊,它的根本戰(zhàn)術(shù)上,還是在等待和籌備 GPT-4.5。
極客公園:OpenAI 如果推出搜索引擎,會(huì)解決 OpenAI 的什么問(wèn)題嗎?會(huì)使搜索引擎的格局有變化嗎?
方漢:我覺(jué)得它應(yīng)該能提升用戶使用上的體驗(yàn),但是對(duì)大盤(pán)影響不大。
最早 Bing 推出 new Bing 的時(shí)候,把谷歌都嚇?biāo)懒?,但最后?duì)于 Bing 的大盤(pán)其實(shí)沒(méi)有什么影響,谷歌過(guò)了半年一看市場(chǎng)份額好像沒(méi)什么變化。我覺(jué)得搜索引擎對(duì)于 OpenAI 的用戶增長(zhǎng)也不會(huì)有根本性的變化。
傅盛:我還沒(méi)看到它的具體頁(yè)面會(huì)是怎么設(shè)計(jì),但我覺(jué)得如果它變成一個(gè)默認(rèn)功能的話,還是多少會(huì)增加一些用戶的這個(gè)感知點(diǎn)的。未必是能帶來(lái)多少新用戶,但是老用戶的留存活躍這件事可能能夠變得好一點(diǎn)。
OpenAI Search 測(cè)試界面 | 圖片來(lái)源:賽博禪心
搜索這個(gè)功能,對(duì)于用戶日常將其從好玩,變成當(dāng)作生產(chǎn)力工具使用,是非常重要的。我其實(shí)之前一直不明白為什么 ChatGPT 在發(fā)布之初沒(méi)有增加這個(gè)功能,我懷疑,原因可能在于成本。
它本來(lái)成本已經(jīng)很高了,也一直在努力降成本。不加搜索時(shí),本來(lái)用戶問(wèn)一個(gè)問(wèn)題,然后模型去預(yù)測(cè)下一個(gè)字,都需要這么多推理成本。
如果加上搜索后,用戶問(wèn)一個(gè)問(wèn)題,你先去啪啪啪搞出幾十個(gè)網(wǎng)頁(yè),抓取下來(lái)幾千個(gè)字,傳給模型再讓模型總結(jié),那這個(gè)成本就高很多了。
極客公園:在部分灰度用戶的測(cè)評(píng)中,我們看到此次 OpenAI 所說(shuō)的搜索產(chǎn)品,其實(shí)產(chǎn)品形態(tài)和現(xiàn)有的搜索產(chǎn)品很接近。是不是 AI 搜索的產(chǎn)品形態(tài),沒(méi)有太多的創(chuàng)新空間了?
傅盛:現(xiàn)在這個(gè)形態(tài)的 AI 搜索,我覺(jué)得創(chuàng)新空間不大。
AI 搜索,是讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過(guò)程,而把這個(gè)過(guò)程用大模型,用 AI 去替你做這件事情。
這里面涉及兩個(gè)技術(shù)問(wèn)題,一個(gè)是把網(wǎng)頁(yè)收集回來(lái),一個(gè)是把網(wǎng)頁(yè)內(nèi)容傳遞給大模型讓大模型進(jìn)行總結(jié)。
前者涉及到要建立網(wǎng)頁(yè)索引庫(kù),而不是簡(jiǎn)單地去百度搜幾個(gè)網(wǎng)頁(yè),然后拿回來(lái)加工——百度肯定是不讓你這么干的。秘塔搜索也是自建了索引庫(kù)。而后者涉及到 AI 算法和模型能力。
我覺(jué)得形態(tài)上大家都是比較類似的,而從模型能力角度講,目前看來(lái),整理網(wǎng)頁(yè)內(nèi)容把它輸出出來(lái),需要的 AI 能力,其實(shí)也不是那么高,百億參數(shù)的模型已經(jīng)夠了,那后面就是涉及到,誰(shuí)能把工程化、產(chǎn)品化做的更好。
工程化是什么意思?
技術(shù),我們指的是算法啊等等的進(jìn)步。比如原來(lái)是用牛、馬來(lái)進(jìn)行運(yùn)輸,那我現(xiàn)在在算法層面,做出一個(gè)超級(jí)算法,相當(dāng)于我做了一個(gè)蒸汽機(jī),把這些東西統(tǒng)統(tǒng)搞定,仍然能保證有很強(qiáng)的運(yùn)載力。
而工程化,指的是,有時(shí)候現(xiàn)在沒(méi)有這么強(qiáng)的一個(gè)技術(shù)出來(lái),我們?cè)趺慈ザ喔闩!ⅠR,協(xié)調(diào)這一千頭牛、一萬(wàn)匹馬,來(lái)完成一件事,保證它不出錯(cuò)。
AI 搜索,現(xiàn)在雖然是大一統(tǒng)了,在很多細(xì)微的地方,就能看到不同的產(chǎn)品,是不一樣的。
PerplexityAI 的搜索界面 | 圖片來(lái)源:截圖
比如用戶在問(wèn)不同問(wèn)題的時(shí)候,看似在做同一件事,其實(shí)不同的搜索產(chǎn)品背后,會(huì)用不同的分類策略,對(duì)問(wèn)題先進(jìn)行分類。哪些問(wèn)題深度要求高,哪些問(wèn)題實(shí)時(shí)性要求高,再做對(duì)應(yīng)處理,不同的產(chǎn)品就會(huì)體現(xiàn)出區(qū)別。
再比如一個(gè)回答,是從知識(shí)庫(kù)里調(diào)出來(lái)只是進(jìn)行回答,還是純網(wǎng)頁(yè)的信息整合?那天我問(wèn)秘塔搜索,第三次世界大戰(zhàn)會(huì)不會(huì)打起來(lái)?你會(huì)發(fā)現(xiàn)它的回答,不完全是忠于網(wǎng)頁(yè)內(nèi)容做出來(lái)的報(bào)告,它給了我三種可能:打、不打、說(shuō)不清楚。但是同時(shí)它搜了很多網(wǎng)頁(yè),為選項(xiàng)做了支撐。這個(gè)如何保持一定的客觀性,分配權(quán)重,是很細(xì)的活。
再比如,AI 搜索引擎怎么去做排序?這也是一個(gè)點(diǎn),而且可能未來(lái)和傳統(tǒng)搜索引擎的點(diǎn)完全不一樣。比如傳統(tǒng)搜索引擎,一般不會(huì)把一篇很專業(yè)的,非常長(zhǎng)的論文,直接推到用戶面前。但是在 AI 搜索下,為了提供更準(zhǔn)確的回答,它在搜索引擎所依賴的背后內(nèi)容的排序上,可能反而是很靠前的。
所以我覺(jué)得,未來(lái) AI 搜索產(chǎn)品,拼的應(yīng)該不是誰(shuí)的技術(shù)特別牛,拼的是如何讓搜索結(jié)果能夠更忠于網(wǎng)頁(yè)內(nèi)容,如何做出更體系化的整理這種工程能力和產(chǎn)品設(shè)計(jì)能力。
方漢:我認(rèn)為現(xiàn)在的 AI 搜索的產(chǎn)品形態(tài)只是一個(gè)暫時(shí)的一個(gè)形式,為了讓傳統(tǒng)搜索引擎用戶,能夠很順暢地遷移到新形態(tài)的 AI 搜索上去。但是隨著技術(shù)和產(chǎn)品的迭代,我相信新的交互形式、新的產(chǎn)品形式都會(huì)在 AI 搜索上展現(xiàn)。
比如我們可以看到這次 OpenAI 的搜索 GPT,里面含了一個(gè)功能叫 wikis,我認(rèn)為可能就是用 GPTs 這種 agent(智能體)來(lái)實(shí)現(xiàn)的。在搜索的時(shí)候,可以調(diào)用各種各樣的模型解決用戶的問(wèn)題,將是 AI 搜索的上限所在。
也就是說(shuō),根據(jù)用戶的特定需求,我可以調(diào)用各種各樣的模型,我可以調(diào)用翻譯模型,我可以調(diào)用總結(jié)模型,我還可以調(diào)用 tts 模型,把它轉(zhuǎn)成語(yǔ)音輸送給你。如果用戶想在論文方向搜索,我專門(mén)做一個(gè)論文的智能體,調(diào)用這個(gè)智能體來(lái)回答你的問(wèn)題,這個(gè)上限我覺(jué)得是非常高的。
在我們的實(shí)踐過(guò)程中,我們的天工 AI 搜索里面已經(jīng)集成了大量的官方的制作的智能體來(lái)提升 AI 搜索的效果,且推理成本其實(shí)還是可控的。
但是我這里要吐槽一下 OpenAI。因?yàn)槲铱戳?OpenAI 的使用界面之后,我心里的想法是,他們的技術(shù)話語(yǔ)權(quán)遠(yuǎn)遠(yuǎn)超過(guò)產(chǎn)品的話語(yǔ)權(quán)。
search.chatgpt.com 的網(wǎng)頁(yè)存檔 目前該網(wǎng)站無(wú)法打開(kāi) | 圖片來(lái)源:X 用戶 Tibor Blaho
為什么這么說(shuō)?
它們的產(chǎn)品里,要搜索,首先要選模型,兩到三個(gè)模型,還要選是否使用圖像搜索等等,我覺(jué)得復(fù)雜度比谷歌還高。我一個(gè)做技術(shù)的人,我看沒(méi)有問(wèn)題,但很多用戶一定是用不明白的。他們的所有技術(shù)細(xì)節(jié)都沒(méi)有藏起來(lái),我開(kāi)個(gè)玩笑,這樣做產(chǎn)品的,在張小龍手下,一定活不到第二天。
所以總的來(lái)說(shuō),我認(rèn)為 AI 搜索的形態(tài)仍然有非常大的進(jìn)化空間,但具體怎么變,說(shuō)實(shí)話我也很難預(yù)測(cè)。
OpenAI 也沒(méi)有帶來(lái)太多產(chǎn)品形態(tài)方面的驚喜,最多就是這個(gè) GPTs,但我覺(jué)得在國(guó)內(nèi)的人看來(lái),比起我們熟悉的微信小程序什么的,看起來(lái)也還是挺落后的。
AI 搜索好在哪?從設(shè)計(jì)原理上解決幻覺(jué)問(wèn)題
極客公園:AI 搜索相對(duì)于傳統(tǒng)搜索引擎有哪些區(qū)別,有哪些優(yōu)勢(shì)?
方漢:傳統(tǒng)的搜索引擎是通過(guò)爬蟲(chóng),把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取回來(lái),然后經(jīng)過(guò)清洗跟排序,最后在用戶打出查詢?cè)~的時(shí)候,搜索引擎按照自己的邏輯,對(duì)網(wǎng)頁(yè)進(jìn)行排序,給到用戶。整個(gè)過(guò)程,用戶需要自己選點(diǎn)那個(gè)網(wǎng)頁(yè),點(diǎn)開(kāi)之后也要自主去看。
而 AI 搜索,讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過(guò)程,你直接看到的,就是它對(duì)現(xiàn)有網(wǎng)頁(yè)的一個(gè)總結(jié)結(jié)果,相當(dāng)于一個(gè)搜索小秘書(shū)。
它最大的作用是什么呢?是降低了用戶的搜索時(shí)間,以及提高準(zhǔn)確性。
我們都使用過(guò)傳統(tǒng)搜索引擎。要去打開(kāi)網(wǎng)頁(yè)看內(nèi)容,看完了靠人腦去總結(jié),耗時(shí)其實(shí)是蠻長(zhǎng)的,基本上都要幾分鐘,但現(xiàn)在大模型替你做這個(gè)事情,它可以在幾秒鐘之內(nèi)就可以給你一個(gè)總結(jié),基本上天工搜索的用戶基本上都會(huì)反映它極大地提高了大家的工作效率,甚至它一些總結(jié),包括腦圖 PPT 你可以直接用。
天工 AI 搜索的增強(qiáng)模式(共有簡(jiǎn)潔、增強(qiáng)、研究三個(gè)模式)| 圖片來(lái)源:截圖
在傳統(tǒng)搜索引擎中,最早谷歌搜索引擎除了搜索按鈕以外,還有另外一個(gè)按鈕 I feel lucky,點(diǎn)一下就直接進(jìn)入第一個(gè)搜索結(jié)果,實(shí)際上是傳統(tǒng)搜索引擎降低交付的走成本的一個(gè)嘗試。本質(zhì)上我們現(xiàn)在所有的 AI 搜索就是 I feel lucky 那個(gè)按鈕所起到的作用,只不過(guò)我們做的比他們要好得多。
另外就是準(zhǔn)確性。AI 搜索解決了大模型的幻覺(jué)問(wèn)題。大家一開(kāi)始用 ChatGPT,其實(shí)很多人是把它當(dāng)搜索引擎用的,但實(shí)際上它是會(huì)經(jīng)常一本正經(jīng)的胡說(shuō)八道。AI 搜索通過(guò) RAG 這些技術(shù),先找到事實(shí),12345,限制大模型根據(jù)以上事實(shí)來(lái)回答問(wèn)題,能極大地抑制甚至徹底消除大模型的幻覺(jué)。
傅盛:我們一定要意識(shí)到一點(diǎn),就是搜索用戶在搜索的時(shí)候,其實(shí)抱著非常多的目的。有的搜索,就是尋址,我懶得記一個(gè)網(wǎng)頁(yè)的網(wǎng)址,我要去那個(gè)網(wǎng)頁(yè),我就去搜索引擎上搜索一下。不知道大家知不知道,以前百度搜索的第一名,是 Hao123,是一個(gè)匯集其他網(wǎng)址的導(dǎo)航網(wǎng)站。
還有一些搜索,只需要一些及時(shí)的簡(jiǎn)單內(nèi)容,這種也不太需要 AI 搜索。我覺(jué)得現(xiàn)在的 AI 搜索,更側(cè)重于一些特定的搜索需求——在一個(gè)相對(duì)復(fù)雜的問(wèn)題下,對(duì)網(wǎng)絡(luò)上的結(jié)果進(jìn)行綜合分析,更偏向于形成某個(gè)東西的一份調(diào)查報(bào)告那種感覺(jué)。
秘塔搜索的研究模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來(lái)源:截圖
當(dāng)然它從客觀上克服了幻覺(jué)的問(wèn)題,但理解 AI 搜索,一個(gè)更好的理解是把它理解為個(gè)大模型的一個(gè)非常垂類的場(chǎng)景,大模型作為主力,去幫我研究一下比如新能源車(chē)最近價(jià)格是如何變化的,這個(gè)助理就幫你去在搜索引擎上找了一堆的文章,然后給你整理了一份報(bào)告。
極客公園:用戶愿意信任 AI 搜索嗎?AI 搜索是不是只是一小波用戶的需求,而不是一個(gè)大眾需求?
傅盛:用戶愿不愿意信任 AI 搜索,AI 產(chǎn)品能做出怎樣的體驗(yàn)非常非常關(guān)鍵。
比如秘塔搜索,在產(chǎn)品中,它生成的回答,會(huì)列出參考的資料,12345,列給你看,增強(qiáng)你的信任感。我看到有些競(jìng)品,也列了 12345,但實(shí)際上,引用的不是列出來(lái)的最新內(nèi)容。
秘塔搜索的深入模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來(lái)源:截圖
所以我覺(jué)得,用戶的信任,可能是需要通過(guò)不斷地通過(guò)品牌的行為,去強(qiáng)化和獲得的。
不產(chǎn)生幻覺(jué),我覺(jué)得技術(shù)上是完全可以做到的。這時(shí)候就要看,是不是因?yàn)榇蠹易霎a(chǎn)品做的比較快,細(xì)節(jié)上做的不夠,另外任何搜索引擎,包括傳統(tǒng)搜索引擎,也會(huì)出現(xiàn)一些誤差,能不能把這個(gè)比率控制在不影響體驗(yàn)的范圍內(nèi)。
這也是我前面說(shuō),AI 搜索現(xiàn)在是比拼工程化、產(chǎn)品化的時(shí)候的原因。不是弄一堆文章過(guò)來(lái),整理一下,就算做好了。
對(duì) AI 搜索引擎來(lái)說(shuō),其實(shí)用戶對(duì)于 AI 不信任的問(wèn)題,反而是其次的。更多的是,如何去用 AI,滿足更多的搜索需求。
比如百分之八九十的搜索,可能不需要用到深度分析,我在傳統(tǒng)搜索引擎下,搜一下得到一個(gè)電話或者地址就好了。這可能是 AI 搜索需要解決的更大的問(wèn)題。
不過(guò)長(zhǎng)期來(lái)說(shuō),所有的搜索,肯定都是 AI 搜索。包括傳統(tǒng)的搜索引擎,他們也在看,也在推出 AI 搜索的功能,大家最后肯定是殊途同歸的。
方漢:我認(rèn)為 AI 搜索首先是沒(méi)有幻覺(jué)問(wèn)題的,因?yàn)閺募夹g(shù)原理上來(lái)說(shuō),它是先搜索再總結(jié),然后再通過(guò)智能體去處理。在這個(gè)流程過(guò)程中,我們從源頭杜絕了這個(gè)欺詐的問(wèn)題。
同時(shí)傳統(tǒng)搜索引擎,要列出更多網(wǎng)頁(yè),需要保證這所有網(wǎng)頁(yè)都不是欺詐網(wǎng)頁(yè)。而我們只需要把這些網(wǎng)頁(yè)里面我們認(rèn)為最可靠的三個(gè),互相交叉驗(yàn)證之后最可靠的三個(gè)的內(nèi)容進(jìn)行總結(jié),展現(xiàn)在網(wǎng)頁(yè)上給用戶去看,那么一定是可靠性是增強(qiáng)了的。
我們都有能力鑒別一個(gè)網(wǎng)頁(yè)是不是欺詐,但并不是所有用戶都這樣。我們的父母輩,他們真的是沒(méi)有能力鑒別這一點(diǎn)的。天工搜索有合規(guī)小模型,反欺詐模型來(lái)篩選網(wǎng)頁(yè),也會(huì)從 prompt 端優(yōu)化讓模型輸出多數(shù)網(wǎng)頁(yè)認(rèn)可的價(jià)值,那鑒別能力低的用戶用 AI 搜索,效果一定是正向的。
我們這些很熟悉技術(shù)的人,自己很熟悉傳統(tǒng)搜索,能夠主動(dòng)地去合適的網(wǎng)站找到合適的內(nèi)容,所以有時(shí)候覺(jué)得一部分需求好像 AI 搜索滿足不了。但我們不要忘記,AI 搜索從出現(xiàn)到現(xiàn)在也就一年多的時(shí)間,隨著時(shí)間的推移,我認(rèn)為 AI 搜索在體驗(yàn)、準(zhǔn)確性等問(wèn)題上都會(huì)遠(yuǎn)遠(yuǎn)超過(guò)搜索引擎,
我們的用戶數(shù)據(jù)里看到,天工搜索的用戶的粘度是非常高的,非常信任我們。為什么?因?yàn)樗麄儠?huì)看我們給出的索引。
比如說(shuō)體制內(nèi)的人用我們的搜索幫助寫(xiě)公文,他會(huì)發(fā)現(xiàn)我們索引,引用的都是官方媒體的,他用了幾次之后就會(huì)非常信任我們,所以我認(rèn)為,信任會(huì)隨著時(shí)間的推移而逐漸增強(qiáng)。
天工 AI 搜索的研究模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來(lái)源:截圖
至于用戶群體,我剛才也提一下,new Bing 出現(xiàn)后,Bing 搜索引擎的市場(chǎng)份額只有小幅增加。那是因?yàn)樗?dāng)時(shí)的智能體的技術(shù)不成熟。
用戶上來(lái)就是搜一首歌、搜個(gè)電視劇、看個(gè)八卦什么的,我認(rèn)為這部分需求用智能體一定是可以解決得非常好的。
有了智能體的技術(shù),用戶更多的長(zhǎng)尾需求可以得到滿足,那么我認(rèn)為用戶量的增長(zhǎng)是指日可待的。
我完整的經(jīng)歷了中國(guó)搜索引擎的發(fā)展過(guò)程。當(dāng)初百度搜索在那個(gè)北大燕園資源樓辦公的時(shí)候,我還去參觀過(guò)。其實(shí)最早用搜索引擎的人,也全是像我們這樣的一些技術(shù)極客,但慢慢的它就會(huì)泛化到全人群。我認(rèn)為 AI 搜索也是這樣。
現(xiàn)在使用我們 AI 搜索的主要用戶應(yīng)該還是白領(lǐng)用戶以及技術(shù)極客居多。隨著時(shí)間推移,AI 搜索也一定會(huì)逐漸被更多樣的人群使用。
AI 搜索的商業(yè)前景:成本低于 5 美分就能盈利
極客公園:傳統(tǒng)的搜索引擎,用戶免費(fèi)使用而 B 端投放廣告,形成了成熟的商業(yè)模式。AI 搜索中,用戶直接得到搜索結(jié)果,會(huì)不會(huì)改變商業(yè)模式?能夠盈利嗎?
方漢:上個(gè)時(shí)代的搜索成本,它首先有個(gè)固定開(kāi)銷(xiāo),就是你的爬蟲(chóng)集群的開(kāi)銷(xiāo),這個(gè)爬蟲(chóng)集群,如果索引全球的網(wǎng)頁(yè)的話,那基本上在 3, 000 臺(tái)服務(wù)器到 1 萬(wàn)臺(tái)服務(wù)器之間,這是個(gè)固定開(kāi)銷(xiāo)。
另外一部分成本就是做 page rank(網(wǎng)頁(yè)排名),這個(gè)服務(wù)器規(guī)模是更為龐大的,且是動(dòng)態(tài)開(kāi)銷(xiāo)。你的用戶越多,你這個(gè)集群就需要越大。
在這兩個(gè)開(kāi)銷(xiāo)之外,還有人員成本,還有保護(hù)費(fèi)的成本——比如說(shuō)谷歌每年要給蘋(píng)果交錢(qián),讓蘋(píng)果保留使用谷歌作為默認(rèn)搜索。
所有這些都加起來(lái)之后,谷歌每年搜索引擎查詢次數(shù)是 3.3 萬(wàn)億次,單次搜索的成本是 0.2 美分。然后整個(gè)谷歌搜索廣告的收入是 1, 500 億美金左右,去年可能是 1, 600 億差不多,可以算出來(lái)差不多一次搜索產(chǎn)生的收入是 5 美分左右。
然后再跟大家說(shuō)一個(gè)數(shù)字,OpenAI 早期的成本,注意不是現(xiàn)在的成本,早期的成本,一次對(duì)話的成本是 36 美分,就是你可以看到這里面有幾個(gè)數(shù)字差,36 美分、 5 美分、 0.2 美分。可以看出來(lái),推理成本,是 AI 搜索商業(yè)模式中非常關(guān)鍵的因素。
我再跟大家分享另外一個(gè)數(shù)據(jù),文生圖有一個(gè)開(kāi)源模型,叫 Stable Diffusion。我記得非常清楚,在 2022 年的時(shí)候我開(kāi)始使用它,當(dāng)時(shí)一張 4090 的卡平均是跑 3 分鐘出一張圖。今天我用 4090 還是同一張卡,我一秒鐘能出 100 張圖??梢钥闯觯评淼膬?yōu)化速度非??臁N艺J(rèn)為跟摩爾定律是有點(diǎn)像的,推理成本的下降速度跟摩爾定律是一樣的,非??臁?/p>
甚至未來(lái),端側(cè)推理變得足夠成熟之后,在端側(cè)去做這件事情,幾乎不存在推理成本了。我認(rèn)為 AI 搜索商業(yè)模式應(yīng)該很快就可以打正,這只是一個(gè)時(shí)間問(wèn)題。
在商業(yè)模式上來(lái)說(shuō),最基礎(chǔ)的 AI 搜索的商業(yè)模式,一定是靠廣告信息流,那么這個(gè)商業(yè)模式也是非常成熟的。實(shí)際上國(guó)內(nèi)的單個(gè)搜索,能夠收到的錢(qián)比國(guó)外高很多,但基本上也是在 5 美分或者是幾十美分這種量級(jí),我們認(rèn)為這個(gè)東西短期內(nèi)也不會(huì)有太大的變化,所以我們也在一直優(yōu)化,一定要把我們的推理成本打到 5 美分以下,整個(gè)商業(yè)模式才會(huì)成立。
我認(rèn)為這個(gè)現(xiàn)在也不是特別難的事,這一天遲早會(huì)到來(lái)。
我們還會(huì)做智能體,智能體實(shí)際上屬于 VIP 服務(wù)了,還可以收到更高的費(fèi)用。
傅盛:在商業(yè)模式的問(wèn)題上,首先每次搜索成本的價(jià)格必須降下來(lái)。
Transformer 那種大架構(gòu),如果你千億參數(shù),你每一個(gè)網(wǎng)頁(yè)你都送進(jìn)去喂一把,來(lái)一下上下文,那最后它就是很貴,搜索成本不降下來(lái),你找用戶收錢(qián),每月收你 100 塊錢(qián),我還得限制你用多少次呢,商業(yè)模式就是算不過(guò)來(lái)賬。
秘塔搜索的創(chuàng)始人是獵豹移動(dòng)以前專門(mén)負(fù)責(zé) NLP 的首席科學(xué)家。秘塔搜索特別值得一提的是,他們做產(chǎn)品的時(shí)候,思路非常清晰,搜索成本一定不能高。
秘塔在搜索背后的這個(gè)模型,大概也就是百億參數(shù),是自己訓(xùn)的一個(gè)模型,所以使得秘塔搜索的每次的搜索成本是非常低的?,F(xiàn)在有的大模型,幾百萬(wàn)字上下文,可能一次搜索的成本要幾十塊錢(qián)。
秘塔搜索的深入模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來(lái)源:截圖
我覺(jué)得由于需求的這個(gè)場(chǎng)景越來(lái)越明確,然后大家如果在這個(gè)網(wǎng)絡(luò)框架或者算法上去發(fā)力,整個(gè)行業(yè)一起努力,我覺(jué)得成本會(huì)降得很快,可能最后降到一個(gè)和傳統(tǒng)搜索成本差不多,或者稍微高一點(diǎn)點(diǎn)的水平,這是我個(gè)人一個(gè)判斷。
而真正未來(lái)的商業(yè)模式,也許是一個(gè)復(fù)合模式。比如秘塔搜索里面,有個(gè)功能叫深度分析,可能以后那種深度分析的功能就是會(huì)員享受的。具體的秘塔商業(yè)模式會(huì)怎么發(fā)展,我不能替創(chuàng)始人回答,只是一個(gè)想法。去年秘塔這個(gè)團(tuán)隊(duì)都是盈利的,它沒(méi)有像 AI 公司一樣去燒錢(qián),是非常務(wù)實(shí)的團(tuán)隊(duì)。
極客公園:AI 搜索是創(chuàng)業(yè)者的好機(jī)會(huì)嗎?
傅盛:AI 搜索,我們叫大搜索創(chuàng)業(yè),肯定不適合大部分創(chuàng)業(yè)者。競(jìng)爭(zhēng)對(duì)手都是巨頭,壓力很大。
其實(shí) AI 出現(xiàn)對(duì)搜索大廠本身是增強(qiáng)的。
為什么大家現(xiàn)在開(kāi)始用小紅書(shū)搜索一些娛樂(lè)內(nèi)容,講難聽(tīng)點(diǎn),就是因?yàn)榻裉彀俣炔缓靡馑脊_(kāi)地去抓人家不讓抓的數(shù)據(jù)。但有了 AI,大廠可以偷偷抓,變成自己的內(nèi)容吐出來(lái),像是洗稿,那其實(shí)是增強(qiáng)了它的能力。
而且大廠其實(shí)不是沒(méi)有 AI 的能力,AI 的能力是傳統(tǒng)搜索團(tuán)隊(duì)的覆蓋范圍之內(nèi)的。傳統(tǒng)的搜索引擎公司,想做 AI 搜索,核心是成本問(wèn)題,不是能力問(wèn)題。創(chuàng)業(yè)者盡量不要去打人家火力范圍內(nèi)的事情。
對(duì)于大廠來(lái)說(shuō),它不著急。這波人工智能下,我認(rèn)為即使英偉達(dá)的股價(jià)泡沫破滅了,谷歌可能都是比較穩(wěn)的。它只要不斷地做 Gemini,等到整個(gè)商業(yè)模式變好了,再開(kāi)始大力推。
只要大廠不犯重大錯(cuò)誤,大搜索格局上,很難有大的變化。
但是我覺(jué)得 AI 搜索的這個(gè)模式,對(duì)于很多垂類來(lái)說(shuō),是可以做的。隨著一些基礎(chǔ)技術(shù)和 AI 的普及,比起以前,創(chuàng)業(yè)者做一個(gè)垂類搜索的速度快了非常多。
搜索可以無(wú)處不在,它不一定要以一個(gè)大搜的形式存在,所以創(chuàng)業(yè)者可以考慮在你的各種產(chǎn)品當(dāng)中去加一些 AI 搜索模塊。因?yàn)?AI 搜索它整個(gè)的能力已經(jīng)上來(lái)了,成本也降下來(lái)了。做模塊可能比以前要簡(jiǎn)單得多、也會(huì)多得多。
方漢:首先我認(rèn)為 AI 搜索不是創(chuàng)業(yè)者一個(gè)好的方向。很簡(jiǎn)單,AI 搜索,如果你要想做到成本最低,你一定要自建搜索引擎索引庫(kù),這個(gè)成本是非常高的,我不覺(jué)得一個(gè)小創(chuàng)業(yè)者能解決這個(gè)問(wèn)題。
我們公司做這個(gè)事情是因?yàn)槲覀冊(cè)瓉?lái)在海外做 Opera News 這個(gè)新聞推薦產(chǎn)品的時(shí)候,從 16 年開(kāi)始就自建了一個(gè)比較小的一個(gè)搜索引擎,我們當(dāng)時(shí)每天大概索引 5, 000 萬(wàn)個(gè)新聞網(wǎng)站,我們整個(gè) AI 搜索的引擎團(tuán)隊(duì)是一脈相承的,也就是說(shuō)我們做這個(gè)搜索引擎的集群已經(jīng)做了有七八年了。
索引庫(kù)實(shí)際上就是爬蟲(chóng)集群和存儲(chǔ)集群。比如有做個(gè)人站的,你能看到的個(gè)人站上,有幾個(gè)網(wǎng)站帶著 bot 的標(biāo)志來(lái)爬蟲(chóng)你的個(gè)人站了,你就知道有哪幾個(gè)公司是有自己的爬蟲(chóng)集群的。
這一塊其實(shí)是一個(gè)比較大的成本,因?yàn)槿绻銢](méi)有的話,你就得去買(mǎi)第三方的服務(wù),比如調(diào)用 Google 的或者是 Bing 的索引庫(kù),給他們錢(qián)。那基本上,購(gòu)買(mǎi)第三方服務(wù)就可以把你所有的利潤(rùn)都吃完了。谷歌自己的成本是 0.2 美分,那你覺(jué)得它會(huì)賣(mài)你多少錢(qián)它覺(jué)得合適?
這個(gè)成本遠(yuǎn)比你的推理成本要高,而且推理成本在迅速地下降。
看未來(lái)的話,AI 搜索最后可能不會(huì)取代市場(chǎng)上的老大,但它有可能把市場(chǎng)上的老二老三給擠下來(lái)。
即使現(xiàn)在有谷歌搜索,其實(shí)同時(shí)仍然還有很多的搜索引擎。垂類的搜索引擎活得很好,比如 DuckDuckGo。我認(rèn)為這種引擎反而是未來(lái)受到威脅最大的。
另外我反復(fù)強(qiáng)調(diào)智能體,你的智能體如果能夠滿足一部分垂類用戶的需要,那你這個(gè) AI 搜索就能夠長(zhǎng)期存在,而這些特定領(lǐng)域,搜索巨頭未必能覆蓋的到。舉個(gè)例子,搜論文,谷歌做了一個(gè)學(xué)術(shù)搜索,但是在中國(guó)有知網(wǎng),然后在海外還是有 Arxiv,垂類領(lǐng)域我們認(rèn)為 AI 搜索通過(guò)智能體的賦能空間還是非常大的。
天工 AI 的智能體廣場(chǎng) | 圖片來(lái)源:截圖
極客公園:未來(lái)搜索這個(gè)形態(tài)本身,還有搜索的市場(chǎng)格局,會(huì)發(fā)生變化嗎?
方漢:一個(gè)比較少被討論的點(diǎn)是,在現(xiàn)在的搜索格局下,谷歌和百度這兩個(gè)搜索巨頭,都在自建內(nèi)容閉環(huán)。谷歌給 Wikipedia 捐了很多錢(qián),20% 的流量落在 Wikipedia 上。百度有百度百科、問(wèn)答等等。
大模型可能會(huì)完全顛覆內(nèi)容閉環(huán)這件事。Wikipedia、百科都需要人工編輯,只要需要人工編輯,維護(hù)成本就非常高,而目前看到,大模型是有機(jī)會(huì)自己去生成 Wikipedia 的。我覺(jué)得下一段時(shí)間 AI 搜索都會(huì)聚焦的一個(gè)方向,是內(nèi)容生成。
包括我們看到,微軟的新模型,是使用 GPT-4 生成的教科書(shū)來(lái)訓(xùn)練的。大模型現(xiàn)在已經(jīng)可以生成教科書(shū)了,雖然這個(gè)教科書(shū)用來(lái)訓(xùn)練模型,我們實(shí)際看到其實(shí)效果不太好,但仍然可以側(cè)面說(shuō)明,我們離生成合成數(shù)據(jù)越來(lái)越近了。
傳統(tǒng)意義上的搜索,它只是一個(gè)很長(zhǎng)一段時(shí)間最適合我們獲取信息的一種方式。然后隨著大模型的進(jìn)步,隨著 AI 的進(jìn)步,我們認(rèn)為我們有能力給用戶提供更方便、更直接的這樣一個(gè)體驗(yàn)。只要你能夠讓用戶真正的省時(shí)間,真正的能提高準(zhǔn)確性,變方便,那么你的使用率自然會(huì)上升,你的留存自然會(huì)變好。
大家都現(xiàn)在都在卷模型的指標(biāo)。以后當(dāng)技術(shù)進(jìn)步放緩的時(shí)候,我認(rèn)為產(chǎn)品就會(huì)介入。現(xiàn)在這一波 AI 創(chuàng)業(yè)中,產(chǎn)品的話語(yǔ)權(quán)是遠(yuǎn)遠(yuǎn)低于技術(shù)的,我認(rèn)為這個(gè)情況是不太正常的,長(zhǎng)期來(lái)看一定是改變世界的是產(chǎn)品。
未來(lái)的搜索市場(chǎng)份額,我認(rèn)為新產(chǎn)品一定是能拿到的。谷歌這樣的大公司,沉沒(méi)成本太高了,行動(dòng)速度一定是比新產(chǎn)品慢的。但是能不能守住這個(gè)市場(chǎng)份額,以及能不能顛覆這個(gè)市場(chǎng),是不一定的。
2023 年搜索引擎市場(chǎng)份額 |圖片來(lái)源 YouTube Data Wrap可能顛覆市場(chǎng)的是做操作系統(tǒng)的,或者是做別的產(chǎn)品的公司,一下子降維打擊,把搜索引擎的市場(chǎng)搞沒(méi)了。端側(cè)推理和智能體,都可能帶來(lái)顛覆創(chuàng)新。
傅盛:五年之內(nèi),搜索的形態(tài)可能會(huì)發(fā)生一些變化,可能真的會(huì)從一個(gè)純服務(wù)端的變成本地化的。意思是,我真的不再去打開(kāi)一個(gè)網(wǎng)站了,我就在手機(jī)上問(wèn)我的 Siri 就行了,每個(gè)回答給我 20 字,直接滿足我 90% 的需求。
我不知道這件事會(huì)不會(huì)真正發(fā)生。但是端上運(yùn)行的大模型,將變成一個(gè)非常重要的變量。像我剛才講的,搜索市場(chǎng)本身,在原來(lái)的格局下,我看不到第一名被顛覆會(huì)有很大可能性發(fā)生。234 名可能會(huì)有些變化,誰(shuí)在這個(gè) AI 上懟的快,可能市場(chǎng)份額就上去了。
但是我覺(jué)得,明年我們可能會(huì)看到一個(gè)結(jié)果,就是端側(cè)推理,會(huì)不會(huì)給整個(gè)搜索形態(tài)帶來(lái)重大的變化。蘋(píng)果六月份就要發(fā)布他們涉及到端上模型的方案。當(dāng)時(shí)財(cái)報(bào)會(huì),有人問(wèn)蘋(píng)果公司,你這么大一個(gè)公司,買(mǎi) GPU、卡買(mǎi)的不夠多。
蘋(píng)果的回答是我們是混合模型,大模型我們用合作伙伴的,端側(cè)本地模型我們自己研發(fā)。它對(duì)本地模型是極度重視的。行業(yè)里現(xiàn)在已經(jīng)分兩派了。
OpenAI 那派推 7 萬(wàn)億 GPU 小鎮(zhèn),在擴(kuò)云端模型。而另一派,就是關(guān)注本地。微軟,到蘋(píng)果,到高通,現(xiàn)在都在推 AIPC 了。
我覺(jué)得其實(shí)第二派會(huì)更快地到來(lái)。有可能你的電腦以后就是一個(gè)搜索引擎了,那我覺(jué)得這個(gè)可能對(duì)搜索引擎的模式是完全的顛覆。
我本地一個(gè) APP,到百度抓五六個(gè)網(wǎng)頁(yè),自己回來(lái)做分析。你說(shuō)百度不讓我抓?這個(gè)沒(méi)辦法不讓抓,你也分辨不出來(lái),我就是一個(gè)用戶。那到時(shí)候,搜索引擎的整個(gè)商業(yè)模式就完全沒(méi)法成立了。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com