玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

您當(dāng)前的位置: 首頁(yè) > 新聞 > 健康

OpenAI 為什么沒敢推AI搜索

來源:極客公園   編輯:非小米 時(shí)間:2024-05-13 07:42人閱讀

本周,OpenAI 搞了一個(gè)大花活。

整整一周,不斷有外媒獲得最新消息,報(bào)道 OpenAI 即將推出搜索產(chǎn)品,甚至前幾天,已經(jīng)有媒體拿到了 ChatGPT Search 的提前體驗(yàn)版本——界面仍然是對(duì)話交互,但 GPT 回答時(shí)會(huì)使用網(wǎng)絡(luò)信息進(jìn)行回答。

不過,在預(yù)熱了一整周后,5 月 11 日最新消息,OpenAI 在下周將舉行發(fā)布會(huì),但將不會(huì)發(fā)布 GPT-5,也不會(huì)發(fā)布 AI 搜索引擎。

AI 搜索目前是海內(nèi)外 AI 創(chuàng)業(yè)團(tuán)隊(duì)的重要方向之一。在海外,主打 AI 搜索的 Perplexity 目前估值已經(jīng)超過 10 億美元。

OpenAI 為什么會(huì)選擇這個(gè)時(shí)間點(diǎn)做了一波這樣的宣傳?如果 OpenAI 真的入局搜索,會(huì)對(duì)搜索格局帶來什么影響嗎?對(duì)于創(chuàng)業(yè)者來說,AI 搜索是一個(gè)好的方向嗎?

5 月 10 日,極客公園創(chuàng)始人&總裁張鵬、推出國(guó)內(nèi)第一款融入大語(yǔ)言模型的搜索引擎-天工 AI 搜索的昆侖萬維董事長(zhǎng)兼 CEO 方漢,和投資了最近幾個(gè)月數(shù)據(jù)飆升的秘塔搜索的獵豹移動(dòng)董事長(zhǎng)兼 CEO、獵戶星空董事長(zhǎng)傅盛,在極客公園「今夜科技談」的直播中,共同聊了聊這個(gè)話題。

兩位嘉賓都是經(jīng)驗(yàn)豐富,身經(jīng)百戰(zhàn)的創(chuàng)業(yè)者,在外媒傳出確切消息之前,就明確指出了 OpenAI 此次傳出要推出 AI 搜索引擎的消息,大概率并不是要在此投入巨大的精力,做成一項(xiàng)驚人的產(chǎn)品,而更多的是一場(chǎng) PR 戰(zhàn)術(shù)。

兩人共同對(duì) AI 搜索背后所需的技術(shù)儲(chǔ)備、AI 搜索的成本結(jié)構(gòu)和商業(yè)模式進(jìn)行了分析,并對(duì) AI 搜索的未來進(jìn)行了展望。

極客公園對(duì)此次直播進(jìn)行了整理,分享如下。

OpenAI 做搜索,能做出什么新的花樣?

極客公園:OpenAI 為什么在這個(gè)時(shí)間點(diǎn)上,傳出要推出搜索引擎?

傅盛:前天我和朱嘯虎一起參加了投中的論壇,他當(dāng)時(shí)有一個(gè)觀點(diǎn)就是覺得 OpenAI CEO Sam Altman 是一個(gè)非常能吹牛的人。我覺得無論怎么說,我們要意識(shí)到,Sam Altman 的 PR 能力確實(shí)是非常強(qiáng)的。

從歷史上來看,他每一次 PR 的時(shí)間點(diǎn)都拿捏地非常準(zhǔn)確。當(dāng)時(shí)發(fā)布 Sora 的時(shí)間點(diǎn),就是 Anthropic 的 Claude3 和其他幾個(gè)大模型上線的時(shí)刻。它們?cè)谖谋灸芰ι贤贿M(jìn)地很快,那 Altman 立即給你升維一下,說你看你還在講陸軍的事,我都到空軍了,然后立即輿論又都在關(guān)注 Sora,OpenAI 又成了業(yè)界唯一的明星。

其實(shí)你現(xiàn)在回頭想想,Sora 從頭到尾就是一場(chǎng) PR,現(xiàn)在都五月了,還是沒有開放給公眾使用。

OpenAI 為什么沒敢推AI搜索
傳聞中的 OpenAI Search 測(cè)試界面 | 圖片來源:賽博禪心

我的觀點(diǎn)是,GPT-5 的研發(fā),肯定遇到了一些問題。如果不是這樣,直接上 GPT-5 就好了??萍计髽I(yè),永遠(yuǎn)都是能早一天就早一天,絕對(duì)不能晚的。GPT-5 要不就是性能沒有提升地那么驚艷,要么就是成本上特別高。

但以我對(duì) OpenAI 的理解,即使成本再高,只要效果特別驚艷,它一定會(huì)往外放,先震你一下再說,哪怕 GPT-5 一天就能用 5 條,那也讓你先用一下,讓所有的人的目光都過來。所以我覺得 GPT-5 的研發(fā)可能還是遇到了一些問題,不管是成本,還是所謂安全性問題,或者幻覺問題,反正多少遇到了問題。

作為 OpenAI 來說,現(xiàn)在這么燒錢的情況下,用戶量增長(zhǎng)就是它的核心命脈,一旦不增長(zhǎng),融資下筆錢的時(shí)候,估值上不能再上一個(gè)臺(tái)階,就會(huì)很麻煩。

所以我覺得這次說要做搜索引擎,就是圍魏救趙,我最近經(jīng)常唱衰 OpenAI,因?yàn)槲矣X得,從一個(gè)商業(yè)公司角度,其實(shí) OpenAI 走到這里,現(xiàn)在有點(diǎn)騎虎難下。

方漢:我首先非常贊同傅盛老師一個(gè)觀點(diǎn),就是 Sam Altman 的確是一個(gè) PR 高手,而且是是絕頂高手。

我認(rèn)為在 OpenAI 里面,權(quán)力最大的其實(shí)是 PR 團(tuán)隊(duì),或者說負(fù)責(zé)去融資的團(tuán)隊(duì),其次是技術(shù)團(tuán)隊(duì),再其次是產(chǎn)品團(tuán)隊(duì)。我認(rèn)為這個(gè)排序?qū)е铝?OpenAI 做出了種種行為。

GPT-4.5 和 GPT-5 為什么遲遲不發(fā)?根據(jù)我得到的消息,OpenAI 已經(jīng)訓(xùn)出來了,也不是能力不行,但是它現(xiàn)在沒有把握在工程上把這個(gè)東西效益最大化。

這個(gè)的意思是什么?剛才我們也聊到了,用戶漲不上去是 OpenAI 現(xiàn)在最頭疼的事情。如果發(fā)布了一個(gè)新的大模型,它沒有把握一次性、瞬間獲得足夠多的用戶,那它就不會(huì)上,這是它根本性的原因。

那么發(fā)搜索產(chǎn)品呢?我們目前看到的產(chǎn)品形態(tài)上來講,OpenAI 的搜索產(chǎn)品,并沒有對(duì)海內(nèi)外所有的搜索引擎產(chǎn)品,形成碾壓,形成 SOTA(state-of-the-art,最佳表現(xiàn)),發(fā)布這個(gè)產(chǎn)品,可能會(huì)讓用戶有一點(diǎn)增長(zhǎng),但不會(huì)讓用戶翻倍增長(zhǎng)。所以我認(rèn)為,這是在 Google I/O 前一周對(duì)谷歌的一次戰(zhàn)略狙擊,它的根本戰(zhàn)術(shù)上,還是在等待和籌備 GPT-4.5。

極客公園:OpenAI 如果推出搜索引擎,會(huì)解決 OpenAI 的什么問題嗎?會(huì)使搜索引擎的格局有變化嗎?

方漢:我覺得它應(yīng)該能提升用戶使用上的體驗(yàn),但是對(duì)大盤影響不大。

最早 Bing 推出 new Bing 的時(shí)候,把谷歌都嚇?biāo)懒?,但最后?duì)于 Bing 的大盤其實(shí)沒有什么影響,谷歌過了半年一看市場(chǎng)份額好像沒什么變化。我覺得搜索引擎對(duì)于 OpenAI 的用戶增長(zhǎng)也不會(huì)有根本性的變化。

傅盛:我還沒看到它的具體頁(yè)面會(huì)是怎么設(shè)計(jì),但我覺得如果它變成一個(gè)默認(rèn)功能的話,還是多少會(huì)增加一些用戶的這個(gè)感知點(diǎn)的。未必是能帶來多少新用戶,但是老用戶的留存活躍這件事可能能夠變得好一點(diǎn)。

OpenAI 為什么沒敢推AI搜索
OpenAI Search 測(cè)試界面 | 圖片來源:賽博禪心

搜索這個(gè)功能,對(duì)于用戶日常將其從好玩,變成當(dāng)作生產(chǎn)力工具使用,是非常重要的。我其實(shí)之前一直不明白為什么 ChatGPT 在發(fā)布之初沒有增加這個(gè)功能,我懷疑,原因可能在于成本。

它本來成本已經(jīng)很高了,也一直在努力降成本。不加搜索時(shí),本來用戶問一個(gè)問題,然后模型去預(yù)測(cè)下一個(gè)字,都需要這么多推理成本。

如果加上搜索后,用戶問一個(gè)問題,你先去啪啪啪搞出幾十個(gè)網(wǎng)頁(yè),抓取下來幾千個(gè)字,傳給模型再讓模型總結(jié),那這個(gè)成本就高很多了。

極客公園:在部分灰度用戶的測(cè)評(píng)中,我們看到此次 OpenAI 所說的搜索產(chǎn)品,其實(shí)產(chǎn)品形態(tài)和現(xiàn)有的搜索產(chǎn)品很接近。是不是 AI 搜索的產(chǎn)品形態(tài),沒有太多的創(chuàng)新空間了?

傅盛:現(xiàn)在這個(gè)形態(tài)的 AI 搜索,我覺得創(chuàng)新空間不大。

AI 搜索,是讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過程,而把這個(gè)過程用大模型,用 AI 去替你做這件事情。

這里面涉及兩個(gè)技術(shù)問題,一個(gè)是把網(wǎng)頁(yè)收集回來,一個(gè)是把網(wǎng)頁(yè)內(nèi)容傳遞給大模型讓大模型進(jìn)行總結(jié)。

前者涉及到要建立網(wǎng)頁(yè)索引庫(kù),而不是簡(jiǎn)單地去百度搜幾個(gè)網(wǎng)頁(yè),然后拿回來加工——百度肯定是不讓你這么干的。秘塔搜索也是自建了索引庫(kù)。而后者涉及到 AI 算法和模型能力。

我覺得形態(tài)上大家都是比較類似的,而從模型能力角度講,目前看來,整理網(wǎng)頁(yè)內(nèi)容把它輸出出來,需要的 AI 能力,其實(shí)也不是那么高,百億參數(shù)的模型已經(jīng)夠了,那后面就是涉及到,誰(shuí)能把工程化、產(chǎn)品化做的更好。

工程化是什么意思?

技術(shù),我們指的是算法啊等等的進(jìn)步。比如原來是用牛、馬來進(jìn)行運(yùn)輸,那我現(xiàn)在在算法層面,做出一個(gè)超級(jí)算法,相當(dāng)于我做了一個(gè)蒸汽機(jī),把這些東西統(tǒng)統(tǒng)搞定,仍然能保證有很強(qiáng)的運(yùn)載力。

而工程化,指的是,有時(shí)候現(xiàn)在沒有這么強(qiáng)的一個(gè)技術(shù)出來,我們?cè)趺慈ザ喔闩?、馬,協(xié)調(diào)這一千頭牛、一萬匹馬,來完成一件事,保證它不出錯(cuò)。

AI 搜索,現(xiàn)在雖然是大一統(tǒng)了,在很多細(xì)微的地方,就能看到不同的產(chǎn)品,是不一樣的。

OpenAI 為什么沒敢推AI搜索
PerplexityAI 的搜索界面 | 圖片來源:截圖

比如用戶在問不同問題的時(shí)候,看似在做同一件事,其實(shí)不同的搜索產(chǎn)品背后,會(huì)用不同的分類策略,對(duì)問題先進(jìn)行分類。哪些問題深度要求高,哪些問題實(shí)時(shí)性要求高,再做對(duì)應(yīng)處理,不同的產(chǎn)品就會(huì)體現(xiàn)出區(qū)別。

再比如一個(gè)回答,是從知識(shí)庫(kù)里調(diào)出來只是進(jìn)行回答,還是純網(wǎng)頁(yè)的信息整合?那天我問秘塔搜索,第三次世界大戰(zhàn)會(huì)不會(huì)打起來?你會(huì)發(fā)現(xiàn)它的回答,不完全是忠于網(wǎng)頁(yè)內(nèi)容做出來的報(bào)告,它給了我三種可能:打、不打、說不清楚。但是同時(shí)它搜了很多網(wǎng)頁(yè),為選項(xiàng)做了支撐。這個(gè)如何保持一定的客觀性,分配權(quán)重,是很細(xì)的活。

再比如,AI 搜索引擎怎么去做排序?這也是一個(gè)點(diǎn),而且可能未來和傳統(tǒng)搜索引擎的點(diǎn)完全不一樣。比如傳統(tǒng)搜索引擎,一般不會(huì)把一篇很專業(yè)的,非常長(zhǎng)的論文,直接推到用戶面前。但是在 AI 搜索下,為了提供更準(zhǔn)確的回答,它在搜索引擎所依賴的背后內(nèi)容的排序上,可能反而是很靠前的。

所以我覺得,未來 AI 搜索產(chǎn)品,拼的應(yīng)該不是誰(shuí)的技術(shù)特別牛,拼的是如何讓搜索結(jié)果能夠更忠于網(wǎng)頁(yè)內(nèi)容,如何做出更體系化的整理這種工程能力和產(chǎn)品設(shè)計(jì)能力。

方漢:我認(rèn)為現(xiàn)在的 AI 搜索的產(chǎn)品形態(tài)只是一個(gè)暫時(shí)的一個(gè)形式,為了讓傳統(tǒng)搜索引擎用戶,能夠很順暢地遷移到新形態(tài)的 AI 搜索上去。但是隨著技術(shù)和產(chǎn)品的迭代,我相信新的交互形式、新的產(chǎn)品形式都會(huì)在 AI 搜索上展現(xiàn)。

比如我們可以看到這次 OpenAI 的搜索 GPT,里面含了一個(gè)功能叫 wikis,我認(rèn)為可能就是用 GPTs 這種 agent(智能體)來實(shí)現(xiàn)的。在搜索的時(shí)候,可以調(diào)用各種各樣的模型解決用戶的問題,將是 AI 搜索的上限所在。

也就是說,根據(jù)用戶的特定需求,我可以調(diào)用各種各樣的模型,我可以調(diào)用翻譯模型,我可以調(diào)用總結(jié)模型,我還可以調(diào)用 tts 模型,把它轉(zhuǎn)成語(yǔ)音輸送給你。如果用戶想在論文方向搜索,我專門做一個(gè)論文的智能體,調(diào)用這個(gè)智能體來回答你的問題,這個(gè)上限我覺得是非常高的。

在我們的實(shí)踐過程中,我們的天工 AI 搜索里面已經(jīng)集成了大量的官方的制作的智能體來提升 AI 搜索的效果,且推理成本其實(shí)還是可控的。

但是我這里要吐槽一下 OpenAI。因?yàn)槲铱戳?OpenAI 的使用界面之后,我心里的想法是,他們的技術(shù)話語(yǔ)權(quán)遠(yuǎn)遠(yuǎn)超過產(chǎn)品的話語(yǔ)權(quán)。

OpenAI 為什么沒敢推AI搜索

search.chatgpt.com 的網(wǎng)頁(yè)存檔 目前該網(wǎng)站無法打開 | 圖片來源:X 用戶 Tibor Blaho

為什么這么說?

它們的產(chǎn)品里,要搜索,首先要選模型,兩到三個(gè)模型,還要選是否使用圖像搜索等等,我覺得復(fù)雜度比谷歌還高。我一個(gè)做技術(shù)的人,我看沒有問題,但很多用戶一定是用不明白的。他們的所有技術(shù)細(xì)節(jié)都沒有藏起來,我開個(gè)玩笑,這樣做產(chǎn)品的,在張小龍手下,一定活不到第二天。

所以總的來說,我認(rèn)為 AI 搜索的形態(tài)仍然有非常大的進(jìn)化空間,但具體怎么變,說實(shí)話我也很難預(yù)測(cè)。

OpenAI 也沒有帶來太多產(chǎn)品形態(tài)方面的驚喜,最多就是這個(gè) GPTs,但我覺得在國(guó)內(nèi)的人看來,比起我們熟悉的微信小程序什么的,看起來也還是挺落后的。

AI 搜索好在哪?從設(shè)計(jì)原理上解決幻覺問題

極客公園:AI 搜索相對(duì)于傳統(tǒng)搜索引擎有哪些區(qū)別,有哪些優(yōu)勢(shì)?

方漢:傳統(tǒng)的搜索引擎是通過爬蟲,把互聯(lián)網(wǎng)上所有的網(wǎng)頁(yè)都抓取回來,然后經(jīng)過清洗跟排序,最后在用戶打出查詢?cè)~的時(shí)候,搜索引擎按照自己的邏輯,對(duì)網(wǎng)頁(yè)進(jìn)行排序,給到用戶。整個(gè)過程,用戶需要自己選點(diǎn)那個(gè)網(wǎng)頁(yè),點(diǎn)開之后也要自主去看。

而 AI 搜索,讓用戶省去了去點(diǎn)網(wǎng)頁(yè)、選網(wǎng)頁(yè)以及看網(wǎng)頁(yè)的過程,你直接看到的,就是它對(duì)現(xiàn)有網(wǎng)頁(yè)的一個(gè)總結(jié)結(jié)果,相當(dāng)于一個(gè)搜索小秘書。

它最大的作用是什么呢?是降低了用戶的搜索時(shí)間,以及提高準(zhǔn)確性。

我們都使用過傳統(tǒng)搜索引擎。要去打開網(wǎng)頁(yè)看內(nèi)容,看完了靠人腦去總結(jié),耗時(shí)其實(shí)是蠻長(zhǎng)的,基本上都要幾分鐘,但現(xiàn)在大模型替你做這個(gè)事情,它可以在幾秒鐘之內(nèi)就可以給你一個(gè)總結(jié),基本上天工搜索的用戶基本上都會(huì)反映它極大地提高了大家的工作效率,甚至它一些總結(jié),包括腦圖 PPT 你可以直接用。

OpenAI 為什么沒敢推AI搜索
天工 AI 搜索的增強(qiáng)模式(共有簡(jiǎn)潔、增強(qiáng)、研究三個(gè)模式)| 圖片來源:截圖

在傳統(tǒng)搜索引擎中,最早谷歌搜索引擎除了搜索按鈕以外,還有另外一個(gè)按鈕 I feel lucky,點(diǎn)一下就直接進(jìn)入第一個(gè)搜索結(jié)果,實(shí)際上是傳統(tǒng)搜索引擎降低交付的走成本的一個(gè)嘗試。本質(zhì)上我們現(xiàn)在所有的 AI 搜索就是 I feel lucky 那個(gè)按鈕所起到的作用,只不過我們做的比他們要好得多。

另外就是準(zhǔn)確性。AI 搜索解決了大模型的幻覺問題。大家一開始用 ChatGPT,其實(shí)很多人是把它當(dāng)搜索引擎用的,但實(shí)際上它是會(huì)經(jīng)常一本正經(jīng)的胡說八道。AI 搜索通過 RAG 這些技術(shù),先找到事實(shí),12345,限制大模型根據(jù)以上事實(shí)來回答問題,能極大地抑制甚至徹底消除大模型的幻覺。

傅盛:我們一定要意識(shí)到一點(diǎn),就是搜索用戶在搜索的時(shí)候,其實(shí)抱著非常多的目的。有的搜索,就是尋址,我懶得記一個(gè)網(wǎng)頁(yè)的網(wǎng)址,我要去那個(gè)網(wǎng)頁(yè),我就去搜索引擎上搜索一下。不知道大家知不知道,以前百度搜索的第一名,是 Hao123,是一個(gè)匯集其他網(wǎng)址的導(dǎo)航網(wǎng)站。

還有一些搜索,只需要一些及時(shí)的簡(jiǎn)單內(nèi)容,這種也不太需要 AI 搜索。我覺得現(xiàn)在的 AI 搜索,更側(cè)重于一些特定的搜索需求——在一個(gè)相對(duì)復(fù)雜的問題下,對(duì)網(wǎng)絡(luò)上的結(jié)果進(jìn)行綜合分析,更偏向于形成某個(gè)東西的一份調(diào)查報(bào)告那種感覺。

OpenAI 為什么沒敢推AI搜索
秘塔搜索的研究模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來源:截圖

當(dāng)然它從客觀上克服了幻覺的問題,但理解 AI 搜索,一個(gè)更好的理解是把它理解為個(gè)大模型的一個(gè)非常垂類的場(chǎng)景,大模型作為主力,去幫我研究一下比如新能源車最近價(jià)格是如何變化的,這個(gè)助理就幫你去在搜索引擎上找了一堆的文章,然后給你整理了一份報(bào)告。

極客公園:用戶愿意信任 AI 搜索嗎?AI 搜索是不是只是一小波用戶的需求,而不是一個(gè)大眾需求?

傅盛:用戶愿不愿意信任 AI 搜索,AI 產(chǎn)品能做出怎樣的體驗(yàn)非常非常關(guān)鍵。

比如秘塔搜索,在產(chǎn)品中,它生成的回答,會(huì)列出參考的資料,12345,列給你看,增強(qiáng)你的信任感。我看到有些競(jìng)品,也列了 12345,但實(shí)際上,引用的不是列出來的最新內(nèi)容。

OpenAI 為什么沒敢推AI搜索
秘塔搜索的深入模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來源:截圖

所以我覺得,用戶的信任,可能是需要通過不斷地通過品牌的行為,去強(qiáng)化和獲得的。

不產(chǎn)生幻覺,我覺得技術(shù)上是完全可以做到的。這時(shí)候就要看,是不是因?yàn)榇蠹易霎a(chǎn)品做的比較快,細(xì)節(jié)上做的不夠,另外任何搜索引擎,包括傳統(tǒng)搜索引擎,也會(huì)出現(xiàn)一些誤差,能不能把這個(gè)比率控制在不影響體驗(yàn)的范圍內(nèi)。

這也是我前面說,AI 搜索現(xiàn)在是比拼工程化、產(chǎn)品化的時(shí)候的原因。不是弄一堆文章過來,整理一下,就算做好了。

對(duì) AI 搜索引擎來說,其實(shí)用戶對(duì)于 AI 不信任的問題,反而是其次的。更多的是,如何去用 AI,滿足更多的搜索需求。

比如百分之八九十的搜索,可能不需要用到深度分析,我在傳統(tǒng)搜索引擎下,搜一下得到一個(gè)電話或者地址就好了。這可能是 AI 搜索需要解決的更大的問題。

不過長(zhǎng)期來說,所有的搜索,肯定都是 AI 搜索。包括傳統(tǒng)的搜索引擎,他們也在看,也在推出 AI 搜索的功能,大家最后肯定是殊途同歸的。

方漢:我認(rèn)為 AI 搜索首先是沒有幻覺問題的,因?yàn)閺募夹g(shù)原理上來說,它是先搜索再總結(jié),然后再通過智能體去處理。在這個(gè)流程過程中,我們從源頭杜絕了這個(gè)欺詐的問題。

同時(shí)傳統(tǒng)搜索引擎,要列出更多網(wǎng)頁(yè),需要保證這所有網(wǎng)頁(yè)都不是欺詐網(wǎng)頁(yè)。而我們只需要把這些網(wǎng)頁(yè)里面我們認(rèn)為最可靠的三個(gè),互相交叉驗(yàn)證之后最可靠的三個(gè)的內(nèi)容進(jìn)行總結(jié),展現(xiàn)在網(wǎng)頁(yè)上給用戶去看,那么一定是可靠性是增強(qiáng)了的。

我們都有能力鑒別一個(gè)網(wǎng)頁(yè)是不是欺詐,但并不是所有用戶都這樣。我們的父母輩,他們真的是沒有能力鑒別這一點(diǎn)的。天工搜索有合規(guī)小模型,反欺詐模型來篩選網(wǎng)頁(yè),也會(huì)從 prompt 端優(yōu)化讓模型輸出多數(shù)網(wǎng)頁(yè)認(rèn)可的價(jià)值,那鑒別能力低的用戶用 AI 搜索,效果一定是正向的。

我們這些很熟悉技術(shù)的人,自己很熟悉傳統(tǒng)搜索,能夠主動(dòng)地去合適的網(wǎng)站找到合適的內(nèi)容,所以有時(shí)候覺得一部分需求好像 AI 搜索滿足不了。但我們不要忘記,AI 搜索從出現(xiàn)到現(xiàn)在也就一年多的時(shí)間,隨著時(shí)間的推移,我認(rèn)為 AI 搜索在體驗(yàn)、準(zhǔn)確性等問題上都會(huì)遠(yuǎn)遠(yuǎn)超過搜索引擎,

我們的用戶數(shù)據(jù)里看到,天工搜索的用戶的粘度是非常高的,非常信任我們。為什么?因?yàn)樗麄儠?huì)看我們給出的索引。

比如說體制內(nèi)的人用我們的搜索幫助寫公文,他會(huì)發(fā)現(xiàn)我們索引,引用的都是官方媒體的,他用了幾次之后就會(huì)非常信任我們,所以我認(rèn)為,信任會(huì)隨著時(shí)間的推移而逐漸增強(qiáng)。

OpenAI 為什么沒敢推AI搜索
天工 AI 搜索的研究模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來源:截圖

至于用戶群體,我剛才也提一下,new Bing 出現(xiàn)后,Bing 搜索引擎的市場(chǎng)份額只有小幅增加。那是因?yàn)樗?dāng)時(shí)的智能體的技術(shù)不成熟。

用戶上來就是搜一首歌、搜個(gè)電視劇、看個(gè)八卦什么的,我認(rèn)為這部分需求用智能體一定是可以解決得非常好的。

有了智能體的技術(shù),用戶更多的長(zhǎng)尾需求可以得到滿足,那么我認(rèn)為用戶量的增長(zhǎng)是指日可待的。

我完整的經(jīng)歷了中國(guó)搜索引擎的發(fā)展過程。當(dāng)初百度搜索在那個(gè)北大燕園資源樓辦公的時(shí)候,我還去參觀過。其實(shí)最早用搜索引擎的人,也全是像我們這樣的一些技術(shù)極客,但慢慢的它就會(huì)泛化到全人群。我認(rèn)為 AI 搜索也是這樣。

現(xiàn)在使用我們 AI 搜索的主要用戶應(yīng)該還是白領(lǐng)用戶以及技術(shù)極客居多。隨著時(shí)間推移,AI 搜索也一定會(huì)逐漸被更多樣的人群使用。

AI 搜索的商業(yè)前景:成本低于 5 美分就能盈利

極客公園:傳統(tǒng)的搜索引擎,用戶免費(fèi)使用而 B 端投放廣告,形成了成熟的商業(yè)模式。AI 搜索中,用戶直接得到搜索結(jié)果,會(huì)不會(huì)改變商業(yè)模式?能夠盈利嗎?

方漢:上個(gè)時(shí)代的搜索成本,它首先有個(gè)固定開銷,就是你的爬蟲集群的開銷,這個(gè)爬蟲集群,如果索引全球的網(wǎng)頁(yè)的話,那基本上在 3, 000 臺(tái)服務(wù)器到 1 萬臺(tái)服務(wù)器之間,這是個(gè)固定開銷。

另外一部分成本就是做 page rank(網(wǎng)頁(yè)排名),這個(gè)服務(wù)器規(guī)模是更為龐大的,且是動(dòng)態(tài)開銷。你的用戶越多,你這個(gè)集群就需要越大。

在這兩個(gè)開銷之外,還有人員成本,還有保護(hù)費(fèi)的成本——比如說谷歌每年要給蘋果交錢,讓蘋果保留使用谷歌作為默認(rèn)搜索。

所有這些都加起來之后,谷歌每年搜索引擎查詢次數(shù)是 3.3 萬億次,單次搜索的成本是 0.2 美分。然后整個(gè)谷歌搜索廣告的收入是 1, 500 億美金左右,去年可能是 1, 600 億差不多,可以算出來差不多一次搜索產(chǎn)生的收入是 5 美分左右。

然后再跟大家說一個(gè)數(shù)字,OpenAI 早期的成本,注意不是現(xiàn)在的成本,早期的成本,一次對(duì)話的成本是 36 美分,就是你可以看到這里面有幾個(gè)數(shù)字差,36 美分、 5 美分、 0.2 美分。可以看出來,推理成本,是 AI 搜索商業(yè)模式中非常關(guān)鍵的因素。

我再跟大家分享另外一個(gè)數(shù)據(jù),文生圖有一個(gè)開源模型,叫 Stable Diffusion。我記得非常清楚,在 2022 年的時(shí)候我開始使用它,當(dāng)時(shí)一張 4090 的卡平均是跑 3 分鐘出一張圖。今天我用 4090 還是同一張卡,我一秒鐘能出 100 張圖??梢钥闯?,推理的優(yōu)化速度非??臁N艺J(rèn)為跟摩爾定律是有點(diǎn)像的,推理成本的下降速度跟摩爾定律是一樣的,非???。

甚至未來,端側(cè)推理變得足夠成熟之后,在端側(cè)去做這件事情,幾乎不存在推理成本了。我認(rèn)為 AI 搜索商業(yè)模式應(yīng)該很快就可以打正,這只是一個(gè)時(shí)間問題。

在商業(yè)模式上來說,最基礎(chǔ)的 AI 搜索的商業(yè)模式,一定是靠廣告信息流,那么這個(gè)商業(yè)模式也是非常成熟的。實(shí)際上國(guó)內(nèi)的單個(gè)搜索,能夠收到的錢比國(guó)外高很多,但基本上也是在 5 美分或者是幾十美分這種量級(jí),我們認(rèn)為這個(gè)東西短期內(nèi)也不會(huì)有太大的變化,所以我們也在一直優(yōu)化,一定要把我們的推理成本打到 5 美分以下,整個(gè)商業(yè)模式才會(huì)成立。

我認(rèn)為這個(gè)現(xiàn)在也不是特別難的事,這一天遲早會(huì)到來。

我們還會(huì)做智能體,智能體實(shí)際上屬于 VIP 服務(wù)了,還可以收到更高的費(fèi)用。

傅盛:在商業(yè)模式的問題上,首先每次搜索成本的價(jià)格必須降下來。

Transformer 那種大架構(gòu),如果你千億參數(shù),你每一個(gè)網(wǎng)頁(yè)你都送進(jìn)去喂一把,來一下上下文,那最后它就是很貴,搜索成本不降下來,你找用戶收錢,每月收你 100 塊錢,我還得限制你用多少次呢,商業(yè)模式就是算不過來賬。

秘塔搜索的創(chuàng)始人是獵豹移動(dòng)以前專門負(fù)責(zé) NLP 的首席科學(xué)家。秘塔搜索特別值得一提的是,他們做產(chǎn)品的時(shí)候,思路非常清晰,搜索成本一定不能高。

秘塔在搜索背后的這個(gè)模型,大概也就是百億參數(shù),是自己訓(xùn)的一個(gè)模型,所以使得秘塔搜索的每次的搜索成本是非常低的。現(xiàn)在有的大模型,幾百萬字上下文,可能一次搜索的成本要幾十塊錢。

OpenAI 為什么沒敢推AI搜索
秘塔搜索的深入模式(共有簡(jiǎn)潔、深入和研究三個(gè)模式)|圖片來源:截圖

我覺得由于需求的這個(gè)場(chǎng)景越來越明確,然后大家如果在這個(gè)網(wǎng)絡(luò)框架或者算法上去發(fā)力,整個(gè)行業(yè)一起努力,我覺得成本會(huì)降得很快,可能最后降到一個(gè)和傳統(tǒng)搜索成本差不多,或者稍微高一點(diǎn)點(diǎn)的水平,這是我個(gè)人一個(gè)判斷。

而真正未來的商業(yè)模式,也許是一個(gè)復(fù)合模式。比如秘塔搜索里面,有個(gè)功能叫深度分析,可能以后那種深度分析的功能就是會(huì)員享受的。具體的秘塔商業(yè)模式會(huì)怎么發(fā)展,我不能替創(chuàng)始人回答,只是一個(gè)想法。去年秘塔這個(gè)團(tuán)隊(duì)都是盈利的,它沒有像 AI 公司一樣去燒錢,是非常務(wù)實(shí)的團(tuán)隊(duì)。

極客公園:AI 搜索是創(chuàng)業(yè)者的好機(jī)會(huì)嗎?

傅盛:AI 搜索,我們叫大搜索創(chuàng)業(yè),肯定不適合大部分創(chuàng)業(yè)者。競(jìng)爭(zhēng)對(duì)手都是巨頭,壓力很大。

其實(shí) AI 出現(xiàn)對(duì)搜索大廠本身是增強(qiáng)的。

為什么大家現(xiàn)在開始用小紅書搜索一些娛樂內(nèi)容,講難聽點(diǎn),就是因?yàn)榻裉彀俣炔缓靡馑脊_地去抓人家不讓抓的數(shù)據(jù)。但有了 AI,大廠可以偷偷抓,變成自己的內(nèi)容吐出來,像是洗稿,那其實(shí)是增強(qiáng)了它的能力。

而且大廠其實(shí)不是沒有 AI 的能力,AI 的能力是傳統(tǒng)搜索團(tuán)隊(duì)的覆蓋范圍之內(nèi)的。傳統(tǒng)的搜索引擎公司,想做 AI 搜索,核心是成本問題,不是能力問題。創(chuàng)業(yè)者盡量不要去打人家火力范圍內(nèi)的事情。

對(duì)于大廠來說,它不著急。這波人工智能下,我認(rèn)為即使英偉達(dá)的股價(jià)泡沫破滅了,谷歌可能都是比較穩(wěn)的。它只要不斷地做 Gemini,等到整個(gè)商業(yè)模式變好了,再開始大力推。

只要大廠不犯重大錯(cuò)誤,大搜索格局上,很難有大的變化。

但是我覺得 AI 搜索的這個(gè)模式,對(duì)于很多垂類來說,是可以做的。隨著一些基礎(chǔ)技術(shù)和 AI 的普及,比起以前,創(chuàng)業(yè)者做一個(gè)垂類搜索的速度快了非常多。

搜索可以無處不在,它不一定要以一個(gè)大搜的形式存在,所以創(chuàng)業(yè)者可以考慮在你的各種產(chǎn)品當(dāng)中去加一些 AI 搜索模塊。因?yàn)?AI 搜索它整個(gè)的能力已經(jīng)上來了,成本也降下來了。做模塊可能比以前要簡(jiǎn)單得多、也會(huì)多得多。

方漢:首先我認(rèn)為 AI 搜索不是創(chuàng)業(yè)者一個(gè)好的方向。很簡(jiǎn)單,AI 搜索,如果你要想做到成本最低,你一定要自建搜索引擎索引庫(kù),這個(gè)成本是非常高的,我不覺得一個(gè)小創(chuàng)業(yè)者能解決這個(gè)問題。

我們公司做這個(gè)事情是因?yàn)槲覀冊(cè)瓉碓诤M庾?Opera News 這個(gè)新聞推薦產(chǎn)品的時(shí)候,從 16 年開始就自建了一個(gè)比較小的一個(gè)搜索引擎,我們當(dāng)時(shí)每天大概索引 5, 000 萬個(gè)新聞網(wǎng)站,我們整個(gè) AI 搜索的引擎團(tuán)隊(duì)是一脈相承的,也就是說我們做這個(gè)搜索引擎的集群已經(jīng)做了有七八年了。

索引庫(kù)實(shí)際上就是爬蟲集群和存儲(chǔ)集群。比如有做個(gè)人站的,你能看到的個(gè)人站上,有幾個(gè)網(wǎng)站帶著 bot 的標(biāo)志來爬蟲你的個(gè)人站了,你就知道有哪幾個(gè)公司是有自己的爬蟲集群的。

這一塊其實(shí)是一個(gè)比較大的成本,因?yàn)槿绻銢]有的話,你就得去買第三方的服務(wù),比如調(diào)用 Google 的或者是 Bing 的索引庫(kù),給他們錢。那基本上,購(gòu)買第三方服務(wù)就可以把你所有的利潤(rùn)都吃完了。谷歌自己的成本是 0.2 美分,那你覺得它會(huì)賣你多少錢它覺得合適?

這個(gè)成本遠(yuǎn)比你的推理成本要高,而且推理成本在迅速地下降。

看未來的話,AI 搜索最后可能不會(huì)取代市場(chǎng)上的老大,但它有可能把市場(chǎng)上的老二老三給擠下來。

即使現(xiàn)在有谷歌搜索,其實(shí)同時(shí)仍然還有很多的搜索引擎。垂類的搜索引擎活得很好,比如 DuckDuckGo。我認(rèn)為這種引擎反而是未來受到威脅最大的。

另外我反復(fù)強(qiáng)調(diào)智能體,你的智能體如果能夠滿足一部分垂類用戶的需要,那你這個(gè) AI 搜索就能夠長(zhǎng)期存在,而這些特定領(lǐng)域,搜索巨頭未必能覆蓋的到。舉個(gè)例子,搜論文,谷歌做了一個(gè)學(xué)術(shù)搜索,但是在中國(guó)有知網(wǎng),然后在海外還是有 Arxiv,垂類領(lǐng)域我們認(rèn)為 AI 搜索通過智能體的賦能空間還是非常大的。

OpenAI 為什么沒敢推AI搜索
天工 AI 的智能體廣場(chǎng) | 圖片來源:截圖

極客公園:未來搜索這個(gè)形態(tài)本身,還有搜索的市場(chǎng)格局,會(huì)發(fā)生變化嗎?

方漢:一個(gè)比較少被討論的點(diǎn)是,在現(xiàn)在的搜索格局下,谷歌和百度這兩個(gè)搜索巨頭,都在自建內(nèi)容閉環(huán)。谷歌給 Wikipedia 捐了很多錢,20% 的流量落在 Wikipedia 上。百度有百度百科、問答等等。

大模型可能會(huì)完全顛覆內(nèi)容閉環(huán)這件事。Wikipedia、百科都需要人工編輯,只要需要人工編輯,維護(hù)成本就非常高,而目前看到,大模型是有機(jī)會(huì)自己去生成 Wikipedia 的。我覺得下一段時(shí)間 AI 搜索都會(huì)聚焦的一個(gè)方向,是內(nèi)容生成。

包括我們看到,微軟的新模型,是使用 GPT-4 生成的教科書來訓(xùn)練的。大模型現(xiàn)在已經(jīng)可以生成教科書了,雖然這個(gè)教科書用來訓(xùn)練模型,我們實(shí)際看到其實(shí)效果不太好,但仍然可以側(cè)面說明,我們離生成合成數(shù)據(jù)越來越近了。

傳統(tǒng)意義上的搜索,它只是一個(gè)很長(zhǎng)一段時(shí)間最適合我們獲取信息的一種方式。然后隨著大模型的進(jìn)步,隨著 AI 的進(jìn)步,我們認(rèn)為我們有能力給用戶提供更方便、更直接的這樣一個(gè)體驗(yàn)。只要你能夠讓用戶真正的省時(shí)間,真正的能提高準(zhǔn)確性,變方便,那么你的使用率自然會(huì)上升,你的留存自然會(huì)變好。

大家都現(xiàn)在都在卷模型的指標(biāo)。以后當(dāng)技術(shù)進(jìn)步放緩的時(shí)候,我認(rèn)為產(chǎn)品就會(huì)介入?,F(xiàn)在這一波 AI 創(chuàng)業(yè)中,產(chǎn)品的話語(yǔ)權(quán)是遠(yuǎn)遠(yuǎn)低于技術(shù)的,我認(rèn)為這個(gè)情況是不太正常的,長(zhǎng)期來看一定是改變世界的是產(chǎn)品。

未來的搜索市場(chǎng)份額,我認(rèn)為新產(chǎn)品一定是能拿到的。谷歌這樣的大公司,沉沒成本太高了,行動(dòng)速度一定是比新產(chǎn)品慢的。但是能不能守住這個(gè)市場(chǎng)份額,以及能不能顛覆這個(gè)市場(chǎng),是不一定的。

OpenAI 為什么沒敢推AI搜索

2023 年搜索引擎市場(chǎng)份額 |圖片來源 YouTube Data Wrap可能顛覆市場(chǎng)的是做操作系統(tǒng)的,或者是做別的產(chǎn)品的公司,一下子降維打擊,把搜索引擎的市場(chǎng)搞沒了。端側(cè)推理和智能體,都可能帶來顛覆創(chuàng)新。

傅盛:五年之內(nèi),搜索的形態(tài)可能會(huì)發(fā)生一些變化,可能真的會(huì)從一個(gè)純服務(wù)端的變成本地化的。意思是,我真的不再去打開一個(gè)網(wǎng)站了,我就在手機(jī)上問我的 Siri 就行了,每個(gè)回答給我 20 字,直接滿足我 90% 的需求。

我不知道這件事會(huì)不會(huì)真正發(fā)生。但是端上運(yùn)行的大模型,將變成一個(gè)非常重要的變量。像我剛才講的,搜索市場(chǎng)本身,在原來的格局下,我看不到第一名被顛覆會(huì)有很大可能性發(fā)生。234 名可能會(huì)有些變化,誰(shuí)在這個(gè) AI 上懟的快,可能市場(chǎng)份額就上去了。

但是我覺得,明年我們可能會(huì)看到一個(gè)結(jié)果,就是端側(cè)推理,會(huì)不會(huì)給整個(gè)搜索形態(tài)帶來重大的變化。蘋果六月份就要發(fā)布他們涉及到端上模型的方案。當(dāng)時(shí)財(cái)報(bào)會(huì),有人問蘋果公司,你這么大一個(gè)公司,買 GPU、卡買的不夠多。

蘋果的回答是我們是混合模型,大模型我們用合作伙伴的,端側(cè)本地模型我們自己研發(fā)。它對(duì)本地模型是極度重視的。行業(yè)里現(xiàn)在已經(jīng)分兩派了。

OpenAI 那派推 7 萬億 GPU 小鎮(zhèn),在擴(kuò)云端模型。而另一派,就是關(guān)注本地。微軟,到蘋果,到高通,現(xiàn)在都在推 AIPC 了。

OpenAI 為什么沒敢推AI搜索

我覺得其實(shí)第二派會(huì)更快地到來。有可能你的電腦以后就是一個(gè)搜索引擎了,那我覺得這個(gè)可能對(duì)搜索引擎的模式是完全的顛覆。

我本地一個(gè) APP,到百度抓五六個(gè)網(wǎng)頁(yè),自己回來做分析。你說百度不讓我抓?這個(gè)沒辦法不讓抓,你也分辨不出來,我就是一個(gè)用戶。那到時(shí)候,搜索引擎的整個(gè)商業(yè)模式就完全沒法成立了。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: AI OpenAI

相關(guān)文章