一级毛片在线视频,久久超碰激情网,欧美日韩性爱一区二区,精品国产av

四位大模型創(chuàng )業(yè)者聊 AGI、Scaling Law 和價(jià)格戰

摘要

什么是 AGI?大模型和 Scaling Law 是其實(shí)現基座嗎?怎么看價(jià)格戰?四家大模型公司給出了自己的答案。

 

文 | 幸芙

編輯 | 鄭玄

 

談?wù)摿艘徽甑?AGI 和大模型,但什么是 AGI?大模型是實(shí)現 AGI 的必需基座嗎?Scaling Law 仍會(huì )繼續有效嗎?

中國排名前列的四家大模型創(chuàng )業(yè)公司給出了自己的答案。在 6 月 14 日舉辦的北京智源大會(huì )上,智源研究院院長(cháng)王仲遠提出了這些問(wèn)題,百川智能 CEO 王小川、智譜 AI CEO 張鵬、月之暗面 CEO 楊植麟、面壁智能 CEO 李大海展開(kāi)了同臺討論。前三位代表了中國最受關(guān)注的大模型廠(chǎng)商,后一位則是端側大模型的新貴。

關(guān)于 AGI 的定義,每個(gè)人的看法不一。但他們認可 Scaling Law 是目前實(shí)現 AGI 的有效方式——不過(guò)這一定律的內涵和要求也在發(fā)生變化。比如楊植麟認為,Scale 的數據和方式會(huì )是一個(gè)關(guān)鍵問(wèn)題;王小川認為,除此之外還需要更多范式,比如融入「自我思考性」系統;而張鵬和李大海都贊同除參數量之外,數據質(zhì)量、訓練方法等也尤為重要。

談及前不久行業(yè)熱議的價(jià)格戰問(wèn)題,他們都認同降價(jià)、以及由此帶來(lái)的大模型普及這一趨勢,不過(guò)每個(gè)人觀(guān)點(diǎn)也各有不同。

比如楊植麟認為,未來(lái)訓練成本將低于推理成本、并低于獲客成本,而當 AI 在人類(lèi)工作流中占比過(guò)半,今天 To B 的商業(yè)模式可能轉變;王小川認為,價(jià)格戰讓更多企業(yè)打消了自己做模型的念頭,減少了社會(huì )資源的浪費;而張鵬和李大海觀(guān)點(diǎn)也較為接近,那就是要在成本降低、和模型廠(chǎng)商健康經(jīng)營(yíng)之間取得一個(gè)平衡。

這是四家大模型廠(chǎng)商罕見(jiàn)的同臺交流,以下是這場(chǎng)對談的精華,經(jīng)極客公園整理后發(fā)布:

北京智源大會(huì )上,智源研究院院長(cháng)王仲遠與四位大模型創(chuàng )業(yè)者對談|圖片來(lái)源:智源研究院

 

談 AGI:scaling law 是目前的有效實(shí)現路徑,但還不夠

王仲遠:大模型會(huì )是 AGI 的一個(gè)基座嗎?還是說(shuō)它只是一個(gè)數據的壓縮,可能對產(chǎn)業(yè)界非常有價(jià)值,但并不一定能夠通往 AGI?

楊植麟:我們比較相信大模型還是這里面的第一性原理,通過(guò)不斷提升模型的規模,它確實(shí)本質(zhì)上是一個(gè)壓縮、但這個(gè)壓縮確實(shí)是可以產(chǎn)生智能。所以隨著(zhù)不斷地規?;@個(gè)模型,不斷地做更好的壓縮,它能產(chǎn)生越來(lái)越多的智能。

當然在這個(gè)過(guò)程中也會(huì )有很多挑戰,比如最大的挑戰就是有些數據可能并沒(méi)有那么多,或者說(shuō)假設你最后要做出來(lái)一個(gè)可能比人類(lèi)更好的 AI、那可能就根本不存在這樣的數據,因為現在所有的數據可能都是人產(chǎn)生的。所以我覺(jué)得可能最大的問(wèn)題是怎么去解決比較稀缺、甚至可能不存在的數據問(wèn)題。

但是我覺(jué)得規?;?、或者說(shuō)大模型本身,可能沒(méi)有太本質(zhì)上的問(wèn)題。

王小川:我覺(jué)得基石這個(gè)詞是沒(méi)有問(wèn)題的。今天大家已經(jīng)看到了 Scaling Law 帶來(lái)的提升,但是我想說(shuō),它只是在逼近 AGI,但是光靠 scaling law 我理解是不夠的。所以如果從第一性上講,可能需要有范式的一個(gè)改變。今天大家忽略了一件事情,那就是語(yǔ)言放到大模型的體系里面、語(yǔ)言變成了數學(xué)。

我們接下來(lái)往前走,除了規模以外的話(huà),符號跟這種連接的融合,我覺(jué)得這是中間的一件事情。那么再往前走,還會(huì )有更多東西必須有范式改變,比如今天大模型是靠數據驅動(dòng)一種學(xué)習系統來(lái)做壓縮,但是反而像之前類(lèi)似像 Alphago 那樣能夠自我思考性的系統,也會(huì )有這樣一個(gè)作用。

所以我的結論來(lái)講的話(huà),我們是到了 AGI 的時(shí)代,通過(guò)有足夠多的科學(xué)家進(jìn)來(lái)、更多的資源進(jìn)來(lái),我們能夠走向 AGI。但是光是以現在我們看到的 scaling law,是走不到 AGI 的。

張鵬:首先同意小川說(shuō)的,大模型是肯定是基石,那至于是不是之一,這是另外一個(gè)問(wèn)題。

這個(gè)問(wèn)題其實(shí)也涉及到說(shuō),你怎么來(lái)定義 AGI。站在我們現在的角度來(lái)說(shuō),我是覺(jué)得做人工智能的這波人還挺實(shí)用主義的。所謂的實(shí)用主義就是說(shuō),咱不看廣告,看療效。這東西它能不能解決問(wèn)題?能不能真的在我們每個(gè)人心中定義的 AGI 路徑上推進(jìn)一步?大模型到目前為止還是很有效的在推進(jìn)這件事情、scaling law 也在有效往前推進(jìn)。

那至于說(shuō)它是不是能夠幫助我們推到那個(gè)頂峰上去?我們現在也找不到這個(gè)很確切的一個(gè)答案。但至少我們相信它在這個(gè)階段還是有效的,所以我認為它肯定是基石,至少是基石之一。

李大海:我個(gè)人是數學(xué)專(zhuān)業(yè)畢業(yè)的,所以我可能會(huì )比較嚴謹的去表達。我認為大模型一定是通往 AGI 這個(gè)方向上,當前所有技術(shù)里面能走得最遠的。但它能不能夠直接到達,我覺(jué)得現在還有很多未知的因素。

我想提一個(gè)可能大家沒(méi)有提到的點(diǎn),我覺(jué)得現在的大模型作為知識壓縮,主要是在處理人的大腦的「系統一」的工作。而它作為慢思考去做各種各樣的推理、做搜索組合來(lái)完成任務(wù)的「系統二」的能力,可能未來(lái)要通過(guò) agent 的技術(shù)外部化、或者把它內化為自己的能力去完成。這個(gè)是行業(yè)里面大家需要去探索的。

王仲遠:確實(shí)是一個(gè)非常有意思的問(wèn)題,我們總在討論 AGI,但似乎好像連 AGI 的定義大家都沒(méi)有廣泛的共識。在各位的心里,到底什么叫 AGI?

楊植麟:首先我覺(jué)得 AGI 的定義是重要的,但它不一定需要被非常精確的、量化的定義,它可能是一個(gè)定性的、感性的東西。因為它最重要的一個(gè)作用是,在技術(shù)的節奏非??斓那闆r下,如果我們能知道 AGI 是什么樣的,其實(shí)可以更好的去準備這個(gè)事情。

其次在短期內,可能是需要一些目標的量化。傳統圖靈測試可能到現在已經(jīng)不完全適用了,現在 AI 通過(guò)了圖靈測試,但還有很多事情是人可以做得非常好、AI 基本沒(méi)法做的。所以量化不是一個(gè)很容易的問(wèn)題。你可能需要對評估的維度去做很多拆分,比如說(shuō)知識能力、推理能力和創(chuàng )造能力,可能評估的方式會(huì )完全不一樣。

這也是現在大家在關(guān)注的問(wèn)題,是非常重要的。

王小川:我提到現在是 AGI 元年,是因為我們掌握了 scaling law,同時(shí)我們掌握了把語(yǔ)言變成數學(xué)的能力,這是重大的起點(diǎn)。大家以前都在講圖片識別很厲害、無(wú)人駕駛也很厲害,我調侃說(shuō)狗也可以自己導航、狗也會(huì )看圖片,但是狗不會(huì )語(yǔ)言,語(yǔ)言代表了我們認知世界的一個(gè)大的范式。

什么是 AGI,確實(shí)在全球里面很難有完整的共識。我覺(jué)得我們得把它從一個(gè)空間換到另一個(gè)空間來(lái)做判斷,在我心中,接近 AGI 的定義是看它能不能造醫生。為什么?之前我們在談 AGI 的時(shí)候,一種是把它當成工具在看,一種是把它跟人差異化看,我是拿人的一個(gè)職業(yè)來(lái)跟它做比較。

醫生在所有職業(yè)里是一個(gè)智力密度相對最高的職業(yè),既需要多模態(tài),也需要少幻覺(jué),有效記憶,比如看 70 萬(wàn)字的病例,也要有推理的能力,也要有查文獻的能力等等。如果你認為醫生比 AGI 低,那醫生都造不了,咱們就別談 AGI 了。如果你覺(jué)得醫生比 AGI 還高,而醫生只是造人的種類(lèi)中的一種,我覺(jué)得醫生跟 AGI 基本是可以畫(huà)等號的。

數學(xué)上有一個(gè)題目是自然數和偶數哪個(gè)多,大家第一反應是偶數比自然數少,因為偶數是自然數的一個(gè)子集。但數據上它們是一樣多的,因為每一個(gè)自然數乘以 2 就是一個(gè)偶數,它們是可以映射的。今天我是把大模型的能力都映射到醫生身上,你拿這個(gè)做標準,能造醫生就是 AGI。

李大海:我會(huì )嘗試從經(jīng)濟學(xué)的角度來(lái)去定義 AGI。從經(jīng)濟學(xué)的角度講,如果我們去執行任何一個(gè)任務(wù),它的邊際成本都為零,這就是我們理想中的 AGI 了。為什么我認為大模型能夠走得最遠?就是我相信大模型能夠把邊際成本一直往下降,可能會(huì )逼近于零。

去年我們看到行業(yè)做大模型落地的時(shí)候,很多場(chǎng)景還需要做微調,邊際成本很高。但我們相信隨著(zhù)模型能力的提升,慢慢從微調到只需要做 prompt engineering、慢慢連 prompt engineering 都不需要,直接就問(wèn)你到底有什么需求。通過(guò)這種方式,我相信未來(lái)的門(mén)檻、成本會(huì )越來(lái)越低,低到接近于 0 的時(shí)候,我覺(jué)得 AGI 基本上就到來(lái)了。

我額外還想補充一個(gè)觀(guān)點(diǎn),其實(shí)大模型的智能密度也是個(gè)非常重要的事情。當有一天我們達到 AGI 的時(shí)候,我們還要把大模型小型化,如果我用一個(gè) 10 萬(wàn)億參數的模型能做到 AGI,那我能不能把這個(gè)參數降到 1 萬(wàn)億、1 千億?這是我覺(jué)得需要去突破的事情。

張鵬:與其說(shuō)嚴格的定義,我更愿意相信 AGI 可能是我們的一種信念、一個(gè)符號,它的內涵外延是在不斷的變化的。如果你能把一件事情說(shuō)得非常量化、非常清晰,那這件事情也就那樣了,估計天花板在哪大家都能看得到了?,F在沒(méi)有人能把這些說(shuō)清楚,那反過(guò)頭來(lái)講是一件好事,說(shuō)明它還有很多未知的空間等待我們去探索。

當前我們的目標是,讓機器像人一樣去思考,這只是第一步。當然機器的能力遠不止這個(gè)水平,我們期待它可以超越人的能力,也就是所謂 super intelligence。在這個(gè)過(guò)程中,我們會(huì )不斷更新迭代 AGI 的內涵和外延。王仲遠:大家反復在提 scaling law,你們還會(huì )特別的堅信嗎?它會(huì )繼續在未來(lái)的這些年發(fā)揮作用嗎?

楊植麟:scaling law 沒(méi)有本質(zhì)的問(wèn)題。我認為接下來(lái)(scale)3 到 4 個(gè)數量級,這是非常確定的一個(gè)事情。但更重要的問(wèn)題是,你怎么能夠很高效地去 scale?你應該 scale 什么東西?

如果還是像現在搞一堆 Web text(網(wǎng)頁(yè)文本)去 scale,可能就不一定是對的方向,因為這里面可能就會(huì )遇到很多的挑戰,比如推理能力不一定能夠在這個(gè)過(guò)程中解決。如果你沿著(zhù)現在的方法去做,上限是很明顯的。

Scaling Law 本質(zhì)上是說(shuō),只要有更多的算力,數據模型參數變大,就能持續產(chǎn)生更多的智能。這里面其實(shí)并沒(méi)有定義你的模型是什么樣的,比如要多少個(gè)模態(tài)?中間的數據是什么樣的?數據是生成出來(lái)的,還是說(shuō)可以用 Web text?也沒(méi)有規定你的這個(gè) loss function(損失函數)是什么樣的,就不一定是 next token prediction(下一個(gè)詞預測)。

所以我覺(jué)得 Scaling Law 是會(huì )持續演進(jìn)的一個(gè)第一性原理,只是在這個(gè)過(guò)程中,scale 的方法會(huì )發(fā)生很大的變化。包括楊立昆一直在講的世界模型,本質(zhì)上現在的大語(yǔ)言模型是世界模型的一個(gè)特例。你只是說(shuō)先把里面一部分給做了,但是還要持續擴充訓練的方式。

王小川:我覺(jué)得 scaling law,到目前沒(méi)有看到邊界的持續發(fā)揮。我們看到美國 Elon Musk,號稱(chēng)要買(mǎi) 30 萬(wàn)片 B200 來(lái)做,美國確實(shí)在這方面的認真程度、投入程度是會(huì )遠高于中國的。我們在  Scaling Law 之外,一定要去尋找泛市場(chǎng)的一個(gè)新的轉化。

我認為不管是從戰略上、還是從信仰上,我們在  scaling law 之外應該都有一個(gè)范式的變化,就不只是簡(jiǎn)單去 predict 下一個(gè) token 、壓縮這種模式。只有走出這樣一個(gè)體系,才有機會(huì )走向 AGI、才有機會(huì )跟最前沿的技術(shù)產(chǎn)生較量的能力。

張鵬:到目前為止,我們還沒(méi)有看到 scaling law 會(huì )失效的預兆。未來(lái)相當一段時(shí)間之內,它仍然會(huì )有效,當然這個(gè)所謂的會(huì )有效也是一個(gè)動(dòng)態(tài)的概念,它所包含的內涵會(huì )不斷地演進(jìn)。scaling law 早期關(guān)注的是簡(jiǎn)單的模型參數量規模,現在已經(jīng)慢慢擴展到,參數量很重要、數據量也很重要、數據質(zhì)量也很重要。

關(guān)于 GPT4.5 和 GPT5 為什么一直沒(méi)有發(fā)布,我覺(jué)得里面的因素會(huì )非常非常多。但就我們自己來(lái)說(shuō),我們會(huì )不斷遵循 scaling law 往前進(jìn)。舉個(gè)例子,我們開(kāi)始做「悟道」的時(shí)候就討論過(guò)一個(gè)方案,就是到底是做一個(gè)稠密的單體模型、還是做一個(gè) MOE 架構的稀疏多體模型?這就是我們追尋 Scaling Law 的不同路徑。

但是發(fā)展到今天這個(gè)地步,這里面維度已經(jīng)非常非常多,你可以在很多方面去做這件事,但反過(guò)來(lái)看,它的難度和復雜度又上升了。所以我理解想要實(shí)現 GPT 5,或者我們自己下一代的模型,這里邊技術(shù)要探索的東西還是非常非常多的。

李大海:我認為 Scaling Law 是非常重要的。Scaling Law 其實(shí)是一個(gè)經(jīng)驗公式,是整個(gè)行業(yè)對于大模型這樣一個(gè)復雜系統觀(guān)察以后的一個(gè)經(jīng)驗總結,這個(gè)經(jīng)驗總結會(huì )隨著(zhù)我們模型訓練工作過(guò)程中做的實(shí)驗越來(lái)越多、認知越來(lái)越清晰,會(huì )有更加細的顆粒度的認知。

比如我們發(fā)現除了前面這些維度之外,在模型訓練中的訓練方法對于 scaling law、對于智能的影響也是比較顯著(zhù)的。那這個(gè)顯著(zhù)的影響在我們固定住參數規模以后,其實(shí)會(huì )變得非常重要?,F在大家覺(jué)得參數規模能夠不斷地往上 scale,它是低垂的果實(shí),只要擴就可以。但是一旦參數固定了,要讓端側的芯片去支撐這個(gè)規模的模型、做到足夠好的智能,那么數據的質(zhì)量、訓練的方法這些都變得非常重要。

 

談行業(yè):價(jià)格戰有利于大模型的普及,但需要更健康的方式

王仲遠:最近其實(shí)也關(guān)注到一個(gè)非常熱門(mén)的新聞,Stanford 的團隊抄襲了面壁的 MiniCPM,你怎么看這個(gè)事?

李大海:我們也沒(méi)有想到會(huì )以這種方式出圈。我要澄清一下,這是海外個(gè)別學(xué)生的個(gè)人行為,它不代表任何更大的、比如斯坦福這個(gè)學(xué)校的行為。這個(gè)事件發(fā)生了以后,像斯坦福的系主任、以及一些西方同行都表達了非常正的觀(guān)點(diǎn)。

這些學(xué)生宣稱(chēng)這個(gè)模型的多模態(tài)能力是跟 GPT 4 v 和 Gemini Pro 對標,但是參數只有后者的 1%,并且還只需要 500 美金就可以訓練出來(lái)。那前兩項是真的,我們的模型真的是有這樣的能力,但是 500 美金是訓不出來(lái)的,還是要花很多的錢(qián)。

因為這個(gè)事件,我們會(huì )更加堅定的相信開(kāi)源的力量。因為其實(shí)這不是我們自己發(fā)現的,而是靠我們開(kāi)源熱心的參與者發(fā)現的,他們會(huì )在里面貢獻需求、貢獻反饋,這些都是開(kāi)源生態(tài)非常重要的組成部分。王仲遠:百川也把自己的百川 1、百川 2 都對外開(kāi)源了,你們當時(shí)訓也花了不少錢(qián),當時(shí)把模型對外開(kāi)源的考量是什么?

王小川:我覺(jué)得第一是市場(chǎng)有這樣的需求,我們大概是去年 6 月開(kāi)的第一版、9 月開(kāi)了第二版,當時(shí)國內對大模型屬于一種大家熱情惶恐、也需要快速入場(chǎng)的狀態(tài)。

當時(shí)美國既有大的閉源生態(tài)、也有 llama 這樣的開(kāi)源生態(tài),所以我們想做這件事。我們是把自己最好的模型開(kāi)源的這么一個(gè)廠(chǎng)商,得到了市場(chǎng)的很多認可,也給了我們很好的 credits,這對我們是挺大的鼓舞。不管是后面人才的儲備、資本的這種關(guān)注,也算是給行業(yè)交了一個(gè)投名狀。

另一方面,我們也看到模型會(huì )快速的進(jìn)步。所以在當時(shí)開(kāi)源是不是把「底褲」拿出去了、就沒(méi)有競爭力了?我覺(jué)得不會(huì )的。今天我們最好的模型,可能在明天就是一個(gè)不夠好的模型了。所以從商業(yè)競爭上,我們其實(shí)也沒(méi)什么大的損失。

今天有很多公司也在做各種開(kāi)源,我覺(jué)得大家共同在做這樣的一個(gè)貢獻,也希望這個(gè)生態(tài)能夠越做越好。

王仲遠:隨著(zhù)大模型的發(fā)展,AI 安全問(wèn)題也被不斷的討論,我們大模型的產(chǎn)業(yè)界怎么去看 AI 安全問(wèn)題?它是一個(gè)當下最急迫的問(wèn)題嗎?

楊植麟:我認為 AI 安全非常重要,雖然它可能不是當前最緊迫的問(wèn)題,但我們需要提前準備。隨著(zhù)模型的發(fā)展,根據 scaling law,每隔幾個(gè)月、算力提升 10 倍,智能水平也會(huì )隨之提高。

在這個(gè)過(guò)程中,我覺(jué)得有兩個(gè)重要方面。首先,模型可能會(huì )因用戶(hù)的惡意意圖而被利用,導致一些不應發(fā)生的事情。例如,現在有研究在做 prompt injection,防止用戶(hù)在提示中注入不恰當的意圖。

其次,模型本身是否會(huì )有自己的動(dòng)機?這與訓練方式有關(guān),能否在模型的底層注入 AI 憲法以框定其行為,無(wú)論用戶(hù)指示什么或模型自身的想法是什么,它都不會(huì )違背這一憲法。我認為這是非常重要的。

王小川:我想提三點(diǎn)關(guān)于 AI 安全的事情:

首先是意識形態(tài)安全。作為一個(gè)中國的大模型,我們的意識形態(tài)需要與國家價(jià)值觀(guān)和意識形態(tài)保持一致,這是我們必須做到的底線(xiàn)。

第二個(gè)是空談的、比較遠的安全問(wèn)題。有人擔心模型是否會(huì )毀滅人類(lèi),進(jìn)而掌握世界。我不認為會(huì )發(fā)生這種事情。去年底我寫(xiě)了一封公開(kāi)信,講到 AGI 應該幫助我們繁榮和延續人類(lèi)文明,而不是將 AI 作為機器,當作工具和奴隸。從文明的標準來(lái)看的話(huà),第二層的安全帶有理想的色彩。

第三個(gè)安全是比較現實(shí)的?,F在讓 AI 去做個(gè)醫生都是好難的事,如果連醫療都搞不定、能力如此之弱,那就不用擔心 AI 顛覆人類(lèi)的問(wèn)題。所以近期 AI 還沒(méi)碰到今天人類(lèi)文明安全的邊界,當前我們還是努力把它的能力提上去。

張鵬:我們一直非常關(guān)注 AI 安全問(wèn)題。前不久,我們還跟全球 15 家與 AI 相關(guān)的企業(yè)一起,簽署了一份關(guān)于前沿人工智能安全的承諾。所謂負責任的 AI 這件事,它比安全要更大一點(diǎn)。就是我們需要確保技術(shù)真正幫助人類(lèi)、社會(huì )和地球,而不是去作惡。

人的兩面性很難說(shuō),你們保證沒(méi)有人去拿這個(gè)事情去作惡,但現實(shí)社會(huì )中已經(jīng)有人在做這些事情。防守總是比破壞難。討論安全的意義并不是說(shuō),我們現在能拿出多么安全的技術(shù)方法或者管理規定,約束大家不要去做這件事情。而是在于說(shuō)增強大家的了解、形成統一的認識。把問(wèn)題擺到桌面上來(lái),那總有解決的辦法。

李大海:我認為當前階段的 AI 安全主要集中在基礎安全和內容安全這兩個(gè)方向?,F階段的大模型本質(zhì)上是只讀的,模型訓練好后,權重是固定的,推理不會(huì )影響權重,你的權重是在線(xiàn)下再去持續的階段性訓練的。

有一天當我們把模型部署到機器人或其他終端設備上,它能夠動(dòng)態(tài)地更新自己的權重之后,安全問(wèn)題會(huì )變成一個(gè)非常非常重要的問(wèn)題。

王仲遠:你們怎么看近期大模型的價(jià)格戰?它是更有利于大模型的普及,還是并不利于企業(yè)的發(fā)展?

楊植麟:這是一個(gè)非常好的問(wèn)題。如果我們把時(shí)間線(xiàn)拉得足夠長(cháng),最終還是會(huì )回歸到價(jià)值本身。我有三個(gè)判斷:

第一,如果我們去看算力的投入,未來(lái)我我們投入在推理上的算力,在未來(lái)某個(gè)時(shí)間點(diǎn)之后,將顯著(zhù)超過(guò)訓練所需的算力。這將標志著(zhù)你的價(jià)值開(kāi)始釋放,前期用于訓練的成本將被很大程度覆蓋。

第二,從 C 端的角度來(lái)看,推理成本將顯著(zhù)低于獲客成本??赡軓纳虡I(yè)本質(zhì)上來(lái)講,它可能不會(huì )跟之前的各種商業(yè)模式有非常本質(zhì)的區別。

第三,今天 AI 在整個(gè)人的工作流程中的占比還很低,大約只有 1%,也就是說(shuō)人做的事情要多于 AI 做的事情。我覺(jué)得在某個(gè)時(shí)間點(diǎn),當 AI 承擔的工作量逐漸超過(guò)人做的事情時(shí),新的商業(yè)模式將會(huì )產(chǎn)生。它可能就不是今天在 B 端去做 API 的價(jià)格戰,而是一個(gè)普惠的 AI、同時(shí)是根據它產(chǎn)生的價(jià)值來(lái)進(jìn)行分成的商業(yè)模式。

我覺(jué)得這三個(gè)因素將是改變商業(yè)模式本身、或者 ROI 的重要趨勢。

王小川:我認為當前的價(jià)格戰對中國發(fā)展大模型是非常有利的,我積極看待這種現象。首先需要區分價(jià)格戰對單個(gè)公司的影響和對整個(gè)市場(chǎng)的影響。價(jià)格戰是一種市場(chǎng)行為,具有競爭導向,它至少帶來(lái)兩個(gè)好處。

第一,更多公司和個(gè)人能使用大模型。以前很多企業(yè)不懂這個(gè),但現在就像一場(chǎng)普及運動(dòng),很多公司可以免費或者便宜的使用大模型,吸引了更多企業(yè)和個(gè)人參與,這是對整個(gè)市場(chǎng)的第一個(gè)好處。

第二,它減少了浪費。以前大家對大模型感到恐慌的時(shí)候,我就觀(guān)察到很多企業(yè)但凡有點(diǎn)技術(shù)能力,都說(shuō)我自己要訓有大模型。明明它該是大模型的使用方,但都想轉型成為大模型的供給方,其實(shí)帶來(lái)很多的人才、資金和社會(huì )資源的浪費。價(jià)格戰讓很多企業(yè)開(kāi)始清醒了,我干嘛非得做?我的競爭優(yōu)勢在什么地方?浪費會(huì )減少很多。

之前沒(méi)有價(jià)格戰的時(shí)候,中國可能真的是上百、上千個(gè)大模型在訓練,那現在有了明確的市場(chǎng)分層,這種競爭力就能起來(lái)。

張鵬:我基本贊同這個(gè)觀(guān)點(diǎn),之前還有人來(lái)問(wèn)我們是不是價(jià)格戰的發(fā)起者,我說(shuō)這是子虛烏有。我們一直秉持的理念是,通過(guò)技術(shù)和創(chuàng )新大幅降低使用成本,從而推動(dòng)技術(shù)普及,讓更多人享受其收益。

我們長(cháng)期以來(lái)提供的價(jià)格在行業(yè)內一直處于極低水平,這是因為我們的技術(shù)確實(shí)能夠做到這一點(diǎn),能把中間的成本空間釋放出來(lái),當做大家的收益,幫助大家把 ROI 算出大于 1 的數字來(lái)。

當然這個(gè)事情從宏觀(guān)角度來(lái)講,肯定是說(shuō)有利于整個(gè)中國的大模型產(chǎn)業(yè),有更多人來(lái)使用。就像我們說(shuō)的,大模型會(huì )變成像水電一樣的基礎設施,非常便宜且隨時(shí)可用,企業(yè)不用再為高投入和回報問(wèn)題而糾結。對企業(yè)來(lái)講,會(huì )是一個(gè)很好的發(fā)展態(tài)勢。

這也是我們一直在堅持做的事情。最近 20 號我們發(fā)布的新模型,真的把成本壓低到我們都不好意思報價(jià)的程度。以前報價(jià)可能是一千 token 幾分錢(qián),就沒(méi)有比這個(gè)更小的單位了,那怎么辦呢?現在變成每百萬(wàn) token 幾分錢(qián),已經(jīng)到了這樣的一個(gè)地步了。

我覺(jué)得這事對整體是有好處,但也要注意不要去過(guò)多的關(guān)注和宣揚這件事情。商業(yè)上,它肯定是犧牲企業(yè)的短期的利益,虧本做買(mǎi)賣(mài),這不是一個(gè)正常的商業(yè)邏輯。它肯定是只能持續很短的時(shí)間,真正還得回歸到最終的用戶(hù)價(jià)值、生產(chǎn)力價(jià)值上。

李大海:我們做端側,就是看到了端側快速落地的潛力。最近有一個(gè)機構的調研顯示,全國 10 億用戶(hù)的手機端算力相當于 100 萬(wàn)片 H100。這是一個(gè)非??鋸埖臄底?,如果這些手機算力能夠被好好利用起來(lái),我們很多的應用就可以落地了。

現在到未來(lái),我們都需要端側模型和云側模型的良好協(xié)同。端側有獨特優(yōu)勢,比如隱私性好和更可靠,但云側的模型能力更強。所以怎么有效地協(xié)同端側和云側模型,是我們與其他模型公司共同需要解決的問(wèn)題。

我也同意前面提到的觀(guān)點(diǎn),我認為當前的價(jià)格戰多少帶有一些營(yíng)銷(xiāo)成分。但是我相信未來(lái)價(jià)格會(huì )比現在更低,同時(shí)大家也能獲得利潤,這才是健康的方式,并且這才能真的能讓千行百業(yè)的應用往下落地。

 

最新文章

極客公園

用極客視角,追蹤你不可錯過(guò)的科技圈.

極客之選

新鮮、有趣的硬件產(chǎn)品,第一時(shí)間為你呈現。

張鵬科技商業(yè)觀(guān)察

聊科技,談商業(yè)。

抚远县| 扬中市| 弥勒县| 潼关县| 化州市| 来凤县| 信宜市| 阜康市| 邹平县| 绥滨县| 浪卡子县| 谷城县| 宣威市| 广河县| 达州市| 抚远县| 印江| 孝昌县| 漳州市| 贡嘎县| 青田县| 惠来县| 湖口县| 芜湖县| 翁牛特旗| 峨眉山市| 县级市| 舒兰市| 锡林浩特市| 永州市| 远安县| 介休市| 通山县| 青州市| 泰安市| 焦作市| 西安市| 宣城市| 壤塘县| 宾川县| 武冈市|