數(shù)字金融
網(wǎng)絡(luò)營銷推廣
電商服務(wù)
來源:中國新聞周刊
2023年,AI大模型無疑是國內(nèi)外科技領(lǐng)域最受關(guān)注的話題之一。ChatGPT大火,人們似乎看到通用人工智能的曙光??萍季揞^、創(chuàng)業(yè)者乃至各個(gè)行業(yè)紛紛推出自研大模型。據(jù)北京市科委等統(tǒng)計(jì),截至2023年10月,國內(nèi)大模型廠商及高校院所共計(jì)254家,上演“百模大戰(zhàn)”。
大模型熱潮中,小冰公司CEO李笛是一個(gè)特別的存在。小冰公司的前身是微軟(亞洲)互聯(lián)網(wǎng)工程院人工智能小冰團(tuán)隊(duì),公司曾發(fā)布過AI聊天機(jī)器人“小冰”。因此,當(dāng)ChatGPT爆火時(shí),小冰很容易被當(dāng)作對比的對象。去年,在接受《中國新聞周刊》在內(nèi)的媒體采訪時(shí),李笛都提到,他承認(rèn)大模型的進(jìn)步,但并非大模型的“門徒”。他認(rèn)為模型不用一味求大,更愿意談技術(shù)如何商業(yè)化應(yīng)用。
當(dāng)時(shí),李笛被看作是個(gè)“異類”。用他的話講,大模型最熱的時(shí)候,行業(yè)里不用“信仰”這個(gè)詞就落伍了。到了2024年,經(jīng)歷了卷百億甚至千億參數(shù)的軍備競賽后,國內(nèi)大模型廠商逐漸務(wù)實(shí),落地應(yīng)用成為2024年行業(yè)關(guān)注的焦點(diǎn)。
日前,《中國新聞周刊》專訪小冰公司CEO李笛,他談起過去一年對大模型熱的感悟?,F(xiàn)在的他語氣輕松,李笛坦言,2023年,他曾面臨極大壓力,甚至曾動(dòng)搖不卷大模型的想法。
創(chuàng)新和保守天然對立,科技行業(yè)的人非常害怕被認(rèn)為是保守的。但另一面,李笛從2013年加入小冰團(tuán)隊(duì),見證了人工智能領(lǐng)域發(fā)展的幾次浪潮,很多公司在風(fēng)口中迷失。和李笛的專訪,并不只是在探討大模型,而是一個(gè)人面對巨大誘惑和時(shí)代焦慮時(shí),如何堅(jiān)持自己,做一個(gè)長期主義者。
以下是李笛的自述。
“你不用‘信仰’這個(gè)詞就落伍了”
我們是國內(nèi)較早接觸GPT大模型的一批人。2020年,小冰從微軟獨(dú)立出來前,我是微軟Bing搜索引擎亞洲區(qū)總經(jīng)理,微軟將ChatGPT放在搜索引擎中,推出New Bing,我們都較早地看過了。當(dāng)我們的興奮勁已經(jīng)過去時(shí),國內(nèi)才開始興奮。
因此,我們也更早意識到,大模型有一些問題。比如,目前從技術(shù)上判斷,要實(shí)現(xiàn)人工智能能力更大程度的飛躍,需要在GPT-4的基礎(chǔ)上,把參數(shù)規(guī)模再提升三個(gè)數(shù)量級,但人們在短期內(nèi)無法解決算力的挑戰(zhàn)。此外,一味追求參數(shù)規(guī)模越來越大,并不會(huì)有新能力涌現(xiàn)。最近,行業(yè)里也有一些公司開始推出小模型。去年2月,我還判斷過,如何商業(yè)落地是大模型的核心問題。過了近一年,業(yè)內(nèi)越來越多開始討論大模型該如何應(yīng)用。
去年,我觀察到,國內(nèi)很多企業(yè)開始圍繞大模型進(jìn)行軍備競賽,背后主要有三種考量。第一種是,GPT-4推出后,大模型沒有新能力的涌現(xiàn),像是卡在了紅綠燈路口,但很多人還要沖刺,因?yàn)樗麄兿胭€當(dāng)自己沖到紅綠燈路口時(shí),紅燈變綠,自己取得突破,領(lǐng)先行業(yè)。這一判斷確實(shí)存在一定概率,但大部分情況下,技術(shù)創(chuàng)新迭代并非一飛沖天,而是發(fā)展一波后被卡住,一段時(shí)間后再迎來一波創(chuàng)新。這才是科技史的常態(tài)。
其次,國內(nèi)現(xiàn)在有200多家大模型公司,其中很多并非傳統(tǒng)意義的人工智能公司,而是各個(gè)垂直領(lǐng)域的企業(yè),比如能源企業(yè)等。他們相信在掌握大模型技術(shù)后,能有機(jī)會(huì)打破該領(lǐng)域原有的競爭格局。這是因?yàn)榇竽P偷幕咎卣魇谴罅Τ銎孥E,準(zhǔn)入門檻低,可以很快看到一個(gè)結(jié)果,給了不同行業(yè)的人一個(gè)幻想。但深入后人們會(huì)發(fā)現(xiàn),結(jié)果不如想象中那么美好。
最后一種是,他們只是把大模型當(dāng)作一個(gè)概念,來獲得一個(gè)新的賣點(diǎn),就像是當(dāng)年的元宇宙。
我們觀察到了這些現(xiàn)象,所以,我不愿意說“信仰大模型”,大模型只是我們眾多技術(shù)迭代的一部分。去年年初,你說大模型的技術(shù)好,還是比較客觀的,但后來逐漸演變成,如果你不用“信仰”這個(gè)詞就落伍了。我記得當(dāng)時(shí)參加行業(yè)會(huì)議,在我前后演講的人講到大模型,都會(huì)提到“工業(yè)革命”。當(dāng)一個(gè)行業(yè)只有用這么夸張的表達(dá)才能證明不保守時(shí),就一定是個(gè)非常大的泡沫。我不想神化大模型,它是個(gè)有用的工具,解決了很多過去的問題,但它不是靈丹妙藥。
我現(xiàn)在說的時(shí)候放松多了,因?yàn)樾袠I(yè)現(xiàn)在開始有了這樣的共識。在人工智能領(lǐng)域,一直沒有產(chǎn)生真正成功的面向企業(yè)和消費(fèi)者的產(chǎn)品。2020年前,小冰還在微軟時(shí),不太受外界影響。但2020年,小冰從微軟分拆為獨(dú)立公司運(yùn)營,作為創(chuàng)業(yè)公司,我們還沒有能力決定自己的生存時(shí),如果跟行業(yè)主流有很大不同,會(huì)有很多人不認(rèn)同你。去年2月,就有投資人問我,你是不是反對大模型?有投資人甚至跟我說,小冰也要做超大規(guī)模的、超大參數(shù)的大模型,我也差點(diǎn)沒扛住。
外界對我們的誤解是,我們不做大模型。我們很早就在關(guān)注,而且一直深入其中。但我們不拼大參數(shù),更關(guān)注的是中等參數(shù)規(guī)模和小參數(shù)規(guī)模大模型的可用性。很早Google就發(fā)過論文稱,650億參數(shù)以下的模型,沒有產(chǎn)生明顯的思維鏈能力。我們當(dāng)時(shí)不這么認(rèn)為,現(xiàn)在回頭看,我們賭對了,參數(shù)在幾百億,甚至幾十億的大模型,也有這個(gè)能力。
今年1月,我們剛剛宣布獲得“小冰大模型”的國內(nèi)備案,并發(fā)布Rinna大模型等多款產(chǎn)品。早在去年,我們的日本團(tuán)隊(duì)推出Rinna大模型。小冰大模型最大尺寸是 14B,即140億參數(shù),最小的是3.6B的模型。3.6B的模型在國外專業(yè)榜單中下載量和質(zhì)量評分都高于參數(shù)650億的Meta大模型,就是因?yàn)槲覀冊陬A(yù)訓(xùn)練數(shù)據(jù)上下了功夫。
“被看作‘AI舊世代’,也是一種榮幸”
和其他行業(yè)相比,科技行業(yè)有一個(gè)突出現(xiàn)象:科技行業(yè)的人非常害怕被認(rèn)為是保守的。在公開場合,當(dāng)我們對一個(gè)新技術(shù)、特別是像大模型這么亮眼的新技術(shù)發(fā)表評論時(shí),哪怕只是客觀評價(jià)說“大模型是好的,但它不是全部,它沒有把過去很多東西顛覆掉”,就已經(jīng)算是保守了。
我們在2013年組建小冰團(tuán)隊(duì),十年中,我們送走一波又一波風(fēng)口追逐者,比如之前做智能語音助手、智能音箱等各種人工智能產(chǎn)品的創(chuàng)業(yè)者。從玩家角度,這一次國內(nèi)大模型的熱潮,活躍的多是近兩年成立人工智能企業(yè),因?yàn)楹芏喙径荚谶^去一波波風(fēng)口中迷失了。面對這種短期的熱潮,我們看似保守,但我們是目前為止存活越長的人工智能企業(yè)之一。從這一角度來看,我們被一些聲音質(zhì)疑為“AI舊世代”,也是一種“榮幸”。但另一面,我們也承受了不少壓力。
我們在微軟時(shí),還算是在象牙塔,獨(dú)立出來后才發(fā)現(xiàn),在科技行業(yè)想要堅(jiān)持做一件事情,是非常奢侈的。因?yàn)橹袊目萍脊?,本質(zhì)上是由一級市場、二級市場“擊鼓傳花”來完成企業(yè)的基本輸血。很多公司及其投資人會(huì)把上市定義為最主要的目標(biāo)。如果公司不追風(fēng)口,就不能拿到下一筆融資,上一筆融資的投資人就沒辦法獲得更高的企業(yè)估值,也就沒有辦法跟LP(有限合伙人)交代。這也是人之常情,但這使得很多創(chuàng)業(yè)公司的戰(zhàn)略不得不走樣了。
前段時(shí)間,有消息稱,一個(gè)剛畢業(yè)的自然語言處理專業(yè)的博士生,年薪就有300萬元,這是不合理的,也會(huì)影響博士生的自我職業(yè)認(rèn)知。創(chuàng)業(yè)公司愿意給出這么高的薪酬,并不是因?yàn)樗麄兘o公司創(chuàng)造了價(jià)值,而是當(dāng)公司去拉投資時(shí),用以回復(fù)投資人關(guān)注的指標(biāo),比如公司有多少博士,或者有多少從Open AI出來的人。有些博士生在創(chuàng)業(yè)公司待了三個(gè)月,又被另一家公司以更高的薪酬挖走。博士生肯定是開心的,但他們在創(chuàng)業(yè)公司間不斷流轉(zhuǎn)時(shí),除了薪酬提升,沒有機(jī)會(huì)真正做有意義的研究。
你很難說這是投資人的問題,因?yàn)橥顿Y人要對LP負(fù)責(zé)。也很難說是LP的問題,因?yàn)樗麄兲湾X就是為了獲得回報(bào)。這似乎是一個(gè)沒有人錯(cuò)的事情,也是中國科技領(lǐng)域很難誕生原始創(chuàng)新的原因之一。
我們?nèi)ツ暌苍媾R很大的壓力。投資界在經(jīng)歷2022年巨大的失落情緒后迎來人工智能的浪潮,投資人看到了春天。去年在人工智能行業(yè)里,固然有對大模型抱有熱情的人,他們往往是科研工作者。除此之外,更多科技公司表現(xiàn)出的是一種焦慮。就像應(yīng)試教育下的心態(tài),不能輸在起跑線上,盡管不知道它是什么,但總覺得錯(cuò)過一定會(huì)后悔。這種焦慮在行業(yè)內(nèi)傳遞,但創(chuàng)新很難在焦慮中產(chǎn)生。
我個(gè)人也特別希望出現(xiàn)一個(gè)大模型,和小冰的對話框連接后,所有對話的問題都能解決,這是我做夢都會(huì)笑醒的事情。但這很難實(shí)現(xiàn),背后還需要很多服務(wù)。這就像是一個(gè)個(gè)人電腦,不是說有一個(gè)CPU就得到了一切,還要有主板,CPU本身也是一個(gè)超級大規(guī)模的集成電路,需要各種模塊組合。
人工智能領(lǐng)域從來不缺很酷的東西。當(dāng)年,微軟利用人臉識別技術(shù)做了個(gè)應(yīng)用叫“How Old”,上傳一張照片,就能識別年齡,一時(shí)間風(fēng)靡。前一陣,機(jī)器人跳“科目三”也很酷。但真正缺的、值得我們重視的是商業(yè)模式的探索,這意味著并不只是賺錢,而是究竟如何讓人們真正認(rèn)同人工智能的價(jià)值,并為之買單。
我有一個(gè)印象深刻的體會(huì),產(chǎn)品價(jià)值和技術(shù)不一定是息息相關(guān)的。比如有的機(jī)器人會(huì)跳舞,但人們玩膩了,就會(huì)把它忘掉。但你發(fā)現(xiàn),很多女生從小買的布娃娃,毫無科技含量,但她們對它傾注了巨大的情感,有人甚至在長大后會(huì)花1萬塊錢去修復(fù)兒時(shí)的“伙伴”。技術(shù)在其中不一定需要扮演什么角色。
今天,大家用大模型進(jìn)行很多輪對話。很多人都認(rèn)為,大模型要更智能、更聰明,像愛因斯坦一樣。但生活中,我們不總是因?yàn)橐粋€(gè)人足夠聰明,才會(huì)和對方交朋友。有的人可能笨笨的,但很善良,你就不把對方當(dāng)朋友嗎?人不是這樣的。那為什么我們在做科技產(chǎn)品時(shí),就一定認(rèn)為更先進(jìn)的技術(shù)會(huì)更好?不一定,關(guān)鍵是如何把它用在更合適的地方。
前段時(shí)間,我在朋友圈看到,因?yàn)槲④浬暇€了免費(fèi)的大模型 Copilot移動(dòng)版,很多人就說終于可以退訂ChatGPT Plus了,不用支付每個(gè)月20美元的會(huì)員費(fèi)。這其中還有一個(gè)很有錢的人,他都認(rèn)為20美元太貴。但你要想,有的學(xué)生在游戲里買“皮膚”都會(huì)花好幾百元。人不總是按照理性來衡量一些事情的。
2024年,我預(yù)測人工智能行業(yè)發(fā)展會(huì)退熱,現(xiàn)在的大模型同質(zhì)化嚴(yán)重,大家參數(shù)規(guī)模差不多,市面上用不了這么多大模型。而且用戶的付費(fèi)意愿又不是很容易建立。一些去年融到錢的企業(yè)也可能會(huì)引發(fā)新的內(nèi)卷,其實(shí)這些內(nèi)卷的行為已經(jīng)在發(fā)生了,只是在 2024 年可能會(huì)更明顯一些。
記者:楊智杰(yangzhijie@chinanews.com.cn)
編輯:杜瑋
運(yùn)營編輯:馬曉軼
特別聲明:以上內(nèi)容僅代表作者本人的觀點(diǎn)或立場,不代表新浪財(cái)經(jīng)頭條的觀點(diǎn)或立場。如因作品內(nèi)容、版權(quán)或其他問題需要與新浪財(cái)經(jīng)頭條聯(lián)系的,請于上述內(nèi)容發(fā)布后的30天內(nèi)進(jìn)行。