文 丨 新浪科技 周文猛
期數:No.39
嘉賓:昆侖萬維董事長兼CEO方漢
“AI時代下個10年出現(xiàn)的巨頭,一定是面向C端用戶的免費訂閱公司?!边@是昆侖萬維董事長兼CEO方漢,對國內人工智能產業(yè)發(fā)展的未來預期。
過去兩年間,隨著ChatGPT的出現(xiàn),方漢所領導的昆侖萬維,由于在生成式AI領域的提前布局備受關注。在技術創(chuàng)新以及新品發(fā)布上,公司也經歷了快速的迭代。
以近期昆侖萬維宣布“天工3.0”基座大模型與“天工SkyMusic”音樂大模型開啟公測為例,天工3.0實現(xiàn)以400B參數暫居全球最大規(guī)模開源MOE大模型的同時,距離上一代天工2.0發(fā)布,僅只過去了兩個月。
快速迭代的背后,國內大模型在技術演化過程中如何實現(xiàn)各行各業(yè)深度融合?未來,國產大模型發(fā)展方向如何?而昆侖萬維又該如何在激烈的市場競爭中占據有利地位?
近日,新浪科技《科創(chuàng)100人》與方漢進行了一場對話,透過雙方對談內容,或許我們能找到一些答案。
“取得垂類SOTA地位,就可獲得增長紅利”
當前,越來越多的國外用戶發(fā)出“OpenAI好像變懶了”的聲音,Google、Anthropic等海外領先AI企業(yè)推出的系列AI模型,也正在不斷收獲好評,在越來越多的領域超越GPT-4。
在國內市場,百度文心、昆侖萬維、科大訊飛、抖音云雀、京東言犀、智譜 AI ChatGLM等均向AI大模型進行探索,覆蓋了內容生成、智能問答、IT支持、數據分析、智能識別等多個場景應用,均對更好融合不同模態(tài)的數據展開探索。
在方漢看來,垂類數據是中國公司上場和發(fā)力的方向?!爸挥杏辛舜诡惛哔|量數據,才有機會在垂直場景里面做到 SOTA(指前沿模型)率先獲得垂直場景的紅利?!?/p>
眾所周知,OpenAI的AI紅利期算比較長遠,但是OpenAI也不能完全做到一切皆能。方漢看到,“在AI音樂、漫畫、社交、自動駕駛等領域,對于國內科技企業(yè)來說或許是可以擁抱的垂類SOTA紅利?!?/p>
方漢相信,“要在垂類上取得SOTA,只要你在某一個區(qū)域某一個語言取得SOTA的地位,你就可以獲得增長紅利高處成長,因為這個是解決有和沒有的問題,而我們也非常有信心在這些領域取得不同垂直的SOTA從而達到高速成長目的?!?/p>
據介紹,為此昆侖萬維構建了六大AI業(yè)務,AI 大模型、AI 搜索、AI 音樂、AI 視頻、AI社交、AI游戲幾大業(yè)務矩陣?!白鳛橐患铱萍脊?,我們入局大模型早,目前基座模型能夠做到全國前五。但是在AI音樂等技術領域,我們一直是國內的SOTA。”方漢說。
“新巨頭三要素,AI、C端、免費”
在國內AI大模型領域,百度文心一言開放了C端+B端,騰訊的混元大模型涵蓋NLP、CV、多模態(tài)、文圖等大模型,科大訊飛推出的新一代認知智能大模型訊飛星火可C端使用,具有跨領域的知識和語言理解能力,能夠基于自然對話方式理解與執(zhí)行任務等等。
通過國產大模型產品的一次次更迭中不難看出,企業(yè)們正通過設計合理的模型結構、利用跨模態(tài)學習技術、引入注意力機制和自監(jiān)督學習以及結合實際應用場景進行優(yōu)化等措施,不斷地提高多模態(tài)融合模型的性能和效果。
“AI時代,下個10年出現(xiàn)的巨頭一定是面向C端用戶的免費訂閱公司”,在方漢看來,“隨著端側推理的到來,會有新的產品模式、新的商業(yè)模式出現(xiàn),C端行業(yè)會受到比較大的變化和重塑。”
就市場而言,無論是社交、音樂、游戲還是內容平臺,昆侖萬維的主營業(yè)務都正在積極主動地擁抱AI技術。對于昆侖萬維而言,AI的“轉型”并非被動應對,而是一次積極主動的革新與升級,這不僅是其未來發(fā)展的關鍵階段,更是決定其能否開創(chuàng)全新格局的重要契機,這也是方漢這位30年互聯(lián)網老兵的AI新征程。
據了解,方漢從1995年開始做互聯(lián)網的研發(fā)工作,到現(xiàn)在為止經歷了三個周期。從互聯(lián)網到移動互聯(lián)網,再到目前的AI,以他的經驗來看,最后成功企業(yè)都是免費加上C端這兩個重要的模式。
然而,大模型如今居高不下的推理成本使得面向C端龐大用戶群體提供免費服務的壓力巨大。為此,方漢總結出了三個路徑:以優(yōu)化模型來降低推理成本、讓基于AI手機和AI PC而產生的端側推理降低推理成本以及基于AI的UGC平臺。這三個路徑分別對應大模型產業(yè)發(fā)展的不同階段。
首先,優(yōu)化模型降低推理成本路徑貫穿大模型技術發(fā)展,然而,模型性能與推理成本是個雙向發(fā)力的“悖論”,一方面,隨著技術發(fā)展,如今每個用戶使用大模型服務時企業(yè)需要付出的推理成本在不斷下降;可另一方面,隨著模型性能的提升、功能的強化,模型推理的成本又在不斷上升,始終處于一個動態(tài)拉扯的階段。
其次,方漢認為,端側AI是大模型的“終局”。未來,AI手機、AI PC等硬件一定會廣泛普及,一部分推理成本將成為用戶的購機成本。不過,由于用戶存在換機周期,端側AI還需要3—5年的普及期。
而在端側AI普及之前,在這場大模型的“中場”階段,方漢最看好AI UGC平臺。“對于AI的UGC平臺而言,1%的創(chuàng)作者使用AI,99%的消費者只要消費AI生成的內容就可以了,是非常理想的中期商業(yè)模式?!?/p>
在方漢看來,“未來十年,AI仍然是互聯(lián)網或者技術投資的一個主賽道,競爭還遠遠沒有到來,高潮也遠遠沒有到來?!?/p>
擁抱AI技術,思考顛覆式創(chuàng)新是方漢對未來國內科技企業(yè)發(fā)展方向的理解。在他看來,只有理解AI技術的邊界以后,創(chuàng)業(yè)者才能做出更好的顛覆式創(chuàng)新,產品和運營才能思考什么是AI能夠賦能的,能夠創(chuàng)造出新的商業(yè)模式和產品模式。
“AI入局音樂圈,讓文化平權”
近日,昆侖萬維宣布新一代天工3.0大模型發(fā)布,該模型采用4000億級參數MoE混合專家模型,超越了3140億參數的Grok-1,宣稱目前最大的開源MoE大模型。
今年2月,昆侖萬維正式發(fā)布新版MoE大語言模型“天工2.0”,如今,距離上一次“天工2.0”發(fā)布剛過去兩個月,最新一代的天工3.0再次發(fā)布。據介紹,相較于上一代天工2.0 MoE大模型,天工3.0在模型語義理解、邏輯推理,以及通用性、泛化性、不確定性知識、學習能力等領域擁有驚人的性能提升,其模型技術知識能力提升超過20%,數學/推理/代碼/文創(chuàng)能力提升超過30%。
“其實昆侖萬維對大模型的研究遠比想象中要早得多,時間回到2020年,這一年ChatGPT還沒有火,但當時昆侖萬維就押注了AIGC賽道。”方漢表示。“昆侖萬維的業(yè)務中大量涉及內容生產,2020年GPT-3出來的時候,我們立刻意識到(大模型)將會徹底顛覆內容生成行業(yè)?!?/p>
“那時候行業(yè)還沒什么GPT路線的人才,都是BERT路線的,我們想抄都沒得抄。只能沿著GPT的路線辛辛苦苦做了3年,但這些苦難也鍛煉了我們獨立解決問題和處理問題的能力,我們把這段經歷總結為‘艱苦奮斗,獨立自主’。”方漢說。
“天工3.0”基座大模型發(fā)布的同時,昆侖萬維“天工SkyMusic”音樂大模型也正式開啟公測。
“中文人聲清晰度、咬字上更好,整體聽上去更清晰”“天工做得明顯比SUNO好聽”。這是自“天工SkyMusic”啟動邀測以來收到的用戶反饋信息,邀測當日便被網友熱議。網友親測后還表示,其玩法也具有新意,可以對歌曲進行改編、二創(chuàng),完全可以展示用戶UGC的AI音樂作品,這些作品也展示了“天工SkyMusic”為普通人提供的創(chuàng)作平臺和可能性。
在方漢看來,選擇入局音樂圈,其實意義非凡。
“在尼日利亞拍攝一部電影的成本大概是2萬美金,當地生產力太落后了,沒有能力去制作一個好的電影作品跟強勢的歐美文化去對抗。”方漢認為,目前市場上是通過大投入來創(chuàng)作好內容,音樂創(chuàng)作也同樣是一項高成本、高風險的投資。而借助AI,全世界的普通人都可以進行低成本創(chuàng)作。
而天工SkyMusic的推出,極大降低了音樂創(chuàng)作門檻,人人皆可以以歌明志。隨著AI大模型技術在AIGC領域的進一步落地,未來,越來越多小語種文化也能夠借助AI創(chuàng)作內容。在方漢看來,“從本質上來說,這也起到了文化平權的作用?!?/p>
在他看來,如果從靜態(tài)的角度看待行業(yè),AI音樂覺得是“切走了音樂行業(yè)的蛋糕”,但如果動態(tài)來看,技術的進步能夠讓音樂市場越來越大,行業(yè)蓬勃發(fā)展,產生新的內容生態(tài)、音樂業(yè)態(tài)。
“中國的AI技術和應用將不斷推動全球音樂產業(yè)的創(chuàng)新和進步,為人類文化的繁榮和發(fā)展做出更大的貢獻?!狈綕h表示。