數(shù)字金融
網(wǎng)絡(luò)營(yíng)銷推廣
電商服務(wù)
來源:管理智慧
哈佛大學(xué)最新研究表明:在接下來的幾年中,生成型人工智能有望深刻改變多種職業(yè)
如今,人工智能已經(jīng)不僅僅屬于技術(shù)專家,幾乎任何人都能通過使用日常語(yǔ)言的指令而不是編程來運(yùn)用AI。我們的研究顯示,大部分商業(yè)功能以及超過40%的美國(guó)工作活動(dòng)能夠通過通用人工智能被增強(qiáng)、自動(dòng)化或徹底改造。預(yù)計(jì)這些變革將對(duì)法律、銀行、保險(xiǎn)及資本市場(chǎng)等行業(yè)影響最大,隨后是零售、旅游、健康和能源行業(yè)。
對(duì)組織及其員工來說,即將到來的這一轉(zhuǎn)變將帶來重大的影響。在未來,我們很多人會(huì)發(fā)現(xiàn),我們的職業(yè)成功將取決于我們能否從像ChatGPT等這樣的大型語(yǔ)言模型中獲取最優(yōu)質(zhì)的輸出,并能與這些模型一同學(xué)習(xí)與進(jìn)步。為了在這個(gè)AI與人類合作的新時(shí)代中脫穎而出,大多數(shù)人需要掌握我們所稱的“融合技能”之一或多個(gè)——智能詢問、融合個(gè)人判斷力和相互學(xué)習(xí)。
智能詢問指的是以能顯著改善思考和結(jié)果的方式指導(dǎo)大型語(yǔ)言模型(或者說,給它們下達(dá)指令)。簡(jiǎn)而言之,這是一種與AI共同思考的技能。例如,一名金融服務(wù)公司的客服人員可能在處理復(fù)雜的客戶問題時(shí)運(yùn)用此技能;制藥科學(xué)家可能用它來探索藥物化合物和分子作用;市場(chǎng)營(yíng)銷人員可能利用它分析數(shù)據(jù)集,以確定最佳零售價(jià)格。
融合個(gè)人判斷力則是在通用AI模型對(duì)下一步行動(dòng)不確定或在其推理中缺乏必要的商業(yè)或倫理背景時(shí),加入人類的判斷力。這一做法旨在使人機(jī)交互的結(jié)果更加值得信賴。判斷整合需要洞察何時(shí)、何地以及如何介入,其有效性可以通過AI輸出的可靠性、精確性和可解釋性來評(píng)估。
相互學(xué)習(xí)是你可以通過將豐富的數(shù)據(jù)和組織知識(shí)整合到你對(duì)AI的指令中,幫助它理解你的業(yè)務(wù)需求,從而將其培養(yǎng)成為你的創(chuàng)造伙伴。這種技能可以將通用AI定制化到適應(yīng)公司的具體業(yè)務(wù)環(huán)境,使其能夠?qū)崿F(xiàn)你期望的成果。在此過程中,你也將學(xué)會(huì)如何訓(xùn)練AI處理更高級(jí)的挑戰(zhàn)。相互學(xué)徒制曾是數(shù)據(jù)科學(xué)家和分析專家構(gòu)建模型時(shí)的專利,如今它在非技術(shù)崗位上也顯得日益重要。
為何需要系統(tǒng)地培養(yǎng)這些關(guān)于思考、建立信任和個(gè)性化定制的新技能呢?實(shí)證研究一致表明,目前大多數(shù)員工對(duì)大型語(yǔ)言模型的臨時(shí)指令通常會(huì)導(dǎo)致不穩(wěn)定或不理想的結(jié)果,特別是在處理復(fù)雜的推理任務(wù)時(shí)。這一點(diǎn)在從客服到市場(chǎng)營(yíng)銷、物流、研發(fā)等各個(gè)功能領(lǐng)域均是如此。因此,我們所有人在工作中使用通用AI時(shí)都需要增加更多的嚴(yán)謹(jǐn)性。本文將闡釋如何實(shí)現(xiàn)這一目標(biāo)。
01
智能詢問
如何提升大型語(yǔ)言模型(LLM)這類基于海量數(shù)據(jù)和概率驅(qū)動(dòng)(而非人類邏輯)的復(fù)雜系統(tǒng)的輸出?這里有幾種方法可供使用。
1、逐步推理。
在指導(dǎo)通用AI時(shí),你需要將過程拆分為若干個(gè)步驟,并致力于優(yōu)化每個(gè)環(huán)節(jié),這類似于工業(yè)制造初期科學(xué)管理的方法。但AI處理的不是裝配線,而是一連串的思考過程,目的是尋找解決方案。研究顯示,當(dāng)通用AI被引導(dǎo)以這種方式拆解推理任務(wù)時(shí),其性能會(huì)顯著提高,這在處理復(fù)雜問題時(shí)尤其有效,OpenAI的研究員Jason Wei在首次探索“思維鏈條推理”時(shí)就已證明了這一點(diǎn)。
事實(shí)上,向LLM的指令中加入“讓我們逐步思考”這樣的簡(jiǎn)單短語(yǔ),可以在從數(shù)學(xué)到策略推理的多種任務(wù)中將其輸出的準(zhǔn)確度提高三倍以上。比如,你的AI提示可能是:“我的部門有50萬(wàn)美元預(yù)算,已經(jīng)用20%購(gòu)買設(shè)備,30%用于招聘新員工。我們剛獲得了5萬(wàn)美元的預(yù)算增加。我們的剩余預(yù)算是多少?讓我們逐步思考?!蹦P蛯⑤敵觯骸捌鸪?,你部門有50萬(wàn)美元。你花了20%,即10萬(wàn)美元購(gòu)買設(shè)備,剩余40萬(wàn)美元。你又分配了30%,即15萬(wàn)美元用于新招聘,預(yù)算降至25萬(wàn)美元。最后,你收到了5萬(wàn)美元的預(yù)算增加,剩余預(yù)算為30萬(wàn)美元。”盡管大多數(shù)人可以在頭腦中做出這種計(jì)算,但LLM(其運(yùn)算速度更快)能被訓(xùn)練去詳細(xì)解釋在更復(fù)雜的量化問題上的計(jì)算過程,如計(jì)算銷售代表在多個(gè)城市間行駛的最短路線。這種方法產(chǎn)生了一個(gè)可追蹤的推理鏈,不是在一個(gè)黑箱過程結(jié)束時(shí)突然給出答案,而是讓你能夠驗(yàn)證結(jié)果的準(zhǔn)確性。
2、分階段訓(xùn)練大型語(yǔ)言模型應(yīng)對(duì)復(fù)雜任務(wù)。
在需要特定職業(yè)和領(lǐng)域知識(shí)的領(lǐng)域,如法律、醫(yī)療、科研或庫(kù)存管理中,可以逐步引入AI以達(dá)到更優(yōu)效果。
舉例來說,麻省理工學(xué)院的研究者Tyler D. Ross和Ashwin Gopinath特近期探討了開發(fā)一種“AI科學(xué)家”的可能性,該科學(xué)家能整合多種實(shí)驗(yàn)數(shù)據(jù)并提出可檢驗(yàn)的假設(shè)。他們發(fā)現(xiàn),當(dāng)這一復(fù)雜任務(wù)被細(xì)分為若干子任務(wù)時(shí),ChatGPT 3.5-Turbo能通過微調(diào)學(xué)習(xí)DNA的結(jié)構(gòu)生物物理。在庫(kù)存管理這類非科學(xué)領(lǐng)域,子任務(wù)可能包括需求預(yù)測(cè)、庫(kù)存數(shù)據(jù)收集、訂貨預(yù)測(cè)、訂貨量評(píng)估和性能評(píng)估。對(duì)于每個(gè)子任務(wù),管理者會(huì)利用自身的專業(yè)知識(shí)和信息來訓(xùn)練、測(cè)試和驗(yàn)證模型。
3、與大型語(yǔ)言模型進(jìn)行創(chuàng)新型探索。
從戰(zhàn)略制定到新產(chǎn)品開發(fā)的許多工作流程都是開放式和迭代的。為了充分利用這些活動(dòng)中的人工智能互動(dòng),你需要引導(dǎo)機(jī)器設(shè)想多種潛在解決方案的路徑,并以更加靈活和多元的方式作出響應(yīng)。
這種智能詢問可以提高大型語(yǔ)言模型在預(yù)測(cè)復(fù)雜財(cái)經(jīng)和政治事件方面的精準(zhǔn)度,正如Philip Schoenegger, Philip Tetlock及其團(tuán)隊(duì)最近的研究所示。他們將人類預(yù)測(cè)者與被訓(xùn)練為“超級(jí)預(yù)測(cè)者”的GPT-4助手配對(duì),這些助手能夠?yàn)椴煌Y(jié)果分配概率和不確定性區(qū)間,并就每個(gè)結(jié)果提供正反兩面的論證。研究發(fā)現(xiàn),這些助手的預(yù)測(cè)結(jié)果(涵蓋從某一特定日期的道瓊斯運(yùn)輸平均指數(shù)收盤價(jià)到2023年12月通過地中海進(jìn)入歐洲的移民數(shù)量)比未經(jīng)特定訓(xùn)練的大型語(yǔ)言模型的預(yù)測(cè)結(jié)果準(zhǔn)確度提高了43%。
02
融合個(gè)人判斷力
在AI生成過程中引入專家級(jí)別及道德層面的人類判斷對(duì)于確保輸出的可信度、準(zhǔn)確性和可解釋性,以及對(duì)社會(huì)產(chǎn)生正面影響極為關(guān)鍵。這里有一些你可以采用的方法:
1、整合檢索增強(qiáng)生成(RAG)。
大型語(yǔ)言模型(LLMs)不只有可能產(chǎn)生虛構(gòu)信息,它們訓(xùn)練所用的數(shù)據(jù)和信息往往也是多年前的。在運(yùn)用LLMs時(shí),用戶經(jīng)常需要就輸出中的可靠、相關(guān)及最新信息的必要性做出判斷。如果這類信息是關(guān)鍵的,你可以利用檢索增強(qiáng)生成(RAG)技術(shù),從權(quán)威的知識(shí)庫(kù)中添加信息到商用LLM的訓(xùn)練資源中。這樣可以有效防止誤信息、過時(shí)的回應(yīng)和不精確的數(shù)據(jù)。例如,制藥研究者可能會(huì)利用RAG技術(shù)接入人類基因組數(shù)據(jù)庫(kù)、最新的科學(xué)期刊、覆蓋臨床前研究的數(shù)據(jù)庫(kù)以及FDA的指導(dǎo)方針。要部署RAG,通常需要IT團(tuán)隊(duì)的協(xié)助,他們能告訴你是否已經(jīng)或能夠?qū)⑵淙诤线M(jìn)他們的工作流中,從而為他們的工作增添一層額外的質(zhì)量保證。
2、保護(hù)公司及個(gè)人隱私。
如果你在AI提示中使用機(jī)密數(shù)據(jù)或?qū)S行畔?,只?yīng)使用經(jīng)公司批準(zhǔn)且部署在公司防火墻內(nèi)的模型,切勿使用開源或公共的大型語(yǔ)言模型。在公司政策允許的前提下,如果大型語(yǔ)言模型的應(yīng)用程序接口的服務(wù)條款明確信息不會(huì)被用于模型訓(xùn)練,那么你可以使用私人信息。
同時(shí),注意到在制定提示時(shí)可能引入的偏見。例如,如果一位財(cái)務(wù)分析師請(qǐng)求LLM解釋昨天的季報(bào)如何顯示公司已為未來五年的增長(zhǎng)做好準(zhǔn)備,這種詢問就表現(xiàn)出了近期偏見——在預(yù)測(cè)未來事件時(shí)過于依賴最近的信息。LLM供應(yīng)商正在尋找解決這類問題的方法。例如,微軟和谷歌正在增加功能,幫助用戶檢測(cè)可能有害的提示和響應(yīng)。Salesforce已經(jīng)開發(fā)了一種AI架構(gòu),能夠在構(gòu)建提示時(shí)隱藏任何敏感的客戶數(shù)據(jù),防止這些數(shù)據(jù)被傳輸至第三方LLM,同時(shí)對(duì)輸出進(jìn)行風(fēng)險(xiǎn)評(píng)估,如毒性、偏見和隱私問題,并收集反饋以改進(jìn)提示模板。盡管如此,最終,最關(guān)鍵的還是你——系統(tǒng)中的人類用戶——的判斷。
3、仔細(xì)檢查可疑輸出。
根據(jù)現(xiàn)有研究,即使在進(jìn)行大量數(shù)據(jù)處理和其他干預(yù)措施后,錯(cuò)誤和幻覺仍然難以完全避免。加州大學(xué)伯克利分校的研究員Jinwoo Ahn 和 Kyuseung Shin指出,當(dāng)大型語(yǔ)言模型的用戶遇到看似錯(cuò)誤的輸出時(shí),他們往往會(huì)本能地多次嘗試重啟模型,這反而可能逐漸降低回答的質(zhì)量。研究者建議,應(yīng)該確定AI出錯(cuò)的具體步驟,然后使用另一個(gè)LLM單獨(dú)執(zhí)行這一步驟,先將問題分解成更小的部分,再使用結(jié)果來調(diào)整第一個(gè)LLM。例如,一位科學(xué)家可能使用OpenAI的ChatGPT來幫助開發(fā)一種新的聚合物,并進(jìn)行一系列的步驟計(jì)算。如果她在過程中的某個(gè)環(huán)節(jié)發(fā)現(xiàn)了錯(cuò)誤,她可以讓Anthropic的Claude將問題分解成更小的子問題并進(jìn)行解釋。之后,她可以將這些信息反饋給ChatGPT,請(qǐng)求它精煉其回答。這種方法本質(zhì)上是將鏈?zhǔn)剿季S的原則應(yīng)用于修正你認(rèn)為錯(cuò)誤的輸出。
03
相互學(xué)習(xí):把AI培養(yǎng)成你的助手
隨著大型語(yǔ)言模型(LLM)的規(guī)模和復(fù)雜度增加,它們能夠展示出“突現(xiàn)屬性”——這些是未經(jīng)特別訓(xùn)練卻在提供了相關(guān)背景數(shù)據(jù)或知識(shí)后顯現(xiàn)的強(qiáng)大新能力,例如高級(jí)推理。為了推動(dòng)它們的發(fā)展,你可以執(zhí)行以下幾個(gè)步驟。
1、提供“思維示范”。
在向LLM提出問題讓其解決之前,你可以先引導(dǎo)它按照特定的方式進(jìn)行思考。比如,你可以教授它“從簡(jiǎn)到難”的推理方法,向AI展示如何把一個(gè)復(fù)雜的挑戰(zhàn)分解為幾個(gè)更小、更簡(jiǎn)單的挑戰(zhàn),先解決最簡(jiǎn)單的問題,然后用這個(gè)解答作為解決下一個(gè)更復(fù)雜問題的基礎(chǔ),依此類推。谷歌DeepMind的Denny Zhou和他的團(tuán)隊(duì)證明了,這種“從簡(jiǎn)到難”的方法能將AI輸出的準(zhǔn)確率從16%提升到99%。
比如說:想象一位負(fù)責(zé)健身服品牌的營(yíng)銷經(jīng)理,他需要策劃一個(gè)新產(chǎn)品系列。他可以按照以下步驟指導(dǎo)LLM來分析問題:
受眾定位:識(shí)別潛在的客戶群體——健身愛好者。這對(duì)一個(gè)在公司客戶數(shù)據(jù)上進(jìn)行過訓(xùn)練的模型來說相對(duì)簡(jiǎn)單。
信息設(shè)計(jì):創(chuàng)建強(qiáng)調(diào)產(chǎn)品性能、舒適性和風(fēng)格的營(yíng)銷信息。這是一個(gè)更具挑戰(zhàn)性和需要?jiǎng)?chuàng)造性的任務(wù),需要在已識(shí)別的受眾基礎(chǔ)上進(jìn)行。
選擇渠道:選取社交媒體、健身相關(guān)博客和與影響者的合作,這些渠道將有助于將營(yíng)銷信息有效傳達(dá)給目標(biāo)受眾。
資源分配:根據(jù)所選擇的渠道進(jìn)行預(yù)算分配,這通常是組織中最容易引發(fā)爭(zhēng)議的問題之一。
通過這種方式,營(yíng)銷經(jīng)理可以系統(tǒng)地利用大型語(yǔ)言模型來優(yōu)化營(yíng)銷策略的各個(gè)方面,確保新產(chǎn)品線的成功推廣。
2、通過上下文學(xué)習(xí)訓(xùn)練你的LLMs。
你可以通過向AI展示一系列上下文示例來教它如何完成任務(wù),這種方法允許你調(diào)整預(yù)訓(xùn)練的大型語(yǔ)言模型如GPT-4、Claude和Llama,而無需復(fù)雜的參數(shù)調(diào)整。例如,研究者們通過向LLMs展示放射學(xué)報(bào)告、患者提問、治療進(jìn)展記錄和醫(yī)患對(duì)話的示例,教會(huì)了它們?nèi)绾慰偨Y(jié)醫(yī)療信息。研究發(fā)現(xiàn),81%的LLM生成的總結(jié)質(zhì)量達(dá)到或超過了人工總結(jié)。
你還可以通過提供相關(guān)背景信息并持續(xù)提問直至解決問題的方式來訓(xùn)練LLM。例如,兩家軟件公司均希望提高銷售量。第一家公司的銷售團(tuán)隊(duì)長(zhǎng)期難以準(zhǔn)確預(yù)測(cè)軟件許可需求,因此領(lǐng)導(dǎo)先是提供歷史銷售數(shù)據(jù),詢問下一季度的預(yù)期需求,再提供關(guān)于客戶軟件功能升級(jí)和年度預(yù)算的信息,探討季節(jié)性影響,最后,他輸入了CRM系統(tǒng)和市場(chǎng)報(bào)告的詳細(xì)數(shù)據(jù),探討市場(chǎng)活動(dòng)對(duì)銷售的影響。
第二家公司的銷售團(tuán)隊(duì)則關(guān)注于改善客戶選擇,領(lǐng)導(dǎo)可能會(huì)提供具體的財(cái)務(wù)數(shù)據(jù),指導(dǎo)LLM按照收入貢獻(xiàn)對(duì)客戶進(jìn)行排序,然后逐步深入到地理范圍、客戶群、技術(shù)能力等問題。在這一過程中,兩位高管都在通過具體的公司銷售策略上下文訓(xùn)練LLM,并提高其完成任務(wù)的能力。他們將公司和行業(yè)的知識(shí)整合到交互中。隨著LLM在具體銷售流程上積累更多經(jīng)驗(yàn),其生成的答案也越來越精準(zhǔn)。
相互學(xué)習(xí)是一個(gè)過程,用戶從提出簡(jiǎn)單的問題或指令開始,逐步增加任務(wù)描述的復(fù)雜性和細(xì)節(jié)。在這一過程中,他們可以增添背景信息,調(diào)整用詞,并觀察模型如何反應(yīng),不斷試驗(yàn)直至實(shí)現(xiàn)預(yù)期效果。
04
最重要的是:學(xué)習(xí)和掌握AI技能
要廣泛掌握通用AI技能,不僅需要企業(yè)進(jìn)行大量投資,也需要個(gè)人的主動(dòng)學(xué)習(xí)和努力。雖然已有少數(shù)公司提供相關(guān)培訓(xùn),但大多數(shù)公司尚未建立完善的培訓(xùn)體系。事實(shí)上,在我們2024年對(duì)7000名專業(yè)人士的調(diào)查中,雖然94%的人表示愿意學(xué)習(xí)新的技能以應(yīng)對(duì)通用AI的挑戰(zhàn),但僅有5%的人表示他們的雇主在大規(guī)模地積極培訓(xùn)員工。因此,很多人將需要自主行動(dòng),跟上LLMs的快速進(jìn)展以及各類工作和行業(yè)中逐步應(yīng)用的高端研究。你可以注冊(cè)各類平臺(tái)提供的在線課程;嘗試我們討論過的提示技巧以及新興的提示方式;并推動(dòng)你的雇主提供更多使用LLMs的機(jī)會(huì),同時(shí)輔以最佳實(shí)踐的培訓(xùn)。
接下來要掌握的是鏈?zhǔn)剿季S提示技能,應(yīng)用于代理工作流和多模態(tài)大型語(yǔ)言模型(MLLMs)。這些模型能夠整合不同類型的數(shù)據(jù),如文本、音頻、視頻和圖像,并能在這些格式中提供輸出。一項(xiàng)研究表明,鏈?zhǔn)剿季S提示可以將MLLMs的性能提高至100%。早期采用者已經(jīng)在測(cè)試這些方法,但它們尚未成熟,還不足以廣泛推廣。
人工智能革命并非即將到來,而是已經(jīng)來臨。領(lǐng)先的企業(yè)已經(jīng)在利用這項(xiàng)技術(shù)重新定義各行業(yè)、各職能和各種工作的流程。通用人工智能大幅提高了標(biāo)準(zhǔn),要求我們與AI共同思考,確保信任其結(jié)果,并不斷調(diào)整它和我們自身,以實(shí)現(xiàn)更優(yōu)表現(xiàn)。盡管通用AI是推動(dòng)人機(jī)共生關(guān)系的一部分,但它在技術(shù)發(fā)展史上也獨(dú)具一格。歷史上沒有其他重大創(chuàng)新以如此迅速的速度起飛。知識(shí)型工作的變革將比我們大多數(shù)人預(yù)想的更快、更強(qiáng)大。準(zhǔn)備好吧。
未來的商業(yè)將不僅由通用AI驅(qū)動(dòng),更重要的是由那些能夠最有效運(yùn)用它的人引領(lǐng)。
原文鏈接:https://hbr.org/2024/09/embracing-gen-ai-at-work