欧美亚洲免费久久久,91福利国产在线

金融大模型，在黎明破曉前

來(lái)源：光子星球　2023-09-01 03:13:26

撰文 | 吳坤諺

編輯 | 吳先之

(資料圖)

8月31日，首批大模型產(chǎn)品將陸續(xù)通過(guò)《生成式人工智能服務(wù)管理暫行辦法》（以下簡(jiǎn)稱(chēng)《暫行辦法》）備案，可正式上線(xiàn)面向公眾提供服務(wù)。

包括百度文心一言、抖音云雀大模型、智譜AI的GLM大模型、中科院的紫東太初大模型、百川智能的百川大模型、商湯的日日新大模型、MiniMax的ABAB大模型、上海人工智能實(shí)驗(yàn)室的書(shū)生通用大模型、科大訊飛星火大模型，以及華為、騰訊的大模型產(chǎn)品，共計(jì)11家。

懸而未決的政策準(zhǔn)入已然落地。而通過(guò)備案的主體包含了互聯(lián)網(wǎng)大廠(chǎng)、AI獨(dú)角獸、科研國(guó)家隊(duì)三方，也基本明確了國(guó)家對(duì)不同主體路徑的肯定。

據(jù)上海申浩律師事務(wù)所對(duì)《暫行辦法》進(jìn)行了解讀，《暫行辦法》的規(guī)制重點(diǎn)在于服務(wù)應(yīng)用層的信息內(nèi)容安全，限制境外AIGC提供服務(wù)。更重要的是，《暫行辦法》對(duì)境外AIGC的限制不包括垂直領(lǐng)域如工業(yè)、科研等場(chǎng)景，只要其不向公眾提供服務(wù)。

換言之，目前《暫行辦法》備案的關(guān)鍵在于“向公眾提供服務(wù)”。這對(duì)于大模型企業(yè)而言，顯然可以?xún)?yōu)先在面向C端的模型應(yīng)用中積累用戶(hù)、數(shù)據(jù)，更利于產(chǎn)品打磨。而未通過(guò)備案的企業(yè)組織也不會(huì)因此在研發(fā)上遭遇阻礙，反而在能獲取海外AIGC調(diào)用能力的情況下，技術(shù)演進(jìn)的進(jìn)程有可能相對(duì)更快。

這或許會(huì)引發(fā)大模型玩家們形成落地偏向與技術(shù)偏向兩條路徑。

更值得注意的是，通過(guò)備案、面向公眾提供服務(wù)的資質(zhì)顯然加快了金融、教育、法律等嚴(yán)肅場(chǎng)景的模型落地的進(jìn)程。

以金融大模型為例，金融領(lǐng)域合規(guī)先行的特點(diǎn)一度限制了模型能力在實(shí)際業(yè)務(wù)中的應(yīng)用，導(dǎo)致行業(yè)整體處于場(chǎng)景探索的階段。而今首批模型產(chǎn)品獲批開(kāi)放，金融大模型賽道的轉(zhuǎn)折點(diǎn)也已到來(lái)。

明面務(wù)虛，私下務(wù)實(shí)

今年3月，頭部財(cái)經(jīng)資訊公司彭博社發(fā)布了專(zhuān)門(mén)為金融領(lǐng)域打造的大模型BloombergGPT，試圖將其積累40年的財(cái)經(jīng)資訊數(shù)據(jù)價(jià)值得到釋放。

彼時(shí)的彭博社可能沒(méi)有想到，金融在大洋彼岸已經(jīng)成為垂直領(lǐng)域大模型的搶跑者。

盡管早在彭博社開(kāi)始著手搭建訓(xùn)練BloombergGPT前，已有不少研究表明使用特定領(lǐng)域數(shù)據(jù)訓(xùn)練的垂直大模型能在特定領(lǐng)域效果拔群，但當(dāng)行業(yè)大模型的風(fēng)吹到我們這時(shí)，有吸引力讓垂直領(lǐng)域公司投身大模型，而非等待整體解決方案的似乎只有金融一家。

早在今年5月，度小滿(mǎn)便發(fā)布了自研千億參數(shù)金融大模型“軒轅1.0”，目前“軒轅2.0”已開(kāi)源。奇富科技、馬上金融、螞蟻集團(tuán)等金融科技企業(yè)緊隨其后，先后組建了自研大模型團(tuán)隊(duì)并投身其中。

當(dāng)然，金融領(lǐng)域外的互聯(lián)網(wǎng)大廠(chǎng)與科技公司也希望就金融大模型分一杯羹，去年10月于科創(chuàng)主板上市的大數(shù)據(jù)企業(yè)星環(huán)科技同在5月推出面向金融量化的大模型“無(wú)涯”，騰訊云、科大訊飛、恒生電子等玩家也就金融領(lǐng)域的風(fēng)控、客服等細(xì)分賽道推出自己的大模型解決方案。

金融一直是前沿科技希望結(jié)合與落地的垂直領(lǐng)域，甚至可以說(shuō)金融史中暗藏著科技史的發(fā)展脈絡(luò)。早在2016年為國(guó)際金融穩(wěn)定理事會(huì)（FSB）定義的金融科技迎來(lái)大模型這一輪風(fēng)口，當(dāng)下局面其實(shí)并不出人意料。

無(wú)論是面向消費(fèi)者市場(chǎng)與小微企業(yè)的金融普惠、面向金融機(jī)構(gòu)的智能投研還是面向投資者的大數(shù)據(jù)洞見(jiàn)，大模型在金融領(lǐng)域的應(yīng)用都有充足空間嵌入并釋放價(jià)值。

大模型作為繼互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)后的第三波浪潮，再次將金融機(jī)構(gòu)拉回同一起跑線(xiàn)。

有BloombergGPT這個(gè)基礎(chǔ)案例珠玉在前，為金融大模型的落地指明方向?？傮w看來(lái)，目前金融大模型的落地方向有以下幾大類(lèi)，幾乎囊括了金融領(lǐng)域的方方面面：1、大數(shù)據(jù)風(fēng)控的進(jìn)一步迭代

2、金融相關(guān)文本生成，如財(cái)報(bào)、新聞、評(píng)論等

3、輔助決策的智能投顧、智能投研與輔助運(yùn)營(yíng)的智能客服

4、金融行業(yè)的“copilot”，包含債券發(fā)行、IPO、審計(jì)、評(píng)級(jí)等金融業(yè)務(wù)

當(dāng)方向明朗之時(shí)，落地成果便成為檢驗(yàn)產(chǎn)品的唯一標(biāo)準(zhǔn)。只是我們可以在公開(kāi)信息中聽(tīng)到不小的聲量，但卻沒(méi)法尋到落在實(shí)處的案例。這并非玩家們“藏拙”，而是金融大模型在落地途中不斷遭遇兩方面的掣肘：技術(shù)不成熟與場(chǎng)景不適配。

某公募基金經(jīng)理告訴光子星球，金融大模型真正能落地應(yīng)用的功能較少，且落地場(chǎng)景集中在中后臺(tái)的客服、新聞播報(bào)等較為簡(jiǎn)單的to C生成式內(nèi)容上。

“面向C端投資者的券商會(huì)應(yīng)用多些，我們基金機(jī)構(gòu)的監(jiān)管更加嚴(yán)格，所以對(duì)創(chuàng)新會(huì)保持關(guān)注，這種新技術(shù)應(yīng)用落地一般會(huì)滯后很多”，該基金經(jīng)理稱(chēng)。

或許機(jī)構(gòu)視角更為審慎，可是在互聯(lián)網(wǎng)大廠(chǎng)視角下，金融大模型的八字依然沒(méi)一撇。

一位騰訊高級(jí)架構(gòu)師直言，金融大模型的應(yīng)用還需要探索場(chǎng)景，明確的賽道僅智能客服、輔助編程等寥寥幾項(xiàng)。在“模型在具體場(chǎng)景的打磨還有許多工程性問(wèn)題未決”的前提下，應(yīng)用與商業(yè)化還無(wú)從談起。

上述人士表示，“技術(shù)成熟度、場(chǎng)景適配性?xún)蓚€(gè)問(wèn)題解決后，行業(yè)需求和產(chǎn)業(yè)共計(jì)之間還需要找到一個(gè)投資回報(bào)的平衡點(diǎn)。應(yīng)用推廣除了是技術(shù)問(wèn)題外也是商業(yè)問(wèn)題?！?

或因如此，盡管金融大模型的風(fēng)吹了一陣又一陣，我們也未能在各大對(duì)應(yīng)用與理論侃侃而談的發(fā)布會(huì)、論壇中看到真正應(yīng)用在金融場(chǎng)景的大模型案例，基本上是技術(shù)較為成熟的風(fēng)控場(chǎng)景與封閉性較強(qiáng)的智能客服。

這并不奇怪，金融領(lǐng)域本身存在大量時(shí)效數(shù)據(jù)，結(jié)合當(dāng)下大模型普遍存在生成內(nèi)容不可解釋性，面對(duì)以嚴(yán)謹(jǐn)著稱(chēng)的金融行業(yè)，碰壁是可想而知的事。

正如國(guó)家金融與發(fā)展實(shí)驗(yàn)室副主任楊濤撰文指出那般，當(dāng)人工智能大模型在金融領(lǐng)域應(yīng)用時(shí)，更需關(guān)注大模型的可審計(jì)性、可解釋性等難題以及參與金融活動(dòng)引發(fā)的風(fēng)險(xiǎn)特征變化、數(shù)據(jù)保護(hù)、責(zé)任分擔(dān)、合規(guī)邊界等問(wèn)題，并強(qiáng)化數(shù)據(jù)倫理、算法倫理、主體倫理、行為倫理等方面的治理。

合規(guī)先行者已經(jīng)出現(xiàn)，但合規(guī)也無(wú)法完全解決金融大模型的既有問(wèn)題。唯有褪去光環(huán)，我們才能更好地梳理金融大模型的前世今生和未來(lái)，找到大模型在金融領(lǐng)域搶跑的答案。

回歸提效本質(zhì)

我們簡(jiǎn)單回顧此前的金融科技創(chuàng)新，不難發(fā)現(xiàn)暢想中的大模型應(yīng)用早已存在，不過(guò)一直處于“雛鳥(niǎo)”的狀態(tài)。

例如金融科技業(yè)務(wù)中占核心地位的智能投研便誕生于2016年前后，而迄今為止稱(chēng)得上成熟且步入商業(yè)化的應(yīng)用還是處于較初級(jí)的階段——金融數(shù)據(jù)與資訊終端，例如Wind、ifind等SaaS金融資訊軟件，定位是為業(yè)內(nèi)外人士提供垂直信息平臺(tái)。

更進(jìn)一步的應(yīng)用也早已沒(méi)了聲音，就像曾被標(biāo)普500以5.5億美金收購(gòu)，如今泯然眾人的智能投研企業(yè)Kensho。

“金融數(shù)據(jù)信噪比太低了，和工業(yè)界的數(shù)據(jù)相比是數(shù)量級(jí)的差距。再考慮到金融數(shù)據(jù)的時(shí)序性與時(shí)效性，無(wú)論是機(jī)器還是人都難以找到可持續(xù)的模式。AI可以根據(jù)風(fēng)險(xiǎn)邏輯去拿Beta（與市場(chǎng)相關(guān)的可預(yù)測(cè)收益），但一直很難拿到Alpha（與市場(chǎng)不相關(guān)的超額收益）”，一位業(yè)內(nèi)人士直言。

據(jù)多位業(yè)內(nèi)人士介紹，金融數(shù)據(jù)經(jīng)NLP（自然語(yǔ)言處理）提取后交由機(jī)器學(xué)習(xí)，將成果以預(yù)輸入的投資規(guī)則在智能化交互界面輸出是幾年前的智能投研范式。大模型的引入不過(guò)是加強(qiáng)了機(jī)器學(xué)習(xí)的記憶、決策等能力，而且輸出的結(jié)果，按從業(yè)者的話(huà)說(shuō)是“跟蒙眼投資差不多”。

實(shí)際上，大模型為金融行業(yè)帶來(lái)的并不止是單獨(dú)業(yè)務(wù)能力的躍升，而是大模型的“l(fā)arge”所提供的泛化能力。

金融機(jī)構(gòu)在過(guò)去智能化進(jìn)程中，早已在風(fēng)控、投研、投顧、評(píng)級(jí)等業(yè)務(wù)線(xiàn)構(gòu)建模型與中臺(tái)，輔助從業(yè)者推進(jìn)業(yè)務(wù)的同時(shí)也在不斷積累文本數(shù)據(jù)。而大模型的出現(xiàn)提供了一個(gè)將打亂的中臺(tái)整合為一體的契機(jī)，既不需要多次建模也能打破各中臺(tái)之間的數(shù)據(jù)孤島。

最終呈現(xiàn)是以金融大模型為底座從而整合并不斷延展機(jī)構(gòu)的能力，好比阿里曾經(jīng)在組織變革中提出的“大中臺(tái)，小前臺(tái)”。

于金融機(jī)構(gòu)而言，這不僅是效率的提升，更是效益的躍升。當(dāng)然，如今距離這項(xiàng)堪稱(chēng)“圣杯”的目標(biāo)還有不小的距離，而大模型相對(duì)早先NLP、CV時(shí)期的能力演進(jìn)已經(jīng)在部分業(yè)務(wù)中得以體現(xiàn)。

以ESG資管企業(yè)秩鼎為例，其創(chuàng)始人劉相峰稱(chēng)，秩鼎的金融大模型能力應(yīng)用正逐漸鋪開(kāi)，目前已在初級(jí)的數(shù)據(jù)收集整理與研究工作上做到了人效躍升。雖然ESG與傳統(tǒng)金融存在一定距離，尤其是在數(shù)據(jù)信噪比方面，但作為為數(shù)不多的落地案例，有一定參考價(jià)值。

據(jù)了解，秩鼎的內(nèi)部模型訓(xùn)練采用的同樣是“預(yù)訓(xùn)練——精調(diào)（STF）——對(duì)齊(RLHF)”的范式，不同之處在于其實(shí)體識(shí)別系統(tǒng)可以將初步提取后的ESG相關(guān)事件匹配到唯一主體上。這對(duì)于模型知識(shí)圖譜的構(gòu)建，尤其是中文領(lǐng)域是一次不小的進(jìn)步。

結(jié)合BloombergGPT僅以500億參數(shù)規(guī)模做出一定效果，我們或許可以下一個(gè)判斷：即金融大模型乃至行業(yè)大模型的落地收效如何，看的不一定是大力煉丹，而且訓(xùn)練精調(diào)以及應(yīng)用工作流后的一些細(xì)小動(dòng)作。

例如軒轅2.0在常規(guī)垂直模型訓(xùn)練混合大量通用數(shù)據(jù)，避免災(zāi)難性遺忘導(dǎo)致模型“變笨”，還在此基礎(chǔ)上將預(yù)訓(xùn)練的數(shù)據(jù)以及指令微調(diào)數(shù)據(jù)進(jìn)一步混合，其論文中將這種把預(yù)訓(xùn)練和精調(diào)融為一體的范式稱(chēng)為Hybrid-Tuning。

未來(lái)的范式演進(jìn)我們猶未可知，但這細(xì)小的每一步都在為模型與金融行業(yè)提效，推動(dòng)行業(yè)向?qū)嵦幾呷ァ?

金融大模型破曉前

金融大模型已經(jīng)來(lái)到了價(jià)值釋放的前夕。

政策準(zhǔn)入一定程度上打消了場(chǎng)景方面的顧慮，更多能力可以在實(shí)際業(yè)務(wù)中得到應(yīng)用，而技術(shù)成熟度亦在細(xì)小創(chuàng)新中緩慢提升。在破曉前的微妙階段，金融大模型的商業(yè)模式與格局的前瞻性思考是有必要的。

結(jié)合《暫行辦法》中對(duì)公眾開(kāi)放服務(wù)的審慎態(tài)度，接下來(lái)一段時(shí)間的金融大模型大概率不會(huì)過(guò)早向C端釋放其能力，而是在內(nèi)部業(yè)務(wù)的應(yīng)用試錯(cuò)中迭代。

這意味著當(dāng)下各個(gè)機(jī)構(gòu)的研究部門(mén)更多會(huì)“刀刃向內(nèi)”，試圖于工作流中提升研究工作的效率和效益，圍繞研究業(yè)務(wù)本身展開(kāi)。而且出于數(shù)據(jù)隱私等方面的考量，在模型部署上會(huì)更看重私有化部署甚至是端側(cè)部署。

即使存在自主可控的強(qiáng)需求，讓每一家金融機(jī)構(gòu)都從零開(kāi)始儲(chǔ)備算力、招募人才并訓(xùn)練機(jī)構(gòu)的大模型，也顯然是不現(xiàn)實(shí)的。更大的可能是由資源更多的主體或是基于某一底座或是完全自主構(gòu)建出金融大模型，再以服務(wù)的方式就模型做私有化部署。

所以我們也不難發(fā)現(xiàn)度小滿(mǎn)、奇富、馬上金融、螞蟻等金融科技頭部紛紛投身自研模型的原因：并非只是自身已有充分的技術(shù)與數(shù)據(jù)儲(chǔ)備，而是前方有大量存在確定性需求的中小金融機(jī)構(gòu)客戶(hù)。

B端應(yīng)用方面，接入模型能力后的工作流勢(shì)必也將發(fā)生改變，就像Kensho曾揚(yáng)言“用AI干掉證券分析師”，屆時(shí)金融機(jī)構(gòu)的組織制度也將生變。

當(dāng)機(jī)構(gòu)內(nèi)技術(shù)團(tuán)隊(duì)不斷壯大，技術(shù)演進(jìn)讓內(nèi)部效率達(dá)到一定高度后，屆時(shí)金融大模型才可以強(qiáng)調(diào)業(yè)務(wù)的外部性。將價(jià)值釋放面向的群體由B端轉(zhuǎn)為C端，例如幻覺(jué)問(wèn)題可控后，具備可解釋、可溯源的AI投資能力。不過(guò)這一階段的到來(lái)顯然還需要很長(zhǎng)的時(shí)間。

無(wú)論如何，合規(guī)進(jìn)程在《暫行辦法》的實(shí)施與備案中已前行一大步。冰山之下，各家金融大模型已蓄勢(shì)待發(fā)，我們很可能在接下來(lái)的9月感受到國(guó)內(nèi)大模型行業(yè)，繼4月密集發(fā)布、6月垂直轉(zhuǎn)向后的一個(gè)新節(jié)點(diǎn)。大模型的下一戰(zhàn)——金融，市場(chǎng)等待玩家們的答案。

推薦DIY文章