產(chǎn)品技術(shù)的演進,離不開底層科技的創(chuàng)新。人工智能已經(jīng)成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,基于強算法、大算力和大數(shù)據(jù)的大模型發(fā)揮著關(guān)鍵作用。 在9月22日于廣州舉辦的2023年中國企業(yè)出海高質(zhì)量發(fā)展創(chuàng)新大會上,琶洲實驗室-人工智能與數(shù)字經(jīng)濟實驗室(廣州)(簡稱琶洲實驗室)科學(xué)家譚明奎教授以《大模型歷史機遇與挑戰(zhàn)》為主題發(fā)表開場演講。譚教授認為,企業(yè)出海面臨諸多挑戰(zhàn),在加速本土化落地、跨境貿(mào)易合作、數(shù)字內(nèi)容創(chuàng)意開發(fā)等方面,大模型有著強大的技術(shù)能力賦能企業(yè)。 與此同時,大模型對數(shù)據(jù)需求量、計算資源等各方面的高要求,單一機構(gòu)沒辦法完成,這要求科研單位和企業(yè)一起緊密配合,在典型領(lǐng)域?qū)崿F(xiàn)數(shù)據(jù)、模型、算法的共享和協(xié)同開發(fā),促進大模型研究的應(yīng)用和部署。 大會現(xiàn)場,鈦動科技、琶洲實驗室和華南理工大學(xué)未來技術(shù)學(xué)院正式簽約“人工智能出海營銷戰(zhàn)略合作”。 三方將在人工智能出海營銷領(lǐng)域展開長期戰(zhàn)略合作,打通“數(shù)據(jù)-算法-應(yīng)用場景”全鏈條,深度融合技術(shù)與產(chǎn)業(yè),賦能中國出海企業(yè)數(shù)字化轉(zhuǎn)型,助力更多中國企業(yè)走出國門、閃耀全球。 以下為經(jīng)整理的演講精華內(nèi)容。 《大模型歷史機遇與挑戰(zhàn)》 01 大模型概述 大模型到底是什么? 早在2017年,學(xué)界便開始對人工智能大模型進行研發(fā)。直到2022年ChatGPT發(fā)布,其邏輯性的流暢對話和交互能力給全球帶來震撼,才讓人工智能技術(shù)備受關(guān)注。而ChatGPT能夠脫穎而出的關(guān)鍵點,就是大語言模型的突破,這給數(shù)字經(jīng)濟和人工智能技術(shù)發(fā)展帶來了新一輪的契機。 近幾個月,國內(nèi)國外陸續(xù)發(fā)布各大模型,又被稱為“百模大戰(zhàn)”。今年3月份發(fā)布的Open AI GPT-4,增加了多模態(tài)能力,在文本處理、寫代碼等多種專業(yè)能力上有了質(zhì)的提升,并且將會隨著演進迭代逐步提高大模型的技術(shù)能力。那么大模型的上限能力在哪里?我們目前還不知曉。但就目前呈現(xiàn)出來的能力而言,已經(jīng)足夠讓我們驚艷,也足夠讓我們?nèi)ダ盟?,來解決數(shù)字經(jīng)濟、尤其是出海業(yè)務(wù)中的難點和痛點。 大模型基于Transformer 架構(gòu)開展,它是模型的底座,也是處理長序列數(shù)據(jù)的核心技術(shù)能力。而Transformer 結(jié)構(gòu)的發(fā)展,離不開海量數(shù)據(jù)的“投喂”。2018年,谷歌帶著3億參數(shù)BERT模型,闖進大眾視野,而到目前,ChatGPT-3模型參數(shù)已經(jīng)達到1750億,參數(shù)規(guī)模提高到千億級別。未來,高容量的參數(shù)可以讓我們將人類歷史上所有能夠數(shù)字化的內(nèi)容以及每天產(chǎn)生的新數(shù)字化內(nèi)容全部包含進大模型數(shù)據(jù)中。因此,大模型的記憶能力、聯(lián)想能力、創(chuàng)作能力,都將優(yōu)于人類的能力。 同時,技術(shù)的提升在大模型應(yīng)用部署層面,也帶來了新的范式。 - 過去,從需求分析-現(xiàn)場數(shù)據(jù)采集、標注等步驟到模型訓(xùn)練-部署,整個流程需要耗費幾個月時間; - 現(xiàn)在,基于大模型能力+部署框架+場景數(shù)據(jù),有望實現(xiàn)幾個人在數(shù)小時之內(nèi)完成模型部署方案。 02?大模型機遇與展望 從通用大模型轉(zhuǎn)向行業(yè)大模型,在出海業(yè)務(wù)領(lǐng)域,大模型有哪些機遇? 首先是在出海營銷洞察層面,本土企業(yè)如何獲取最地道的目標市場洞察?依托處理和解析海量、高維和多源數(shù)據(jù)的能力,大模型通過自動在海外收集大量數(shù)據(jù),識別隱藏在多維數(shù)據(jù)中的細分市場、關(guān)鍵詞、風險預(yù)判等重要信息,解析復(fù)雜的消費者行為,幫助決策者足不出戶深度洞察海外市場。大模型為廣告方案提供數(shù)據(jù)驅(qū)動的決策支持,其洞察能力超過本科生水平。 第二是在營銷內(nèi)容層面,目前大模型在數(shù)據(jù)生成尤其是圖像、文本生成能力讓人非常驚艷,有些能力已經(jīng)超過了碩士、博士甚至是資深教授水平,可以幫助企業(yè)快速生成高質(zhì)量、一流的數(shù)字內(nèi)容。同時還可以將創(chuàng)作人員的優(yōu)質(zhì)創(chuàng)作思路用數(shù)據(jù)的方式呈現(xiàn),形成標準范式,讓內(nèi)容生成環(huán)節(jié)上的每位工作者快速獲取新思路,避免在協(xié)同過程中出現(xiàn)創(chuàng)意思路的偏差,極大地提升創(chuàng)意交付效率。 第三,在服務(wù)鏈路層面,從市場研究、用戶畫像,到營銷內(nèi)容生成,再到chat客服、售后調(diào)研等,大模型可以幫助出海公司在交付前、中、后全鏈路地進行優(yōu)化提升。 第四,在智慧辦公層面,本土企業(yè)如何與海外企業(yè)高效協(xié)同合作?大模型可與公司辦公及會議系統(tǒng)整合,幫助用戶在開會期間更高效地處理和記錄信息,例如協(xié)助用戶制定詳細會議提綱、會議準備待辦事項、根據(jù)會議內(nèi)容生成創(chuàng)意性想法和建議、生成會議紀要總結(jié)等,有效提升行政效率。 第五,在跨文化情感分析層面,大模型不僅可以解決跨語言溝通,還能實現(xiàn)跨文化溝通。大模型通過收集海外數(shù)據(jù)信息,形成對當?shù)匚幕睦斫?,了解不同文化之間的相似性和差異性,實現(xiàn)快速準確的翻譯,幫助人們更好地理解不同文化和語言背景下的思維和表達方式。未來,大模型在廣告中的跨文化情感分析將發(fā)揮重要作用。通過對全球多文化用戶廣告點擊率、留存率、觀看量等信息數(shù)據(jù)分析,提供全球廣告?zhèn)€性化、多語言優(yōu)化和文化敏感性的解決方案,傳統(tǒng)AI模型做不到,只有大模型有這個能力。 03?大模型應(yīng)用挑戰(zhàn) 無論是訓(xùn)練還是應(yīng)用部署,大模型仍然面臨很多挑戰(zhàn),這需要高校、研發(fā)機構(gòu)、企業(yè)緊密結(jié)合在一起,協(xié)作攻克。 首先,大模型面臨著使用過程中的人機交互挑戰(zhàn),也是目前大模型應(yīng)用需要盡快解決的一個痛點。由于大模型自身“大”的特點,ChatGPT-3模型參數(shù)已經(jīng)達到1750億,GPT-4的參數(shù)達到了1.8萬億個(也有報道為5000億),如此高額的參數(shù)容量在調(diào)動、運行時對運算要求非常高。當應(yīng)用到實時或交互性要求較高的場景時,容易出現(xiàn)響應(yīng)延遲、速度慢等狀況,從而影響用戶體驗。從業(yè)者需要對大模型運算架構(gòu)、模型壓縮、加速運算等方面提供更先進的解決方案。 另一方面,大模型到目前為止,還缺乏對人類情感和語義的深入理解,可能導(dǎo)致模型在處理情感相關(guān)的交互或場景時出現(xiàn)問題。同時,數(shù)據(jù)來源可能本身具有偏見和歧視,大模型在學(xué)習(xí)時可能會從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)到潛在的偏見和歧視,并在生成結(jié)果時產(chǎn)生不公平或歧視性的偏好。 第二個挑戰(zhàn)來源于瞬息萬變的現(xiàn)實世界。我們正處于一個信息爆炸的數(shù)據(jù)時代,面對場景數(shù)據(jù)動態(tài)變化,模型需具備增量學(xué)習(xí)和持續(xù)更新的能力。具體到出海行業(yè)而言,出海企業(yè)面臨著跨文化、跨場景挑戰(zhàn),這要求大模型針對不同國家、不同地區(qū)、不同場景進行針對性的學(xué)習(xí)和部署,包括增量學(xué)習(xí)、適應(yīng)學(xué)習(xí)等,從用戶實際應(yīng)用需求出發(fā),凝練為科學(xué)問題加以解決。 第三個挑戰(zhàn)來源于大模型開發(fā)的成本要求,大模型對數(shù)據(jù)需求量大,對計算資源要求高。OpenAI訓(xùn)練1750億參數(shù)的GPT-3費用大概是1200萬美元,訓(xùn)練5000億參數(shù)(業(yè)界預(yù)估)的GPT-4成本飆升至1億美元,普通科研高?;蚩蒲袉挝粵]有辦法獨立負擔。 大模型在開發(fā)和應(yīng)用過程中主要受限于以下三方面成本: - 訓(xùn)練成本:包括算力、電費等; - 數(shù)據(jù)收集成本; - 人力成本:支付大模型訓(xùn)練開發(fā)人員的高額薪水。 這要求科研單位和企業(yè)一起緊密配合,結(jié)合各自優(yōu)勢,在典型領(lǐng)域?qū)崿F(xiàn)數(shù)據(jù)、模型、算法的共享和協(xié)同開發(fā),促進大模型研究的應(yīng)用和部署。 除了以上在開發(fā)、應(yīng)用部署和使用三個環(huán)節(jié)可能會面臨到的挑戰(zhàn)之外,大模型可能存在私密數(shù)據(jù)泄露風險和合規(guī)性風險,這也是廣泛民眾最能感知也最為關(guān)注的問題。現(xiàn)在有關(guān)部門正在逐步推出相關(guān)制度和法律,企業(yè)需要緊跟律法腳步,確保開發(fā)過程中的合法合規(guī)。 琶洲實驗室大模型團隊圍繞數(shù)據(jù)、模型、算法、應(yīng)用成立專項小組,目前超過100人,包括教授4名、副教授4名、博士16名、碩士64人、且正在逐步壯大。 本次大會上,琶洲實驗室、華南理工大學(xué)正式與鈦動科技簽訂三方合作條約,相信通過產(chǎn)學(xué)研三方強強聯(lián)合,深入AI應(yīng)用的深水區(qū),推動迭代升級,產(chǎn)出有原創(chuàng)性、突破性、對行業(yè)發(fā)展有重大影響力的高水平研究成果,推動中國商品、中國品牌更好地走向全球。
文章為作者獨立觀點,不代表DLZ123立場。如有侵權(quán),請聯(lián)系我們。( 版權(quán)為作者所有,如需轉(zhuǎn)載,請聯(lián)系作者 )

網(wǎng)站運營至今,離不開小伙伴們的支持。 為了給小伙伴們提供一個互相交流的平臺和資源的對接,特地開通了獨立站交流群。
群里有不少運營大神,不時會分享一些運營技巧,更有一些資源收藏愛好者不時分享一些優(yōu)質(zhì)的學(xué)習(xí)資料。
現(xiàn)在可以掃碼進群,備注【加群】。 ( 群完全免費,不廣告不賣課!)