“雅意”發(fā)布會(huì)系列之二 | 羅引博士:現(xiàn)場(chǎng)演示“雅意”五大核心能力
以下為部分演講實(shí)錄:
各位來(lái)賓,線上的朋友大家好,溝通是人類互動(dòng)、協(xié)作最重要的一種高級(jí)智慧表現(xiàn)。通用人工智能的時(shí)代到來(lái),大模型技術(shù)使得自然的人機(jī)交互成為一種現(xiàn)實(shí)。中科聞歌自成立以來(lái),就聚焦多語(yǔ)言、跨模態(tài)和深度語(yǔ)義理解的技術(shù)研發(fā),與通往AGI的道路完全一致。雅意大模型的產(chǎn)生,源于我們?cè)趫?chǎng)景研發(fā)中積累多年的千億級(jí)高質(zhì)量的知識(shí)信息、自有的大規(guī)模算力中心和對(duì)于人工智能技術(shù)落地場(chǎng)景的洞察。
目前雅意大模型經(jīng)過(guò)我們研發(fā)團(tuán)隊(duì)多輪迭代、嚴(yán)苛的測(cè)試,已經(jīng)形成包括:實(shí)時(shí)聯(lián)網(wǎng)問(wèn)答、領(lǐng)域知識(shí)問(wèn)答、多語(yǔ)言內(nèi)容理解、復(fù)雜場(chǎng)景信息抽取、多模態(tài)內(nèi)容生成的五項(xiàng)核心能力,以及100多項(xiàng)子任務(wù)。并且我們?cè)谶@些通用能力之上,極其專注于媒體創(chuàng)作、智慧金融、安全治理等關(guān)鍵領(lǐng)域,大幅提升我們模型的精度。
首先,我們想為大家展示雅意大模型+大數(shù)據(jù),面向互聯(lián)網(wǎng)實(shí)時(shí)流數(shù)據(jù),能產(chǎn)生哪些有意義的應(yīng)用。
大模型能夠高速并發(fā)的計(jì)算以及聞歌強(qiáng)大的互聯(lián)網(wǎng)分析能力,將每天數(shù)億級(jí)的海量信息中提取出來(lái),用戶想要通過(guò)大量閱讀才能得到的關(guān)鍵信息。
由于互聯(lián)網(wǎng)的數(shù)據(jù)是非常龐雜的,生成高質(zhì)量的結(jié)果有極高的挑戰(zhàn)。所以另外一種方式我們是用大模型跟私域的高質(zhì)量知識(shí)進(jìn)行對(duì)接,快速的去塑造一個(gè)領(lǐng)域的專家完成問(wèn)答。
通過(guò)知識(shí)連接,雅意可以給出這種高度提煉的、有依據(jù)的準(zhǔn)確回復(fù)。未來(lái),在教育、金融、醫(yī)療、法律各個(gè)領(lǐng)域,專家服務(wù)不再需要一對(duì)一的完成,大模型可以成為行業(yè)專家同時(shí)服務(wù)大量人群,而且具備統(tǒng)一的知識(shí)水平和專業(yè)標(biāo)準(zhǔn)的一套服務(wù)。“大模型+精知識(shí)”即等于行業(yè)專家。
雅意也可以對(duì)長(zhǎng)文檔進(jìn)行學(xué)習(xí)整理,支持百萬(wàn)字規(guī)模的文檔學(xué)習(xí)。
在讀懂內(nèi)容,具備總結(jié)歸納能力之后,我們進(jìn)一步展示雅意如何靈活地面對(duì)復(fù)雜場(chǎng)景信息抽取的任務(wù)。
接下來(lái),我想為大家演示雅意在多語(yǔ)言內(nèi)容理解的能力。第一個(gè)是對(duì)于事理解析的能力,第二個(gè)是企業(yè)的用戶都很關(guān)注自身的聲譽(yù)以及客戶服務(wù)的滿意度,雅意對(duì)于用戶意見(jiàn)方面做了很多模型訓(xùn)練工作。
我們?cè)诙嗾Z(yǔ)種的內(nèi)容理解方面,還有其他的能力,包括多語(yǔ)言翻譯、傾向性分析等功能。
接下來(lái)展示我們?cè)诙嗄B(tài)內(nèi)容生成方面的能力。這部分能力我們已經(jīng)深度整合到中科聞歌紅旗融媒體系統(tǒng)。
第一個(gè)是生成稿件標(biāo)題的能力。
第二個(gè)是我們的文本生成可以幫助用戶寫(xiě)快報(bào),而且這是非常剛需的場(chǎng)景。
下一個(gè)例子是詩(shī)歌創(chuàng)作。
數(shù)字人與大模型連接后,未來(lái)可以廣泛應(yīng)用到很多新的場(chǎng)景,比如說(shuō)在線的直播營(yíng)銷、線上營(yíng)業(yè)廳服務(wù)、互動(dòng)新聞,都可以通過(guò)這樣的方式實(shí)現(xiàn)一個(gè)組合,無(wú)需人力介入就可以完成。
在多模態(tài)能力方面,我們接著剛才的這首詩(shī),來(lái)試試雅意在作畫(huà)方面的能力。AI作畫(huà)可以選擇不同的流派,藝術(shù)家,還有各種修飾詞,都可以提前預(yù)制好。整個(gè)作畫(huà)的內(nèi)容是沒(méi)有版權(quán)風(fēng)險(xiǎn),獨(dú)一無(wú)二。
我們總結(jié)一下“雅意”大模型的特點(diǎn),第一是集成化,我們是高度集成化的模型,經(jīng)過(guò)我們研發(fā)團(tuán)隊(duì)深度的性能調(diào)優(yōu),支持訓(xùn)練和推理一體,單卡就可以完成推理任務(wù),而且支持持續(xù)的Finetune(微調(diào))+RLHF(基于人類反饋的強(qiáng)化學(xué)習(xí))技術(shù)。第二是專屬自有,我們?cè)谟?xùn)練和推理的過(guò)程中,客戶側(cè)數(shù)據(jù)資產(chǎn)不出域,而且離線完成專屬定制訓(xùn)練。第三是安全可控,支持知識(shí)的隔離,應(yīng)用保護(hù)能夠防止泄露,這都是非常關(guān)鍵的應(yīng)用點(diǎn)。
當(dāng)前,雅意的能力已經(jīng)接入到中科聞歌行業(yè)產(chǎn)品當(dāng)中,我們也深刻感受到大模型帶來(lái)的革命性的生產(chǎn)力提升。