8天堂资源在线,6080亚洲人久久精品,51区亚洲精品一区二区三区,国产香蕉熟妇在线影院,亚洲精品国产成人99久久6

返回

全面開(kāi)源的雅意2.0來(lái)了!HuggingFace和Github可下載

來(lái)源: 發(fā)布時(shí)間:2023/12/25 瀏覽量:

12月15日,中科聞歌重磅發(fā)布雅意大模型2.0。作為為數(shù)不多從頭進(jìn)行預(yù)訓(xùn)練的國(guó)產(chǎn)原生大模型,雅意2.0擁有數(shù)據(jù)、模型、應(yīng)用全自主知識(shí)產(chǎn)權(quán),可面向行業(yè)應(yīng)用場(chǎng)景自主訓(xùn)練和微調(diào)。雅意2.0所有的代碼、模型都已通過(guò)GitHub、Huggingface平臺(tái)開(kāi)放,可免費(fèi)申請(qǐng)商用。


雅意全系列模型、代碼、數(shù)據(jù)全面開(kāi)源開(kāi)放


雅意2.0開(kāi)源目前最大規(guī)模的高質(zhì)量中文預(yù)訓(xùn)練數(shù)據(jù)集信息收取指令數(shù)據(jù)集

● 雅意2.0高質(zhì)量預(yù)訓(xùn)練數(shù)據(jù)(500GB,約1000億Tokens文本數(shù)據(jù))
● YAYI-UIE信息抽取大模型的信息抽取指令數(shù)據(jù)集


同時(shí),雅意2.0全系列模型,包括YAYI 2 的預(yù)訓(xùn)練模型、YAYI 2 Chat對(duì)話模型、YAYI UIE信息抽取大模型,所有代碼、模型都已通過(guò)GitHub、HuggingFace平臺(tái)向每一位開(kāi)發(fā)者開(kāi)放,均可免費(fèi)申請(qǐng)商用,歡迎大家體驗(yàn)!  


Github:https://github.com/wenge-research

Huggingface:https://huggingface.co/wenge-research



雅意2.0能力全面增強(qiáng)

1

模型訓(xùn)練

● 模型參數(shù)大幅提升

 Token壓縮率國(guó)內(nèi)領(lǐng)先,中英雙語(yǔ)國(guó)內(nèi)領(lǐng)先、多語(yǔ)種國(guó)內(nèi)No.1

● 從頭預(yù)訓(xùn)練,數(shù)據(jù)多層過(guò)濾、分布廣泛:240TB多源基礎(chǔ)數(shù)據(jù),1000余道數(shù)據(jù)清洗工序,2.65萬(wàn)億Tokens高質(zhì)量訓(xùn)練數(shù)據(jù)。


2

特色技能

 多輪對(duì)話角色扮演,可扮演特定人物、執(zhí)行專(zhuān)業(yè)任務(wù),支持自定義角色及表達(dá)風(fēng)格,實(shí)現(xiàn)超長(zhǎng)輪歷史對(duì)話關(guān)聯(lián);

● 最長(zhǎng)128k輸入更長(zhǎng)上下文窗口,支持離線文檔、數(shù)據(jù)庫(kù)、API接入;

 1000W+圖文數(shù)據(jù)對(duì)齊,多模態(tài)能力提升圖生文:支持內(nèi)容理解、審核、抽取等30+能力;文生圖:文本描述提升文生圖細(xì)節(jié));

 內(nèi)容安全風(fēng)控,人類(lèi)價(jià)值觀對(duì)齊、流式內(nèi)容實(shí)時(shí)審核、誘導(dǎo)性拒識(shí);

 10+智能插件調(diào)用,可根據(jù)用戶(hù)輸入自動(dòng)化選擇插件,支持自定義插件庫(kù);支持搜索引擎、PDF解析、計(jì)算器、天氣、AI繪畫(huà)、數(shù)字人等插件;精準(zhǔn)解析用戶(hù)對(duì)話意圖,降低生成幻覺(jué);

 10+語(yǔ)種支持,多語(yǔ)言能力提升

 100種+復(fù)雜信息抽取信息抽取能力提升


3

專(zhuān)業(yè)技能

雅意2.0深度增強(qiáng)安全、金融、媒體、輿情等領(lǐng)域的專(zhuān)業(yè)能力,并覆蓋法律、中醫(yī)等多業(yè)務(wù)場(chǎng)景,著力構(gòu)建雅意大模型行業(yè)生態(tài)。


同時(shí),推出雅意2.0通用產(chǎn)品體系

 YAYI-Chat:大模型MaaS服務(wù)平臺(tái)

 YAYI-Bot:專(zhuān)家級(jí)行業(yè)助手,雅意移動(dòng)端應(yīng)用

 YAYI UIE:復(fù)雜信息抽取工具箱

 YAYI File:文檔智能問(wèn)答,企業(yè)內(nèi)部非結(jié)構(gòu)數(shù)據(jù)智能處理


4

測(cè)評(píng)指標(biāo)

雅意2.0多項(xiàng)測(cè)評(píng)業(yè)內(nèi)領(lǐng)先

 Token壓縮率中英雙語(yǔ)國(guó)內(nèi)領(lǐng)先、多語(yǔ)種國(guó)內(nèi)第一;

 中文知識(shí)問(wèn)答能力業(yè)界領(lǐng)先,獲得AGIEval、CMMLU測(cè)評(píng)第一,MMLU測(cè)評(píng)第二,C-Eval、HumanEval測(cè)評(píng)第五

 零樣本中文信息抽取能力多項(xiàng)全球SOTA(最佳性能表現(xiàn)):事件抽取任務(wù),SOTA;關(guān)系抽取,SOTA;實(shí)體抽取,中文SOTA,英文全面對(duì)標(biāo)ChatGPT


無(wú)

無(wú)

IPO
系列

IPO產(chǎn)品系列

企業(yè)
出海

企業(yè)出海系列產(chǎn)品

關(guān)注中科智庫(kù)公眾號(hào)
即享最新權(quán)威資訊洞察

下載智看APP
開(kāi)啟輿情咨詢(xún)
商業(yè)洞察專(zhuān)業(yè)服務(wù)

下載智看APP
開(kāi)啟輿情咨詢(xún)
商業(yè)洞察專(zhuān)業(yè)服務(wù)

在線留言

請(qǐng)留下您的信息,我們會(huì)第一時(shí)間與您聯(lián)系

所有提交信息,我們將嚴(yán)格為您保密

您已閱讀并同意用戶(hù)授權(quán)協(xié)議