華爾街見聞獲悉,本周,由阿里國際聯(lián)合上海人工智能實驗室、北京語言大學(xué)一起制定的AI翻譯測評榜單TransBench在OpenCompass上線。與傳統(tǒng)的翻譯測評體系相比,該榜單增加了幻覺率、文化禁忌詞、敬語規(guī)范等指標,并首次針對行業(yè)的細分領(lǐng)域構(gòu)建評測數(shù)據(jù)和評測方法。這些指標均來自真實場景的使用反饋,測評方法也已開源。
網(wǎng)站首頁 |
關(guān)于我們 |
聯(lián)系方式 |
使用協(xié)議 |
版權(quán)隱私 |
網(wǎng)站地圖
| 排名推廣
| 會員服務(wù)
| 廣告服務(wù) | 網(wǎng)站留言 | RSS訂閱 | 湘ICP備17024370號 -1
現(xiàn)代實驗室裝備網(wǎng) 實驗室行業(yè)專業(yè)網(wǎng)絡(luò)媒體
4001009187 0731-84444840
?Copyright 2000-2024 現(xiàn)代資訊 All Rights Reserved
QQ:369830746
4001009187 0731-84444840
?Copyright 2000-2024 現(xiàn)代資訊 All Rights Reserved
QQ:369830746