AI(人工智能)正在為傳承語言文化注入全新生命力。中國運(yùn)營商發(fā)布首個支持30種方言混說語音大模型。
25日,在第七屆數(shù)字中國建設(shè)峰會上,中國電信人工智能研究院發(fā)布業(yè)內(nèi)首個支持30種方言自由混說的語音識別大模型——星辰超多方言語音識別大模型,打破單一模型只能識別特定單一方言的困境,可同時識別理解粵語、上海話、四川話、溫州話等30多種方言,是國內(nèi)支持最多方言的語音識別大模型。
中國幅員遼闊,「百里不同俗,十里不同音」。各種方言語法語音特徵各不相同,傳統(tǒng)的方言研究依賴於調(diào)查者主觀感知標(biāo)註,人力工程量巨大且難以系統(tǒng)標(biāo)註。而AI能夠更高效、系統(tǒng)地對方言進(jìn)行整理歸納,對方言保護(hù)和傳承意義重大。
構(gòu)建高質(zhì)量方言數(shù)據(jù)庫,是方言保護(hù)和研究的基礎(chǔ)。中國電信人工智能研究院已構(gòu)建超過30種、超30萬小時的高質(zhì)量方言數(shù)據(jù)庫,方言數(shù)據(jù)庫在豐富性和高質(zhì)量等層面均居於業(yè)內(nèi)前列。
此外,中國電信研發(fā)團(tuán)隊(duì)首創(chuàng)「蒸餾+膨脹」聯(lián)合訓(xùn)練算法,解決超大規(guī)模多場景數(shù)據(jù)集和大規(guī)模參數(shù)條件下,預(yù)訓(xùn)練坍縮的問題。
據(jù)悉,星辰語音大模型已廣泛應(yīng)用落地。星辰語音大模型已在福建、江西、廣西、北京、內(nèi)蒙古等地的中國電信10000智能客服試點(diǎn)應(yīng)用。接入星辰大模型以後,智能客服秒懂30種方言,實(shí)現(xiàn)日均處理約200萬通電話。此外,星辰語音大模型還落地多地市的12345平臺。(中新社記者 劉育英)