導讀 隨著人工智能戰爭的升溫,科技巨頭谷歌分享了它在去年 11 月宣布的通用語音模型 (USM) 取得的進展。作為支持世界上使用最多的語言的雄
隨著人工智能戰爭的升溫,科技巨頭谷歌分享了它在去年 11 月宣布的通用語音模型 (USM) 取得的進展。
作為支持世界上使用最多的語言的雄心勃勃的計劃的一部分,USM 是一個最先進的語音模型系列,擁有 20 億個參數,這些參數經過 1200 萬小時的語音訓練,涵蓋 300 多種語言的 280 億個文本句子。
雖然它還沒有達到 1000 種語言的目標,但它是谷歌的重要基礎。
谷歌使用 USM 為 YouTube 上的視頻生成實時字幕,這家搜索巨頭表示,它不僅可以識別“英語和普通話等廣泛使用的語言”,還可以識別“阿姆哈拉語、宿霧語、阿薩姆語和阿塞拜疆語等資源匱乏的語言”舉幾個例子”。
這些構建塊將作為構建更大語言模型的基礎。
谷歌在博文中寫道:“USM 的開發是實現谷歌組織全球信息并使人人皆可訪問的使命的關鍵努力。”
標簽: