作為當前最火的AI應(yīng)用,,ChatGPT在積累了1億用戶之后開始嘗試商業(yè)運營了,,昨天正式發(fā)布了API,企業(yè)可以付費接入,,75萬單詞只要2美元,,成本比之前降低了90%。
實際上昨天開放的業(yè)務(wù)還有一個,,那就是語音轉(zhuǎn)文字的API,,基于公司的Whisper大模型,去年9月份首次推出Whisper Large-v1模型,,12月開源了升級版的Whisper Large-v2模型,。
這次商業(yè)化之后,Whisper API的收費也很低廉,,每分鐘只要0.006美元,人民幣約為4分錢,,預計會讓很多語音相關(guān)的企業(yè)壓力很大,。
Whisper API支持對語音文件進行轉(zhuǎn)錄和翻譯,并支持包括英語,、中文,、阿拉伯語、日語,、德語,、西班牙語等幾十種語言。
不過不同語言的準確率差別不小,,Whisper large-v2模型在識別西語,、英語、意大利語,、德語等語言單詞錯誤率都能控制在5%以內(nèi),,這種語言轉(zhuǎn)文字之后只需要用戶簡單修改就好。
至于中文,,v1模型的錯誤率就有19.6%,,v2略微提升到14.7%,,改進不大,錯誤率比英文,、西語之類的高很多,,用戶使用起來有些麻煩,需要校正的地方就多,。
至于為何有這樣的差距,,除了中文自身的特點之外,很可能跟訓練使用的中文語料較少有關(guān),,畢竟網(wǎng)上的內(nèi)容主要還是外文,。