語音識別測試

語音識別(ASR)評估指標

在測試語音識別的過程中,衡量識別內容的準確性,一般通過如下指標進行評估

WER(WordErrorRate,詞錯率)

定義:為了使識別出來的詞序列和標準的詞序列之間保持一致,需要進行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個數,除以標準的詞序列中詞的總個數的百分比,即為WER

WER=(S+D+I)/N

S:substitution,替換

D:Deletion,刪除

I:Insertion,插入

N:標準詞序列中詞的總個數

(S+D+I)=識別出來的詞序列與標準的詞序列之間的編輯距離

注意:因為有插入詞(Insertion),所以可能會出現WER>1的情況,不過,WER>1時,表明識別出來的詞序列和標準的詞序列相差很大,識別效果特別差

SER(SentenceErrorRate,句錯率)

定義:句子中如果有一個詞識別錯誤,那么這個句子被認為識別錯誤,句子識別錯誤的個數,除以總的句子個數即為SER

SER=SE/N

SE:識別出來的序列中,識別錯誤的句子個數(即WER!=0的句子個數)

N:標準序列中總句子個數

(2)、驗證識別內容的準確性

統計識別文字的WER、SER指標

(3)、關注語音識別耗時

①短語音的識別耗時

②長語音的識別耗時


更多詳情可聯系藍亞技術工作人員:Benson

手機/Mob:(+86)13632500972

郵箱/E-mail:marketing@cblueasia.com

服務范圍

<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://#/hm.js?6844225bf949cff65b89ec7139b9ad0f"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>