語音識別測試

語音識別(ASR)評估指標(biāo)

在測試語音識別的過程中,衡量識別內(nèi)容的準(zhǔn)確性,一般通過如下指標(biāo)進(jìn)行評估

WER(WordErrorRate,詞錯率)

定義:為了使識別出來的詞序列和標(biāo)準(zhǔn)的詞序列之間保持一致,需要進(jìn)行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個(gè)數(shù),除以標(biāo)準(zhǔn)的詞序列中詞的總個(gè)數(shù)的百分比,即為WER

WER=(S+D+I)/N

S:substitution,替換

D:Deletion,刪除

I:Insertion,插入

N:標(biāo)準(zhǔn)詞序列中詞的總個(gè)數(shù)

(S+D+I)=識別出來的詞序列與標(biāo)準(zhǔn)的詞序列之間的編輯距離

注意:因?yàn)橛胁迦朐~(Insertion),所以可能會出現(xiàn)WER>1的情況,不過,WER>1時(shí),表明識別出來的詞序列和標(biāo)準(zhǔn)的詞序列相差很大,識別效果特別差

SER(SentenceErrorRate,句錯率)

定義:句子中如果有一個(gè)詞識別錯誤,那么這個(gè)句子被認(rèn)為識別錯誤,句子識別錯誤的個(gè)數(shù),除以總的句子個(gè)數(shù)即為SER

SER=SE/N

SE:識別出來的序列中,識別錯誤的句子個(gè)數(shù)(即WER!=0的句子個(gè)數(shù))

N:標(biāo)準(zhǔn)序列中總句子個(gè)數(shù)

(2)、驗(yàn)證識別內(nèi)容的準(zhǔn)確性

統(tǒng)計(jì)識別文字的WER、SER指標(biāo)

(3)、關(guān)注語音識別耗時(shí)

①短語音的識別耗時(shí)

②長語音的識別耗時(shí)


更多詳情可聯(lián)系藍(lán)亞技術(shù)工作人員:Benson

手機(jī)/Mob:(+86)13632500972

郵箱/E-mail:marketing@cblueasia.com

服務(wù)范圍

<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://#/hm.js?6844225bf949cff65b89ec7139b9ad0f"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>