語音識(shí)別測試

語音識(shí)別(ASR)評估指標(biāo)

在測試語音識(shí)別的過程中,衡量識(shí)別內(nèi)容的準(zhǔn)確性,一般通過如下指標(biāo)進(jìn)行評估

WER(WordErrorRate,詞錯(cuò)率)

定義:為了使識(shí)別出來的詞序列和標(biāo)準(zhǔn)的詞序列之間保持一致,需要進(jìn)行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個(gè)數(shù),除以標(biāo)準(zhǔn)的詞序列中詞的總個(gè)數(shù)的百分比,即為WER

WER=(S+D+I)/N

S:substitution,替換

D:Deletion,刪除

I:Insertion,插入

N:標(biāo)準(zhǔn)詞序列中詞的總個(gè)數(shù)

(S+D+I)=識(shí)別出來的詞序列與標(biāo)準(zhǔn)的詞序列之間的編輯距離

注意:因?yàn)橛胁迦朐~(Insertion),所以可能會(huì)出現(xiàn)WER>1的情況,不過,WER>1時(shí),表明識(shí)別出來的詞序列和標(biāo)準(zhǔn)的詞序列相差很大,識(shí)別效果特別差

SER(SentenceErrorRate,句錯(cuò)率)

定義:句子中如果有一個(gè)詞識(shí)別錯(cuò)誤,那么這個(gè)句子被認(rèn)為識(shí)別錯(cuò)誤,句子識(shí)別錯(cuò)誤的個(gè)數(shù),除以總的句子個(gè)數(shù)即為SER

SER=SE/N

SE:識(shí)別出來的序列中,識(shí)別錯(cuò)誤的句子個(gè)數(shù)(即WER!=0的句子個(gè)數(shù))

N:標(biāo)準(zhǔn)序列中總句子個(gè)數(shù)

(2)、驗(yàn)證識(shí)別內(nèi)容的準(zhǔn)確性

統(tǒng)計(jì)識(shí)別文字的WER、SER指標(biāo)

(3)、關(guān)注語音識(shí)別耗時(shí)

①短語音的識(shí)別耗時(shí)

②長語音的識(shí)別耗時(shí)


更多詳情可聯(lián)系藍(lán)亞技術(shù)工作人員:Benson

手機(jī)/Mob:(+86)13632500972

郵箱/E-mail:marketing@cblueasia.com

服務(wù)范圍

<script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://#/hm.js?6844225bf949cff65b89ec7139b9ad0f"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script>