在測試語音識(shí)別的過程中,衡量識(shí)別內(nèi)容的準(zhǔn)確性,一般通過如下指標(biāo)進(jìn)行評估
WER(WordErrorRate,詞錯(cuò)率)
定義:為了使識(shí)別出來的詞序列和標(biāo)準(zhǔn)的詞序列之間保持一致,需要進(jìn)行替換、刪除或者插入某些詞,這些插入、替換或刪除的詞的總個(gè)數(shù),除以標(biāo)準(zhǔn)的詞序列中詞的總個(gè)數(shù)的百分比,即為WER
WER=(S+D+I)/N
S:substitution,替換
D:Deletion,刪除
I:Insertion,插入
N:標(biāo)準(zhǔn)詞序列中詞的總個(gè)數(shù)
(S+D+I)=識(shí)別出來的詞序列與標(biāo)準(zhǔn)的詞序列之間的編輯距離
注意:因?yàn)橛胁迦朐~(Insertion),所以可能會(huì)出現(xiàn)WER>1的情況,不過,WER>1時(shí),表明識(shí)別出來的詞序列和標(biāo)準(zhǔn)的詞序列相差很大,識(shí)別效果特別差
SER(SentenceErrorRate,句錯(cuò)率)
定義:句子中如果有一個(gè)詞識(shí)別錯(cuò)誤,那么這個(gè)句子被認(rèn)為識(shí)別錯(cuò)誤,句子識(shí)別錯(cuò)誤的個(gè)數(shù),除以總的句子個(gè)數(shù)即為SER
SER=SE/N
SE:識(shí)別出來的序列中,識(shí)別錯(cuò)誤的句子個(gè)數(shù)(即WER!=0的句子個(gè)數(shù))
N:標(biāo)準(zhǔn)序列中總句子個(gè)數(shù)
(2)、驗(yàn)證識(shí)別內(nèi)容的準(zhǔn)確性
統(tǒng)計(jì)識(shí)別文字的WER、SER指標(biāo)
(3)、關(guān)注語音識(shí)別耗時(shí)
①短語音的識(shí)別耗時(shí)
②長語音的識(shí)別耗時(shí)
更多詳情可聯(lián)系藍(lán)亞技術(shù)工作人員:Benson
手機(jī)/Mob:(+86)13632500972
郵箱/E-mail:marketing@cblueasia.com