语音识别测试

语音识别(ASR)评估指标


    在测试语音识别的过程中,衡量识别内容的准确性,一般通过如下指标进行评估


    WER(Word Error Rate,词错率)

    定义:为了使识别出来的词序列和标准的词序列之间保持一致,需要进行替换、删除或者插入某些词,这些插入、替换或删除的词的总个数,除以标准的词序列中词的总个数的百分比,即为WER


    WER=(S+D+I)/N


    S:substitution,替换


    D:Deletion,删除


    I:Insertion,插入


    N:标准词序列中词的总个数


   (S+D+I)=识别出来的词序列与标准的词序列之间的编辑距离


    注意:因为有插入词(Insertion),所以可能会出现WER>1的情况,不过,WER>1时,表明识别出来的词序列和标准的词序列相差很大,识别效果特别差


  SER(Sentence Error Rate,句错率)

    定义:句子中如果有一个词识别错误,那么这个句子被认为识别错误,句子识别错误的个数,除以总的句子个数即为SER


    SER=SE/N


    SE:识别出来的序列中,识别错误的句子个数(即WER!=0的句子个数)


    N:标准序列中总句子个数


    (2)、验证识别内容的准确性


    统计识别文字的WER、SER指标


    (3)、关注语音识别耗时


    ①短语音的识别耗时


    ②长语音的识别耗时


更多详情可联系全球最正规体育平台技术工作人员:Benson 

手机/Mob:(+86)13632500972 

邮箱/E-mail:marketing@pendlewitches.net


服务范围