通信人家园
标题:
VOIP四种语音质量评测指标
[查看完整版帖子]
[打印本页]
时间:
2014-3-15 15:59
作者:
jack_sy
标题:
VOIP四种语音质量评测指标
本帖最后由 jack_sy 于 2014-3-15 16:14 编辑
目前对IP电话业务语音质量评分的评价主要有三种模型:MOS模型、PSQM模型和E模型。
1. MOS模型
ITU-T建议P.830描述了一种对语音的主观评定方法-MOS(Mean Opinion Score)方法。根据P.830建议的要求,特定的发话者与听话者在特定的环境下,通过收集测试者在各种不同情景下的主观感受,根据P.830的分析法则得出该语音的品质。P.830对测试的要求非常严格,所有的操作都要严格地服从操作流程,对录音系统、语音采样、语音输入级别、听者级别、不同发话者(8男、8女、8儿童)、多发话者(多人同时讲话)、差错处理、不同语音编码方式的兼容性、过失、环境噪音、音乐等等,都作出了详细严格的规定。测试者的主观感受结果也被分为很多不同的范畴,如听者感受的网络质量结果、质量降级结果、比较结果等。
2. PSQM模型
MOS方法是一种模糊的评估方法,其测试结果很难对VoIP系统的改进和不同VoIP设备之间性能的比较作出有实际意义的判别。因此,有人提出借用ITU-T 在P.861 中建议的 PSQM (Perceptual Speech Quality Measurement)方法,用来作为客观质量度量的评估。
PSQM的客观性是指模仿现实生活中主观声音的感知。PSQM仿真实验中主观判断话音编码器的质量,通过把编码后的信号和源信号进行比较,PSQM仍以MOS的5个级别作为评估结果。PSQM方法并未摆脱原始的人类主观评估,只是作了进一步的说明。
图1为ITU-T P.861定义的PSQM算法的评价模型。首先选取符合条件的基准信号源,可以是真实的声音,也可以是规定的人工语音。把基准信号源和经过网络的干扰后信号输入到知觉模型,这个知觉模型实际上是对信号进行时间-频率映射,以及频率和强度偏差处理。从知觉模型输出得到的信号内部表现通过差别模型进行处理,为了获得主观和客观之间的较高关联性,再输入到认识模型,最后得到质量评分。从这个评价模型可以看出使用者对语音清晰度的评价主要取决于使用者的认识模型,而使用者的认识模型又是受其知觉模型影响。
3. E模型
E模型最早是由欧洲的ETSI标准组织提出,后来又由ITU-T标准化形成G.107建议。E模型的思想是将话音信号传输过程中若干因素对话质的负面影响综合为参数R,用以评估该话音呼叫的主观质量。R的值越大,表明话音质量越好。E模型的R参数由下式确定:
R = Ro-Is-Id-Ie+A
其中参数Ro表示噪音带来的影响,如背景噪音和电流噪音的干扰。参数Is表示与语音信号同时产生的质量影响因素,如由量化、连接噪声和侧音过强带来的干扰。参数Id表示由于时延造成的质量影响,包括由于通话回声和交互性丧失带来的干扰。Ie包括由于使用特殊设备引入的质量损失,如低比特率编解码器的影响和分组丢失的影响。G.729A的Ie为10,G.723.1在5.3kbit/s和6.3kbit/s码流速率下的Ie分别为19和15。参数A为预期值,用以补偿由于用户采用某些带来便捷接入的设备而导致的话音质量的影响。对于传统电话,A取值为0;而GSM移动电话的A值为10。
根据E模型确定可接受话音质量对应的R值。编解码器类型、通信模式和传输协议的不同,会使上式中的各个分量有不同的取值,从而得到不同的R值。
时间:
2015-9-19 15:16
作者:
冷笑书生
不错,只有三种
通信人家园 (https://www.txrjy.com/)
Powered by C114