查看: 11858|回复: 1

VOIP四种语音质量评测指标 [复制链接]

jack_sy

军衔等级：

新兵

注册：2012-3-14

电梯直达

1^# 大中小

发表于 2014-3-15 15:59:01 |只看该作者 |正序浏览

本帖最后由 jack_sy 于 2014-3-15 16:14 编辑

目前对IP电话业务语音质量评分的评价主要有三种模型：MOS模型、PSQM模型和E模型。

1. MOS模型

　　ITU-T建议P.830描述了一种对语音的主观评定方法-MOS（Mean Opinion Score）方法。根据P.830建议的要求，特定的发话者与听话者在特定的环境下，通过收集测试者在各种不同情景下的主观感受，根据P.830的分析法则得出该语音的品质。P.830对测试的要求非常严格，所有的操作都要严格地服从操作流程，对录音系统、语音采样、语音输入级别、听者级别、不同发话者(8男、8女、8儿童)、多发话者(多人同时讲话)、差错处理、不同语音编码方式的兼容性、过失、环境噪音、音乐等等，都作出了详细严格的规定。测试者的主观感受结果也被分为很多不同的范畴，如听者感受的网络质量结果、质量降级结果、比较结果等。

2. PSQM模型

　　MOS方法是一种模糊的评估方法，其测试结果很难对VoIP系统的改进和不同VoIP设备之间性能的比较作出有实际意义的判别。因此，有人提出借用ITU-T 在P.861 中建议的 PSQM (Perceptual Speech Quality Measurement)方法，用来作为客观质量度量的评估。

　　PSQM的客观性是指模仿现实生活中主观声音的感知。PSQM仿真实验中主观判断话音编码器的质量，通过把编码后的信号和源信号进行比较，PSQM仍以MOS的5个级别作为评估结果。PSQM方法并未摆脱原始的人类主观评估，只是作了进一步的说明。

　　图1为ITU-T P.861定义的PSQM算法的评价模型。首先选取符合条件的基准信号源，可以是真实的声音，也可以是规定的人工语音。把基准信号源和经过网络的干扰后信号输入到知觉模型，这个知觉模型实际上是对信号进行时间-频率映射，以及频率和强度偏差处理。从知觉模型输出得到的信号内部表现通过差别模型进行处理，为了获得主观和客观之间的较高关联性，再输入到认识模型，最后得到质量评分。从这个评价模型可以看出使用者对语音清晰度的评价主要取决于使用者的认识模型，而使用者的认识模型又是受其知觉模型影响。

3. E模型

　　E模型最早是由欧洲的ETSI标准组织提出，后来又由ITU-T标准化形成G.107建议。Ｅ模型的思想是将话音信号传输过程中若干因素对话质的负面影响综合为参数Ｒ，用以评估该话音呼叫的主观质量。Ｒ的值越大，表明话音质量越好。Ｅ模型的Ｒ参数由下式确定：

　　Ｒ＝ Ro－Is－Id－Ie＋A

　　其中参数Ro表示噪音带来的影响，如背景噪音和电流噪音的干扰。参数Is表示与语音信号同时产生的质量影响因素，如由量化、连接噪声和侧音过强带来的干扰。参数Id表示由于时延造成的质量影响，包括由于通话回声和交互性丧失带来的干扰。Ie包括由于使用特殊设备引入的质量损失，如低比特率编解码器的影响和分组丢失的影响。G.729A的Ie为10，G.723.1在5.3kbit/s和6.3kbit/s码流速率下的Ie分别为19和15。参数A为预期值，用以补偿由于用户采用某些带来便捷接入的设备而导致的话音质量的影响。对于传统电话,A取值为０；而GSM移动电话的A值为10。

　　根据Ｅ模型确定可接受话音质量对应的Ｒ值。编解码器类型、通信模式和传输协议的不同，会使上式中的各个分量有不同的取值，从而得到不同的Ｒ值。

2 举报本楼

本帖有 1 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2024-11-29 16:55 , Processed in 0.124249 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册