附录D:可靠性分析
理论基础
可靠性 Reliability
设备的可靠性指在规定条件及时间段内, 设备不发生故障的概率。一般有以下三个指标来衡量:
故障率和MTBF
在单位时间内(一般以年为单位),产品的故障总数与运行的产品总量之比叫“故障率”(Failure rate),常用λ表示。例如网上运行了100 台某设备,一年之内出了2次故障,则该设备的故障率为0.02次/年。当产品的寿命服从指数分布时,其故障率的倒数就叫做平均故障间隔时间或平均无故障时间(Mean Time Between Failures),简称MTBF。即:
举例:
例一、例如某型号YY产品的MTBF时间高达16万小时。16万小时约为18年,并不是说YY产品每台均能工作18年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/18年(假如YY产品的寿命服从指数分布),即YY产品平均年故障率约为5.5%,一年内,平均1000台设备有55台会出故障。
例二、例如正在运行中的100只硬盘,一年之内出了2次故障,则每个硬盘的故障率为0.02次/年。即年平均故障率为2%
MTTF
MTTF(Mean Time To Failure)平均故障时间,单位为小时,它表示产品从正常运行状态到发生一次故障所用的平均时间。这个值基本没用。
MTTR
MTTR(Mean Time To Repair)平均修复时间,单位为小时,它表示产品从出现故障到恢复成可正常工作状态所用的平均时间。
可用性 Availability
在规定条件下,在规定时刻或时间区间内,在规定时间段内,设备能提供正常运行时间
的概率。
它是产品在使用过程中,可以正常使用的时间与总时间之比。可用性用平均无故障工作时间MTBF和平均修复时间MTTR表示: