HD Tune硬盘 SMART参数介绍

By | 2017/04/23

检查一个硬盘的好坏,除了进行坏道检测,另外一个比较直观的方式就是查看smart信息。smart包含了硬盘可预测的故障,可以提前发出警示,以便有足够的时间进行数据的备份。

SMART的值

HD Tune的的smart信息数据有4列,这四列的含义还真是让人弄不清,这里先对四列数据进行解释。

临界值

临界值是硬盘厂商指定的表示某一项目可靠性的门限值,也称阈值,它通过特定公式计算而得。如果某个参数的当前值接近了临界值,就意味着硬盘将变得不可靠,可能导致数据丢失或者硬盘故障。由于临界值是硬盘厂商根据自己产品特性而确定的,因此HD Tune下检测结果不一定正确。

当前值

当前值是各ID项在硬盘运行时根据实测数据通过公式计算的结果,计算公式由硬盘厂家自定。 出厂时各ID项目都有一个预设的最大当前值,随着使用损耗或出现错误,当前值会根据实测数据而不断刷新并逐渐减小,比如04。

最差值

最差值是对硬盘运行中某项数据变劣的峰值统计,该数值也会不断刷新。通常,最差值与当前值是相等的,如果最差值出现较大的波动(小于当前值),表明硬盘曾出现错误或曾经历过恶劣的工作环境(如温度)。

数据值

数据值是硬盘运行时各项参数的实测值,大部分SMART工具以十进制显示数据。 数据值代表的意义随参数而定,大致可以分为三类:
1)数据值并不直接反映硬盘状态,必须经过硬盘内置的计算公式换算成当前值才能得出结果;
2)数据值是直接累计的,如Start/Stop Count(启动/停止计数)的数据是50,即表示该硬盘从出厂到现在累计启停了50次;
3)有些参数的数据是即时数,如Temperature(温度)的数据值是44,表示硬盘的当前温度是44℃。
因此,有些参数直接查看数据也能大致了解硬盘目前的工作状态。

 

知道了各数据的含义,那么我们再学习下跟硬盘寿命密切相关的几个ID项。

  1. 01 底层数据读取错误率 Raw Read Error Rate:数据为0或任意值,当前值应远大于与临界值。
  2. 03 主轴起旋时间 Spin Up Time:数据值越小越好,硬盘的主轴电机从启动至达到额定转速大致需要4秒~15秒左右,过长的启动时间说明电机驱动电路或者轴承机构有问题。对固态硬盘无意义。
  3. 04 启停计数 Start/Stop Count:数据是累计值,表示硬盘主轴电机启动/停止的次数,新硬盘通常只有几次,以后会逐渐增加。过高的启动/停止次数(远大于通电次数0C)暗示硬盘电机及其驱动电路可能有问题。对固态硬盘无意义。
  4. 05 重映射扇区计数 Reallocated Sectors Count/ 退役块计数 Retired Block Count:关键参数,数据应为0,当前值应远大于临界值。当发现此项的数据值不为零时,要密切注意其发展趋势,若数据值不断上升,说明不良扇区不断增加,应当考虑更换了。如果当前值接近或已到达临界值(此时的数据值并不一定很大,因为不同硬盘保留的备用扇区数并不相同),表示缺陷表已满或备用扇区已用尽,已经失去了重映射功能,再出现不良扇区就会显现出来并直接导致数据丢失。
  5. 07 寻道错误率 Seek Error Rate:数据应为0,当前值为100且应远大于与临界值。表示磁头寻道时的错误率,有众多因素可导致寻道错误率上升,如磁头组件的机械系统、伺服电路有局部问题,盘片表面介质不良,硬盘温度过高等。数据量过大不一定是问题,但当前值出现下降表示硬盘可能存在问题,同时表现为读写速度变慢。
  6. 09  通电时间累计 Power-On Time Count (POH):表示硬盘通电的时间,数据值直接累计了设备通电的时长,新硬盘当然应该接近0,但不同硬盘的计数单位有所不同,有以小时计数的,也有以分、秒甚至30秒为单位的。临界值通常为0,当前值随着硬盘通电时间增加会逐渐下降,接近临界值表明硬盘已接近预计的设计寿命,当然这并不表明硬盘将出现故障或立即报废。对于固态硬盘,要注意“设备优先电源管理功能(device initiated power management,DIPM)”会影响这个统计:如果启用了DIPM,持续通电计数里就不包括睡眠时间;如果关闭了DIPM功能,那么活动、空闲和睡眠三种状态的时间都会被统计在内。
  7. 0A 主轴起旋重试次数 Spin up Retry Count:数据应为0,当前值应大于临界值。主轴电机启动后在规定的时间里未能成功达到额定转速而尝试再次启动的次数。数据量的增加表示电机驱动电路或是机械子系统出现问题,整机供电不足也会导致这一问题。
  8. 012 通电周期计数 Power Cycle Count:电源开关次数的累计,新硬盘通常只有几次。 一般来说,硬盘通电/断电意味着计算机的开机与关机,所以经历一次开关机数据才会加1;而启停计数(04)表示硬盘主轴电机的启动/停止(硬盘在运行时可能多次启停,如系统进入休眠或被设置为空闲多少时间而关闭)。所以大多情况下这个通电/断电的次数会小于启停计数(04)的次数。
  9. BE 气流温度 Airflow Temperature:硬盘内部盘片表面的气流温度。在希捷公司的某些硬盘中,当前值=(100-当前温度),因此气流温度越高,当前值就越低,最差值则是当前值曾经到达过的最低点,临界值由制造商定义的最高允许温度来确定,而数据值不具实际意义。
  10. C2 温度 Temperature:温度的数据值直接表示了硬盘内部的当前温度。硬盘运行时最好不要超过45℃,温度过高虽不会导致数据丢失,但引起的机械变形会导致寻道与读写错误率上升,降低硬盘性能。硬盘的最高允许运行温度可查看硬盘厂商给出的数据,一般不会超过60℃。 不同品牌当前值、最差意义不同,希捷公司某些硬盘的当前值就是实际温度(摄氏)值,最差值则是曾经达到过的最高温度,临界值不具意义;而西部数据公司一些硬盘的最差值是温度上升到某值后的时间函数,每次升温后的持续时间都将导致最差值逐渐下降,当前值则与当前温度成反比,即当前温度越高,当前值越低,随实际温度波动。
  11. C4 重映射事件计数 Reallocetion Events Count:数据应为0,当前值应远大于临界值。 这个参数的数据值记录了将重映射扇区的数据转移到备用扇区的尝试次数,是重映射操作的累计值,成功的转移和不成功的转移都会被计数。因此这一参数与重映射扇区计数(05)相似,都是反映硬盘已经存在不良扇区。
  12. C6 脱机无法校正的扇区计数 Offline Uncorrectable Sector Count:数据应为0,当前值应远大于临界值。这个参数的数据累计了读写扇区时发生的无法校正的错误总数。数据值上升表明盘片表面介质或机械子系统出现问题,有些扇区肯定已经不能读取,如果有文件正在使用这些扇区,操作系统会返回读盘错误的信息。下一次写操作时会对该扇区执行重映射。
  13. C7 Ultra ATA访问校验错误率 Ultra ATA CRC Error Rate:参数的数据值累计了通过接口循环冗余校验(Interface Cyclic Redundancy Check,ICRC)发现的数据线传输错误的次数。如果数据值不为0且持续增长,表示硬盘控制器→数据线→硬盘接口出现错误,劣质的数据线、接口接触不良都可能导致此现象。由于这一项的数据值不会复零,所以某些新硬盘也会出现一定的数据量,只要更换数据线后数据值不再继续增长,即表示问题已得到解决。
  14. E7 剩余寿命 SSD Life Left:剩余寿命是基于P/E周期与可用的备用块作出的预测。新硬盘为100;10表示PE周期已到设计值,但尚有足够的保留块;0表示保留块不足,硬盘将处于只读方式以便备份数据。(E7有表示温度的情况,同C2)
  15. FE 自由坠落保护 Free Fall Protection

以上是常见的值,其实比较容易记忆,就是在使用HD Tune的时候:能理解的值就按照理解来,比如通电时间、温度。不理解的值,就看当前、最差和阈值的对比,一般来说比值越大越好。

PS:SMART信息可以修改!SMART信息可以修改!SMART信息可以修改!

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据