De fleste af os har nok oplevet, at en harddisk stod af. Det er på alle måder irriterende. Tabet af data er oftest det værste, men selv med en god backup skal man til at bruge timer, ofte flere hele aftener, på at genskabe computeren.
Hvis man så bare havde fået et kort varsel! Det kan man faktisk godt få, for siden ATA-3 standarden kom frem i 1996[1], har alle harddiske været udstyret med S.M.A.R.T.-systemet. Og det er smart! Systemet overvåger en lang række mere eller mindre kritiske parametre i disken. Det foregår helt uafhængigt af computeren, inde i selve harddisken.
Her knækker filmen imidlertid, for der er ikke nogen harddisk-fabrikanter der leverer et interface til S.M.A.R.T., ligesom det heller ikke findes i Windows™, på trods af at basiskommandoerne er veldokumenterede og frit tilgængelige (der findes ikke en egentlig S.M.A.R.T.-standard).
Heldigvis er andre mere service-mindede. Derfor har de lavet smartmontools, som også fås til Windows. Det er to programmer – et der konstant kører i baggrunden og holder øje med disken og et man selv kan køre, hvis man ønsker information her og nu.
Her er et output fra min Windows XP:
C:\Program Files\smartmontools\bin>smartctl.exe -a /dev/scsi00
smartctl version 5.36 [i686-mingw32-xp-sp2] Copyright (C) 2002-6 Bruce Allen
Home page is http://smartmontools.sourceforge.net/
Device: QUANTUM ATLAS_V_18_WLS Version: 0230
Serial number: 141014450327
Device type: disk
Local Time is: Wed May 31 22:09:55 2006 RST
Device supports SMART and is Enabled
Temperature Warning Enabled
SMART Health Status: OK
Current Drive Temperature: 39 C
Drive Trip Temperature: 90 C
Elements in grown defect list: 0
Error counter log:
Errors Corrected by Total Correction Gigabytes Total
ECC rereads/ errors algorithm processed uncorrected
fast | delayed rewrites corrected invocations [10^9 bytes] errors
read: 274 0 0 0 0 2.823 0
write: 0 0 0 0 0 2.308 0
Non-medium error count: 8
Last n error events log page
SMART Self-test log
Num Test Status segment LifeTime LBA_first_err [SK ASC ASQ]
Description number (hours)
# 1 Background long Completed - 9277 - [- - -]
# 2 Background short Completed - 9276 - [- - -]
Long (extended) Self Test duration: 2048 seconds [34.1 minutes]
Det ses blandt andet, at min disk er 39°C varm, den har lavet 274 fejl og været tændt i 9277 timer (det er godt 386 døgn). I dens foreløbige levetid har den læst 2,8 terrabytes og skrevet 2,3 terrabytes! Det svarer til, at alle 18 gigabytes på disken er skrevet og læst mellem 125 og 156 gange! Alt i alt må disken siges at være i god stand og have ydet en pletfri indsats!
Hvorfor sørger Microsoft og Quantum (opkøbt af Maxtor, der nu er opkøbt af Seagate) ikke for, at vi helt rutinemæssigt får helbredsinformationer fra disken, når den får det dårligt? Det er ikke så svært og det kunne spare os forbrugere for megen ærgelse!
[1] SCSI-diske fik angiveligt S.M.A.R.T. med SCSI-3 standarden i 1992.
Se også her: http://www.distorted.dk/blog/?p=336
Jeg er godt klar over, at der findes diagnoseværktøjer fra de forskellige leverandører, men der er ikke noget der kører i baggrunden og kan advare dig i god (eller rimelig) tid. Det er programmer man henter, når man får mistanke om et problem – og så er det oftest forsent 😕
Men det er en fin liste, hvis man står og mangler diagnoseværktøj – det må jeg gi’ dig :-).