Re: Ошибки с dma

2009-02-15 Пенетрантность Alexander GQ Gerasiov
На Sun, 15 Feb 2009 09:55:06 +0300
Mishustin Alexey shum...@shumkar.ru записано:

 Как я понял, диск пока живой, но показатель Seek_Error_Rate уже
 низковат; по-хорошему, скоро уже нужно будет его менять, да?
Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно
посмотреть на количество reallocated секторов.
В таком виде диск можно использовать только для файлопомойки или в
зеркале (что всё равно не особо осмысленно).


-- 
Best regards,
 Alexander GQ Gerasiov

 Contacts:
 e-mail:g...@cs.msu.su Jabber:  g...@jabber.ru
 Homepage:  http://gq.net.ru ICQ: 7272757
 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D  79B8 0641 D82A E3E3 CE1D


--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: Ошибки с dma

2009-02-15 Пенетрантность Andrey Melnikoff
Alexander GQ Gerasiov g...@cs.msu.su wrote:
 На Sun, 15 Feb 2009 09:55:06 +0300
 Mishustin Alexey shum...@shumkar.ru записано:

  Как я понял, диск пока живой, но показатель Seek_Error_Rate уже
  низковат; по-хорошему, скоро уже нужно будет его менять, да?
 Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно
 посмотреть на количество reallocated секторов.
Relocated,Pending и Off_unc все в 0 - где вы тут посыпавшийся диск
разглядели ?


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: Ошибки с dma

2009-02-15 Пенетрантность Alexander GQ Gerasiov
На Sun, 15 Feb 2009 15:42:05 +0300
Andrey Melnikoff temnota+n...@kmv.ru записано:

 Alexander GQ Gerasiov g...@cs.msu.su wrote:
  На Sun, 15 Feb 2009 09:55:06 +0300
  Mishustin Alexey shum...@shumkar.ru записано:
 
   Как я понял, диск пока живой, но показатель Seek_Error_Rate уже
   низковат; по-хорошему, скоро уже нужно будет его менять, да?
  Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно
  посмотреть на количество reallocated секторов.
 Relocated,Pending и Off_unc все в 0 - где вы тут посыпавшийся диск
 разглядели ?

Действительно форматирование сломало таблицу, 36 - это treshold, а не
значение. Тогда и вправду больше похоже на плохой шлейф или шум от
соседнего устройства.

-- 
Best regards,
 Alexander GQ Gerasiov

 Contacts:
 e-mail:g...@cs.msu.su Jabber:  g...@jabber.ru
 Homepage:  http://gq.net.ru ICQ: 7272757
 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D  79B8 0641 D82A E3E3 CE1D


--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Ошибки с dma

2009-02-14 Пенетрантность Mishustin Alexey
Доброго времени суток!

При проверке одного из жестких дисков fsck'ом при старте системы меня
порадовали вот такие сообщения:

Feb 14 22:34:12 localhost kernel: [   19.198491] hdd: dma_intr:
status=0x51 { Dr
iveReady SeekComplete Error }
Feb 14 22:34:12 localhost kernel: [   19.198491] hdd: dma_intr:
error=0x84 { Dri
veStatusError BadCRC }
Feb 14 22:34:12 localhost kernel: [   19.198491] ide: failed opcode was:
unknown
Feb 14 22:34:12 localhost kernel: [   19.614583] hdd: dma_intr:
status=0x51 { Dr
iveReady SeekComplete Error }
Feb 14 22:34:12 localhost kernel: [   19.614583] hdd: dma_intr:
error=0x84 { Dri
veStatusError BadCRC }
Feb 14 22:34:12 localhost kernel: [   19.614583] ide: failed opcode was:
unknown
Feb 14 22:34:12 localhost kernel: [   20.030675] hdd: dma_intr:
status=0x51 { DriveReady SeekComplete Error }
Feb 14 22:34:12 localhost kernel: [   20.030675] hdd: dma_intr:
error=0x84 { DriveStatusError BadCRC }
Feb 14 22:34:12 localhost kernel: [   20.030675] ide: failed opcode was:
unknown
Feb 14 22:34:12 localhost kernel: [   20.455089] hdd: dma_intr:
status=0x51 { DriveReady SeekComplete Error }
Feb 14 22:34:12 localhost kernel: [   20.455089] hdd: dma_intr:
error=0x84 { DriveStatusError BadCRC }
Feb 14 22:34:12 localhost kernel: [   20.455089] ide: failed opcode was:
unknown
Feb 14 22:34:12 localhost kernel: [   20.455089] hdc: DMA disabled
Feb 14 22:34:12 localhost kernel: [   20.455089] hdd: UDMA/66 mode
selected
Feb 14 22:34:12 localhost kernel: [   20.548014] ide1: reset: success

Потом fsck успешно выполнил проверку hdd, ни на что больше не
выругавшись.

Результат выполнения # hdparm -vi /dev/hdd :

/dev/hdd:
 multcount =  0 (off)
 IO_support=  0 (default) 
 unmaskirq =  1 (on)
 using_dma =  1 (on)
 keepsettings  =  0 (off)
 readonly  =  0 (off)
 readahead = 256 (on)
 geometry  = 36481/255/63, sectors = 586072368, start = 0

 Model=ST3300831A, FwRev=3.06, SerialNo=4NF18J06
 Config={ HardSect NotMFM HdSw15uSec Fixed DTR10Mbs RotSpdTol.5% }
 RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4
 BuffType=unknown, BuffSize=8192kB, MaxMultSect=16, MultSect=off
 CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=586072368
 IORDY=on/off, tPIO={min:240,w/IORDY:120}, tDMA={min:120,rec:120}
 PIO modes:  pio0 pio1 pio2 pio3 pio4 
 DMA modes:  mdma0 mdma1 mdma2 
 UDMA modes: udma0 udma1 udma2 udma3 *udma4 udma5 
 AdvancedPM=no WriteCache=enabled
 Drive conforms to: Unspecified:  ATA/ATAPI-1,2,3,4,5,6,7

 * signifies the current active mode

Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать
сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких
только советов не выдает...

-- 
С уважением,
Алексей Мишустин


Re: Ошибки с dma

2009-02-14 Пенетрантность Rodion Brodetsky
Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал:
 Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать
 сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких
 только советов не выдает...
Бэкап никогда не помешает. А что говорит SMART ?

-- 
GCS d- s+: a-- C UL P+ L+++ E W+ N+ o K w---
O M V- PS+++ PE++ Y+ PGP t+ 5 X++ R- tv- b++ DI-- D++
G e++ h++ r-- y* 

XMPP: s7an...@jabber.org


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: Ошибки с dma

2009-02-14 Пенетрантность Mishustin Alexey
В Сбт, 14/02/2009 в 22:26 +0200, Rodion Brodetsky пишет:
 Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал:
  Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать
  сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких
  только советов не выдает...
 Бэкап никогда не помешает. А что говорит SMART ?

Еще ни разу не пользовался SMART'ом... Сейчас установил smartmontools и
smart-notifier; у первого man - целая книга, с ходу не разобрался, а
второй не хочет запускаться, пишет в терминале
smart_notifier/gui.py:51: DeprecationWarning: Passing the named_service
parameter to add_signal_receiver by name is deprecated: please use
positional parameters. 

По-быстрому как-то можно проверить, или нужно преварительно настраивать?

-- 
С уважением,
Алексей Мишустин


Re: Ошибки с dma

2009-02-14 Пенетрантность Alexander GQ Gerasiov
На Sun, 15 Feb 2009 00:34:28 +0300
Mishustin Alexey shum...@shumkar.ru записано:

 В Сбт, 14/02/2009 в 22:26 +0200, Rodion Brodetsky пишет:
  Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал:
   Диск уже довольно старый (года 4). Срочно бэкапить?? Или
   попробовать сначала шлейф заменить? Или в чем-то другом может
   быть дело? Гугль каких только советов не выдает...
  Бэкап никогда не помешает. А что говорит SMART ?
 
 Еще ни разу не пользовался SMART'ом... Сейчас установил smartmontools
 и smart-notifier; у первого man - целая книга, с ходу не разобрался, а
 второй не хочет запускаться, пишет в терминале
 smart_notifier/gui.py:51: DeprecationWarning: Passing the
 named_service parameter to add_signal_receiver by name is deprecated:
 please use positional parameters. 
 
 По-быстрому как-то можно проверить, или нужно преварительно
 настраивать?
Поищи в гугле неплоха статейка была в Записках дебианщика
mydebianblog.blogspot.com

-- 
Best regards,
 Alexander GQ Gerasiov

 Contacts:
 e-mail:g...@cs.msu.su Jabber:  g...@jabber.ru
 Homepage:  http://gq.net.ru ICQ: 7272757
 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D  79B8 0641 D82A E3E3 CE1D


--
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org



Re: Ошибки с dma

2009-02-14 Пенетрантность Dmitry Nezhevenko
On Sun, Feb 15, 2009 at 12:34:28AM +0300, Mishustin Alexey wrote:
 
 По-быстрому как-то можно проверить, или нужно преварительно настраивать?
 

smartctl -s on /dev/sda
smartctl --all /dev/sda

(смотреть в первую очередь на атрибут Reallocated_Sector_Ct, должен быть
0. Расшифровка остальных гуглится в инете). 

Быстрый self-test:
smartctl --test short /dev/sda
(подождать 2 минуты)
smartctl -l selftest /dev/sda
 
-- 
WBR, Dmitry


signature.asc
Description: Digital signature


Re: Ошибки с dma

2009-02-14 Пенетрантность Mishustin Alexey
Большое спасибо всем ответившим.

С сокращениями, smartctl -a сказал следующее:

Model Family: Seagate Barracuda 7200.8 family

SMART overall-health self-assessment test result: PASSED

ID# ATTRIBUTE_NAME  FLAG VALUE WORST THRESH TYPE
UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000f   066   055   006Pre-fail  Always
-   148062014
  3 Spin_Up_Time0x0003   097   097   000Pre-fail  Always
-   0
  4 Start_Stop_Count0x0032   100   100   020Old_age   Always
-   940
  5 Reallocated_Sector_Ct   0x0033   100   100   036Pre-fail  Always
-   0
  7 Seek_Error_Rate 0x000f   085   060   030Pre-fail  Always
-   339600555
  9 Power_On_Hours  0x0032   095   095   000Old_age   Always
-   5016
 10 Spin_Retry_Count0x0013   100   100   097Pre-fail  Always
-   0
 12 Power_Cycle_Count   0x0032   100   100   020Old_age   Always
-   967
194 Temperature_Celsius 0x0022   031   057   000Old_age   Always
-   31 (0 19 0 0)
195 Hardware_ECC_Recovered  0x001a   066   057   000Old_age   Always
-   154021133
197 Current_Pending_Sector  0x0012   100   100   000Old_age   Always
-   0
198 Offline_Uncorrectable   0x0010   100   100   000Old_age
Offline  -   0
199 UDMA_CRC_Error_Count0x003e   200   196   000Old_age   Always
-   4
200 Multi_Zone_Error_Rate   0x   100   253   000Old_age
Offline  -   0
202 TA_Increase_Count   0x0032   100   253   000Old_age   Always
-   0

Как я понял, диск пока живой, но показатель Seek_Error_Rate уже
низковат; по-хорошему, скоро уже нужно будет его менять, да?

При сегодняшней загрузке ошибок dma в лог не падало. Я вот подумал: а
могли вчерашние ошибки быть из-за того, что диск hdd висит на одном
контроллере с cd-rom (hdc), и в него тогда при загрузке был засунут диск
(естессно, незагрузочный)?

-- 
С уважением,
Алексей Мишустин


Re: Ошибки с dma

2009-02-14 Пенетрантность Stanislav Kruchinin
Feb 14 22:34:12 localhost kernel: [   20.455089] hdc: DMA disabled
Feb 14 22:34:12 localhost kernel: [   20.455089] hdd: UDMA/66 mode
selected

Судя по логам, у тебя /dev/hdc (мастер вторичного контроллера) -- это привод CD,
 и он по какой-то причине не хочет работать в UDMA-режиме. При этом для /dev/hdd
(slave) ядро хочет включить UDMA, но у него это плохо получается. CD-привод,
висящий перед заведомо более быстрым жестким диском -- это паталогия. 1) Нужно
перевесить хард на другой контроллер, желательно мастером. Если такой
возможности нет, то хотя бы поменять их местами, чтобы хард стал мастером, а CD
-- slave. Перед этим, естественно, надо исправить путь к ядру в конфиге
загрузчика. 2) Стоит проверить, включен ли в биосе режим DMA у соответствующих
устройств.


-- 
To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org
with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org