Re: Ошибки с dma
На Sun, 15 Feb 2009 15:42:05 +0300 Andrey Melnikoff записано: > Alexander GQ Gerasiov wrote: > > На Sun, 15 Feb 2009 09:55:06 +0300 > > Mishustin Alexey записано: > > > > Как я понял, диск пока живой, но показатель Seek_Error_Rate уже > > > низковат; по-хорошему, скоро уже нужно будет его менять, да? > > Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно > > посмотреть на количество reallocated секторов. > Relocated,Pending и Off_unc все в 0 - где вы тут посыпавшийся диск > разглядели ? Действительно форматирование сломало таблицу, 36 - это treshold, а не значение. Тогда и вправду больше похоже на плохой шлейф или шум от соседнего устройства. -- Best regards, Alexander GQ Gerasiov Contacts: e-mail:g...@cs.msu.su Jabber: g...@jabber.ru Homepage: http://gq.net.ru ICQ: 7272757 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D 79B8 0641 D82A E3E3 CE1D -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Re: Ошибки с dma
Alexander GQ Gerasiov wrote: > На Sun, 15 Feb 2009 09:55:06 +0300 > Mishustin Alexey записано: > > Как я понял, диск пока живой, но показатель Seek_Error_Rate уже > > низковат; по-хорошему, скоро уже нужно будет его менять, да? > Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно > посмотреть на количество reallocated секторов. Relocated,Pending и Off_unc все в 0 - где вы тут посыпавшийся диск разглядели ? -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Re: Ошибки с dma
На Sun, 15 Feb 2009 09:55:06 +0300 Mishustin Alexey записано: > Как я понял, диск пока живой, но показатель Seek_Error_Rate уже > низковат; по-хорошему, скоро уже нужно будет его менять, да? Я бы сказал диск уже сыпется и сыпется весьма активно. Достаточно посмотреть на количество reallocated секторов. В таком виде диск можно использовать только для файлопомойки или в зеркале (что всё равно не особо осмысленно). -- Best regards, Alexander GQ Gerasiov Contacts: e-mail:g...@cs.msu.su Jabber: g...@jabber.ru Homepage: http://gq.net.ru ICQ: 7272757 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D 79B8 0641 D82A E3E3 CE1D -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Re: Ошибки с dma
Feb 14 22:34:12 localhost kernel: [ 20.455089] hdc: DMA disabled Feb 14 22:34:12 localhost kernel: [ 20.455089] hdd: UDMA/66 mode selected Судя по логам, у тебя /dev/hdc (мастер вторичного контроллера) -- это привод CD, и он по какой-то причине не хочет работать в UDMA-режиме. При этом для /dev/hdd (slave) ядро хочет включить UDMA, но у него это плохо получается. CD-привод, висящий перед заведомо более быстрым жестким диском -- это паталогия. 1) Нужно перевесить хард на другой контроллер, желательно мастером. Если такой возможности нет, то хотя бы поменять их местами, чтобы хард стал мастером, а CD -- slave. Перед этим, естественно, надо исправить путь к ядру в конфиге загрузчика. 2) Стоит проверить, включен ли в биосе режим DMA у соответствующих устройств. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Re: Ошибки с dma
Большое спасибо всем ответившим. С сокращениями, smartctl -a сказал следующее: Model Family: Seagate Barracuda 7200.8 family SMART overall-health self-assessment test result: PASSED ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 066 055 006Pre-fail Always - 148062014 3 Spin_Up_Time0x0003 097 097 000Pre-fail Always - 0 4 Start_Stop_Count0x0032 100 100 020Old_age Always - 940 5 Reallocated_Sector_Ct 0x0033 100 100 036Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 085 060 030Pre-fail Always - 339600555 9 Power_On_Hours 0x0032 095 095 000Old_age Always - 5016 10 Spin_Retry_Count0x0013 100 100 097Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020Old_age Always - 967 194 Temperature_Celsius 0x0022 031 057 000Old_age Always - 31 (0 19 0 0) 195 Hardware_ECC_Recovered 0x001a 066 057 000Old_age Always - 154021133 197 Current_Pending_Sector 0x0012 100 100 000Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000Old_age Offline - 0 199 UDMA_CRC_Error_Count0x003e 200 196 000Old_age Always - 4 200 Multi_Zone_Error_Rate 0x 100 253 000Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000Old_age Always - 0 Как я понял, диск пока живой, но показатель Seek_Error_Rate уже низковат; по-хорошему, скоро уже нужно будет его менять, да? При сегодняшней загрузке ошибок dma в лог не падало. Я вот подумал: а могли вчерашние ошибки быть из-за того, что диск hdd висит на одном контроллере с cd-rom (hdc), и в него тогда при загрузке был засунут диск (естессно, незагрузочный)? -- С уважением, Алексей Мишустин
Re: Ошибки с dma
On Sun, Feb 15, 2009 at 12:34:28AM +0300, Mishustin Alexey wrote: > > По-быстрому как-то можно проверить, или нужно преварительно настраивать? > smartctl -s on /dev/sda smartctl --all /dev/sda (смотреть в первую очередь на атрибут Reallocated_Sector_Ct, должен быть 0. Расшифровка остальных гуглится в инете). Быстрый self-test: smartctl --test short /dev/sda (подождать 2 минуты) smartctl -l selftest /dev/sda -- WBR, Dmitry signature.asc Description: Digital signature
Re: Ошибки с dma
На Sun, 15 Feb 2009 00:34:28 +0300 Mishustin Alexey записано: > В Сбт, 14/02/2009 в 22:26 +0200, Rodion Brodetsky пишет: > > Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал: > > > Диск уже довольно старый (года 4). Срочно бэкапить?? Или > > > попробовать сначала шлейф заменить? Или в чем-то другом может > > > быть дело? Гугль каких только советов не выдает... > > Бэкап никогда не помешает. А что говорит SMART ? > > Еще ни разу не пользовался SMART'ом... Сейчас установил smartmontools > и smart-notifier; у первого man - целая книга, с ходу не разобрался, а > второй не хочет запускаться, пишет в терминале > "smart_notifier/gui.py:51: DeprecationWarning: Passing the > named_service parameter to add_signal_receiver by name is deprecated: > please use positional parameters". > > По-быстрому как-то можно проверить, или нужно преварительно > настраивать? Поищи в гугле неплоха статейка была в "Записках дебианщика" mydebianblog.blogspot.com -- Best regards, Alexander GQ Gerasiov Contacts: e-mail:g...@cs.msu.su Jabber: g...@jabber.ru Homepage: http://gq.net.ru ICQ: 7272757 PGP fingerprint: 0628 ACC7 291A D4AA 6D7D 79B8 0641 D82A E3E3 CE1D -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Re: Ошибки с dma
В Сбт, 14/02/2009 в 22:26 +0200, Rodion Brodetsky пишет: > Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал: > > Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать > > сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких > > только советов не выдает... > Бэкап никогда не помешает. А что говорит SMART ? Еще ни разу не пользовался SMART'ом... Сейчас установил smartmontools и smart-notifier; у первого man - целая книга, с ходу не разобрался, а второй не хочет запускаться, пишет в терминале "smart_notifier/gui.py:51: DeprecationWarning: Passing the named_service parameter to add_signal_receiver by name is deprecated: please use positional parameters". По-быстрому как-то можно проверить, или нужно преварительно настраивать? -- С уважением, Алексей Мишустин
Re: Ошибки с dma
Sat, Feb 14, 2009 at 11:08:13PM +0300, Mishustin Alexey написал: > Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать > сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких > только советов не выдает... Бэкап никогда не помешает. А что говорит SMART ? -- GCS d- s+: a-- C UL P+ L+++ E W+ N+ o K w--- O M V- PS+++ PE++ Y+ PGP t+ 5 X++ R- tv- b++ DI-- D++ G e++ h++ r-- y* XMPP: s7an...@jabber.org -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of "unsubscribe". Trouble? Contact listmas...@lists.debian.org
Ошибки с dma
Доброго времени суток! При проверке одного из жестких дисков fsck'ом при старте системы меня порадовали вот такие сообщения: Feb 14 22:34:12 localhost kernel: [ 19.198491] hdd: dma_intr: status=0x51 { Dr iveReady SeekComplete Error } Feb 14 22:34:12 localhost kernel: [ 19.198491] hdd: dma_intr: error=0x84 { Dri veStatusError BadCRC } Feb 14 22:34:12 localhost kernel: [ 19.198491] ide: failed opcode was: unknown Feb 14 22:34:12 localhost kernel: [ 19.614583] hdd: dma_intr: status=0x51 { Dr iveReady SeekComplete Error } Feb 14 22:34:12 localhost kernel: [ 19.614583] hdd: dma_intr: error=0x84 { Dri veStatusError BadCRC } Feb 14 22:34:12 localhost kernel: [ 19.614583] ide: failed opcode was: unknown Feb 14 22:34:12 localhost kernel: [ 20.030675] hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error } Feb 14 22:34:12 localhost kernel: [ 20.030675] hdd: dma_intr: error=0x84 { DriveStatusError BadCRC } Feb 14 22:34:12 localhost kernel: [ 20.030675] ide: failed opcode was: unknown Feb 14 22:34:12 localhost kernel: [ 20.455089] hdd: dma_intr: status=0x51 { DriveReady SeekComplete Error } Feb 14 22:34:12 localhost kernel: [ 20.455089] hdd: dma_intr: error=0x84 { DriveStatusError BadCRC } Feb 14 22:34:12 localhost kernel: [ 20.455089] ide: failed opcode was: unknown Feb 14 22:34:12 localhost kernel: [ 20.455089] hdc: DMA disabled Feb 14 22:34:12 localhost kernel: [ 20.455089] hdd: UDMA/66 mode selected Feb 14 22:34:12 localhost kernel: [ 20.548014] ide1: reset: success Потом fsck успешно выполнил проверку hdd, ни на что больше не выругавшись. Результат выполнения # hdparm -vi /dev/hdd : /dev/hdd: multcount = 0 (off) IO_support= 0 (default) unmaskirq = 1 (on) using_dma = 1 (on) keepsettings = 0 (off) readonly = 0 (off) readahead = 256 (on) geometry = 36481/255/63, sectors = 586072368, start = 0 Model=ST3300831A, FwRev=3.06, SerialNo=4NF18J06 Config={ HardSect NotMFM HdSw>15uSec Fixed DTR>10Mbs RotSpdTol>.5% } RawCHS=16383/16/63, TrkSize=0, SectSize=0, ECCbytes=4 BuffType=unknown, BuffSize=8192kB, MaxMultSect=16, MultSect=off CurCHS=16383/16/63, CurSects=16514064, LBA=yes, LBAsects=586072368 IORDY=on/off, tPIO={min:240,w/IORDY:120}, tDMA={min:120,rec:120} PIO modes: pio0 pio1 pio2 pio3 pio4 DMA modes: mdma0 mdma1 mdma2 UDMA modes: udma0 udma1 udma2 udma3 *udma4 udma5 AdvancedPM=no WriteCache=enabled Drive conforms to: Unspecified: ATA/ATAPI-1,2,3,4,5,6,7 * signifies the current active mode Диск уже довольно старый (года 4). Срочно бэкапить?? Или попробовать сначала шлейф заменить? Или в чем-то другом может быть дело? Гугль каких только советов не выдает... -- С уважением, Алексей Мишустин