Добрый день
На данный момент располагаем двумя фронтендами к серверам
виртуального хостинга. Роль фронтендов играет oops 1.5.24
в режиме акселератора, сервера SunFire E220 и E280. На
бэкэндах используется xinetd и apache 1.3.x
Один клиент обратился с жалобой на недоступность его сайта
в течении 10-15 минут. Начал разбираться с проблемой и
слегка ужаснулся...
Действительно в access логе был сплошной промежуток в 15
минут, когда все запросы на данный сайт имели статус
TCP_ERROR/555 и TCP_MISS/555. Что интересно, в этом же
промежутке времени остальной контент других сайтов
упсом корректно возвращался, хотя все идут на один бэкэнд и
на один же xinetd.
Ничего конкретного в архиве рассылки о сообщениях с кодом
555 нет, хотя один человек утверждал, что такие сообщения
oops возвращает не дожидаясь ответа бэкэнда.
Если вести разбор по конкретным записям, то, к примеру, в
access логе oops есть запись
1159874868.000 300005 192.130.20.xxx TCP_ERROR/555 0 GET
http://www.yyy.ru/images/zzz.jpeg - DIRECT/www.yyy.ru text/html
Этот же запрос в логе apache
192.130.20.xxx - - [03/Oct/2006:15:27:55 +0400] "GET
/images/zzz.jpeg HTTP/1.1" 304 - "-" "Mozilla/4.0 (compatible;)"
В это же время в oops.log пачками валятся записи
Tue Oct 3 15:27:36 2006 [ab68dd]fill_mem_obj(): select: timed out.
Tue Oct 3 15:27:38 2006 [ab68f7]fill_mem_obj(): select: timed out.
Tue Oct 3 15:27:48 2006 [ab6a46]fill_mem_obj(): select: timed out.
Tue Oct 3 15:27:49 2006 [ab6a67]fill_mem_obj(): select: timed out.
Tue Oct 3 15:27:52 2006 [ab6aa1]check_validity(): select: timed out
on new_obj.
Tue Oct 3 15:27:52 2006 [ab6aaa]check_validity(): select: timed out
on new_obj .
Tue Oct 3 15:28:00 2006 [ab6bec]fill_mem_obj(): select: timed out.
Tue Oct 3 15:28:03 2006 [ab6c69]fill_mem_obj(): select: timed out.
До клиентского веб-сервера все запросы доходят, однако это
не мешает упсу выдавать по непонятной причине ошибки 555.
Есть достаточное количество аналогичных проблем (стоит
поискать в архиве по "fill_mem_obj" или "TCP_ERROR/555"),
но решения проблемы нет.
Файл oops.cnf
nameserver xxx.xxx.xxx.xxx
nameserver yyy.yyy.yyy.yyy
http_port 0
icp_port 0
userid oops
logfile /usr/local/oops/logs/oops.log { 5 10m } unbuffered
accesslog /usr/local/oops/logs/access.log { 50 200m } unbuffered
pidfile /usr/local/oops/logs/oops.pid
statistics /usr/local/oops/logs/oops_statfile
mem_max 512m
lo_mark 256m
default-expire-value 5
ftp-expire-value 5
max-expire-value 30
last-modified-factor 5
dont_cache_without_last_modified
default-expire-interval 2
disk-low-free 3
disk-ok-free 5
force_http11
always_check_freshness
force_completion 90
maxresident 4m
insert_x_forwarded_for yes
insert_via yes
fetch_with_client_speed no
connect-from zzz.zzz.zzz.zzz
acl MSIE header_substr user-agent MSIE
acl PURGE method PURGE
acl_deny PURGE
stop_cache ?
stop_cache cgi-bin
group world {
networks 0/0;
badports [0:79],110,138,139,513,[6000:6010];
redir_mods accel;
per_ip_conn 256;
http {
deny dstdomain * ;
}
icp {
deny dstdomain * ;
}
}
module lang {
default_charset koi8-r
CharsetRecodeTable windows-1251
/usr/local/oops/tables/koi-win.tab
CharsetRecodeTable ISO-8859-5 /usr/local/oops/tables/koi-iso.tab
CharsetRecodeTable ibm866 /usr/local/oops/tables/koi-alt.tab
CharsetAgent windows-1251 AIR_Mosaic IWENG/1 MSIE WinMosaic
(Windows (WinNT; CharsetAgent windows-1251 (Win16; (Win95; (Win98; (16-bit)
Opera/3.0 CharsetAgent ibm866 DosLynx Lynx2/OS/2
}
module oopsctl {
socket_path /usr/local/oops/logs/oopsctl
html_refresh 300
}
module vary {
user-agent by_charset
accept-charset ignore
}
module accel {
myport 80
proxy_requests deny
file /usr/local/oops/accel_maps
}
--
Vladimir Osintsev
Senior Engineer
Golden Telecom Hosting Group
=====================================================================
If you would like to unsubscribe from this list send message to
[EMAIL PROTECTED] with "unsubscribe oops" in message body.
Archive is accessible on http://lists.paco.net/oops-rus/