Re: 404'th http error checker
On Tuesday 22 March 2011, Иван Лох wrote: On Tue, Mar 22, 2011 at 02:56:17AM +0200, Alex Fomenko wrote: Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. Хм, а можно узнать где тут говорилось про сервер. Или Вам просто поговорить? И Тут не про сервер. Тут про идиотов. Ну ОК. Вам виднее про идиотов рассуждать. -- With best regards, Alex.
404'th http error checker
Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321124639.4191b4ba@host19
Re: 404'th http error checker
On Mon, Mar 21, 2011 at 12:46:39PM +0300, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? webcheck linkchecker apt-cache search broken link -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321113116.ga3...@nano.ioffe.rssi.ru
Re: 404'th http error checker
В Mon, 21 Mar 2011 14:31:16 +0300 Иван Лох l...@1917.com пишет: Спасибо. webcheck простой, пробовал, в целом устраивает linkchecker много настроек, не пробовал. В обоих есть одно неудобство - не предоставляют возможность менять User-Agent, а у меня в .htaccess много ботов блокируются, в том числе и эти. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321162116.1b6b81f0@host19
Re: 404'th http error checker
On Mon, Mar 21, 2011 at 04:21:16PM +0300, Andrey Nikitin wrote: В Mon, 21 Mar 2011 14:31:16 +0300 Иван Лох l...@1917.com пишет: Спасибо. webcheck простой, пробовал, в целом устраивает linkchecker много настроек, не пробовал. В обоих есть одно неудобство - не предоставляют возможность менять User-Agent, а у меня в .htaccess много ботов блокируются, в том числе и эти. А если серьезно, то надо парсить error.log Просто потому, что грабли надо убирать там, где по ним ходят, а не там где они лежат. +javascript -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321151138.gb3...@nano.ioffe.rssi.ru
Re: 404'th http error checker
On Mon, Mar 21, 2011 at 12:46:39PM +0300, Andrey Nikitin wrote: Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Был LinkChecker, например. -- WBR, Michael Shigorin m...@altlinux.ru -- Linux.Kiev http://www.linux.kiev.ua/ -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321145449.ga6...@osdn.org.ua
Re: 404'th http error checker
21.03.2011 18:11, Иван Лох пишет: Просто потому, что грабли надо убирать там, где по ним ходят, а не там где они лежат. Это зависит от того, в чём состоит задача: чтобы граблей не было вообще или чтобы число сработавших граблей было не выше какого-то заданного уровня. +javascript Помимо этого ещё могут быть потенциальные ошибки на динамических сайтах, например, в закрытой через авторизацию зоне. Когда 404-ая ошибка может возникать при каком-то конкретном запросе (поисковом?) или у какой-то конкретной учётной записи, после прохождения авторизации. Скрипт-обходчик (паук) такого, понятное дело, может и не найти. -- Dmitri Samsonov -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/4d876d67.60...@gmail.com
Re: 404'th http error checker
On Mon, Mar 21, 2011 at 06:23:19PM +0300, Dmitry Samsonov wrote: 21.03.2011 18:11, Иван Лох пишет: Просто потому, что грабли надо убирать там, где по ним ходят, а не там где они лежат. Это зависит от того, в чём состоит задача: чтобы граблей не было вообще или чтобы число сработавших граблей было не выше какого-то заданного уровня. +javascript Помимо этого ещё могут быть потенциальные ошибки на динамических сайтах, например, в закрытой через авторизацию зоне. Когда 404-ая ошибка может возникать при каком-то конкретном запросе (поисковом?) или у какой-то конкретной учётной записи, после прохождения авторизации. Скрипт-обходчик (паук) такого, понятное дело, может и не найти. Я даже больше скажу. Если файлы лежат в виде http://xxx.x/films/dwjkdwjkdw.ogv то http://xxx.x/films/ по-хорошему, не должен давать 404, даже если на него нет ссылок. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321154326.gc3...@nano.ioffe.rssi.ru
Re: 404'th http error checker
On Monday 21 March 2011, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет также логинится на сайт, используя POST запрос, который можно настроить ручками. -- With best regards, Alex.
Re: 404'th http error checker
On Tue, Mar 22, 2011 at 12:32:36AM +0200, Alex Fomenko wrote: On Monday 21 March 2011, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321230420.ga15...@nano.ioffe.rssi.ru
Re: 404'th http error checker
On Tue, Mar 22, 2011 at 02:04:20AM +0300, Иван Лох wrote: On Tue, Mar 22, 2011 at 12:32:36AM +0200, Alex Fomenko wrote: On Monday 21 March 2011, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. % apt-cache search kfind kfind - file search utility -- Stanislav -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110321230911.GA12825@kaiba.homelan
Re: 404'th http error checker
22 марта 2011 г. 2:09 пользователь Stanislav Maslovski stanislav.maslov...@gmail.com написал: On Tue, Mar 22, 2011 at 02:04:20AM +0300, Иван Лох wrote: On Tue, Mar 22, 2011 at 12:32:36AM +0200, Alex Fomenko wrote: On Monday 21 March 2011, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. % apt-cache search kfind kfind - file search utility пойду выпью яду
Re: 404'th http error checker
On Tuesday 22 March 2011, Иван Лох wrote: On Tue, Mar 22, 2011 at 12:32:36AM +0200, Alex Fomenko wrote: On Monday 21 March 2011, Andrey Nikitin wrote: Привет. Есть готовое решение по рекурсивному обходу сайта с текстовым выхлопом в виде списка битых ссылок и страниц, где они (битые ссылки) размещены? Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. Хм, а можно узнать где тут говорилось про сервер. Или Вам просто поговорить? И покивать на всякие графические тулзы? -- With best regards, Alex.
Re: 404'th http error checker
On Tue, Mar 22, 2011 at 02:56:17AM +0200, Alex Fomenko wrote: Использую KLinkStatus. Тулза графическая и под KDE. Настроек куча. Позволяет Куда же, блядь, на сервере без KDE. Больший идиотизм, только чекать сайт с удаленного компьютера. У этих идиотов наверняка и kfind есть. Файлы искать. С кучей опций. Хм, а можно узнать где тут говорилось про сервер. Или Вам просто поговорить? И Тут не про сервер. Тут про идиотов. -- To UNSUBSCRIBE, email to debian-russian-requ...@lists.debian.org with a subject of unsubscribe. Trouble? Contact listmas...@lists.debian.org Archive: http://lists.debian.org/20110322012129.gb15...@nano.ioffe.rssi.ru