2011/7/28 Walery Studennikov <[email protected]>: > Hi. > > Посоветуйте модуль для определения поисковых систем по user_agent. > > HTTP::BrowserDetect не знает Яндекса. > Чего-то ещё вменяемого на CPAN не нашёл.
Самый обновляемый и самый вменяемый, если игнорировать методы типа safari, mozilla и прочие, а использовать browser_string. Добавить? Код конечно в нем наивный и нет простой возможности расширять, но модуль-то полезный и можно потратить немного времени и сделать его вкуснее. http://devaka.ru/articles/list-of-search-bots - список с нашими ботами http://www.info-highsol.ru/seo_spider.php - еще список и таких списков много > Думал выдрать код определения SE из awstats (там хорошая база по > роботам), но код там просто жесть ;) Может базу оттуда выдрать? > Что посоветуете? Написать наконец-то что-то гибкое, простое и расширяемое своими исключениями. Выложить на CPAN :) По мне так все эти модули с accessor'ами для проверки того или иного свойства просто жуть :( > Может кто, например, поделиться доморощенными модулями? > > -- > Walery Studennikov > CTO of Domain Name Registrar REG.RU > http://www.reg.ru/ > +7 495 580-11-11 int. 501 > -- > Moscow.pm mailing list > [email protected] | http://moscow.pm.org > -- Best regards, Ruslan. -- Moscow.pm mailing list [email protected] | http://moscow.pm.org
