2011/7/28 Walery Studennikov <[email protected]>:
> Hi.
>
> Посоветуйте модуль для определения поисковых систем по user_agent.
>
> HTTP::BrowserDetect не знает Яндекса.
> Чего-то ещё вменяемого на CPAN не нашёл.

Самый обновляемый и самый вменяемый, если игнорировать методы типа
safari, mozilla и прочие, а использовать browser_string.

Добавить? Код конечно в нем наивный и нет простой возможности
расширять, но модуль-то полезный и можно потратить немного времени и
сделать его вкуснее.

http://devaka.ru/articles/list-of-search-bots - список с нашими ботами
http://www.info-highsol.ru/seo_spider.php - еще список
и таких списков много

> Думал выдрать код определения SE из awstats (там хорошая база по
> роботам), но код там просто жесть ;)

Может базу оттуда выдрать?

> Что посоветуете?

Написать наконец-то что-то гибкое, простое и расширяемое своими
исключениями. Выложить на CPAN :)

По мне так все эти модули с accessor'ами для проверки того или иного
свойства просто жуть :(

> Может кто, например, поделиться  доморощенными модулями?
>
> --
> Walery Studennikov
> CTO of Domain Name Registrar REG.RU
> http://www.reg.ru/
> +7 495 580-11-11 int. 501
> --
> Moscow.pm mailing list
> [email protected] | http://moscow.pm.org
>



-- 
Best regards, Ruslan.
-- 
Moscow.pm mailing list
[email protected] | http://moscow.pm.org

Ответить