[dataparksearch] [Forum] Re: robots.txt:

2007-08-02 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: robots.txt: Allow/Disallow commands are looking in order of appearance, and only the first found applies. So Disallow *.cgi will still exclude *.cgi in this case. - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: robots.txt:

2007-08-02 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: robots.txt: Yes, absolutely right. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;topic_id=1185818418;page=2

[dataparksearch] [Forum] Re: No

2007-08-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Yelena Subject: Re: No yesterday the Server command worked whithout trailing slash(( today it doesn't work. I use Server command like Server file:///path/to/folder/ - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read

[dataparksearch] [Forum] Re: No

2007-08-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: No If you would like to limit indexing by the folder specified only, you need to specify the following Server command: Server path file:///path/to/folder/ Please run indexer with -v5 switch specified, this

[dataparksearch] [Forum] Re: Статистика по сайтам

2007-08-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Статистика по сайтам Каких-либо средств cбора статистики в dpsearch нет. Посчитать кол-во хостов можно следующим запросом: SELECT COUNT(*) FROM server WHERE command='S' AND parent != 0; Посчитать кол-во документов

[dataparksearch] [Forum] Re: не работает поиск

2007-08-08 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Vitaly Subject: Re: не работает поиск Думаю не помешает search.htm и если используется searchd, то searchd.conf. Ну и ставшее стандартным - после индексации indexer -THW делали? - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: не работает поиск

2007-08-08 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: не работает поиск Указаны ли одинаковые значения WrdFiles в indexer.conf и в search.htm ? Попробуйте в search.htm добавить команду LogLevel 5 она включит максимальный уровен вывода отладочной информации, и покажите

[dataparksearch] [Forum] Re: Непонятные результаты при поиске

2007-08-29 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Непонятные результаты при поиске Если выключить кэш поисковых запросов командой Cache no будет ли работать корректно ? Какая версия dpsearch используется вами ? - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: статистика по словам по сайту

2007-09-05 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: статистика по словам по сайту Для способов хранения cache, crc и crc-multi хранятся не сами лова, а их контрольные суммы. Кроме этого, статистика частот слов при индексировании не собирается и тем самым нигде не

[dataparksearch] [Forum] Re: 2 программы на сайте

2007-09-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: 2 программы на сайте Можно поставить. А можно и не ставить, а создать вторую конфигурацию, для indexer можно передавать файл конфигурации, отличный от дефолтного, в качестве параметра: ./indexer

[dataparksearch] [Forum] Re: Непонятные результаты при поиске

2007-09-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ruler Subject: Re: Непонятные результаты при поиске Максим, извини за беспокойство, но есть ли идеи по данному вопросу? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Непонятные результаты при поиске

2007-09-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Непонятные результаты при поиске Попробуйте dbmode=cache, или вам нужен именно multi ? Еще можно попробоватьпоследний снапшот версии 4.48 - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic

[dataparksearch] [Forum] Re: Обновление

2007-09-09 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Обновление Изменения на русском доступны по адресу: http://www.dataparksearch.org/ChangeLog.ru Всегда имеет смысл обновляться до последнего релиза, в вашем случае это 4.47 (вы используете один из его снапшотов,

[dataparksearch] [Forum] Re: Вывод части документа с подсвеченными результатами

2007-09-22 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: SkyRanger Subject: Re: Вывод части документа с подсвеченными результатами Спасибо настроил stored и searchd все работает, но как то странно, только если скопировать слово и вставить со страницы, если вводишь вручную ничего не находит

[dataparksearch] [Forum] Re: странный proc title у cached

2007-09-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Владимир Subject: Re: странный proc title у cached dpsearch-4.47 - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1190638123

[dataparksearch] [Forum] can't get search.cgi to work from browser

2007-09-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: saung Subject: can't get search.cgi to work from browser Hi, This is probably a stupid question but I couldn't figure out what was wrong. So I've compiled and installed everything and it seems to be fine. I grabbed the search.cgi

[dataparksearch] [Forum] Re: Wrong Search-Results

2007-09-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Wrong Search-Results Please explain what is wrong with search results, what are you expecting as correct results ? What dbmode you use ? Would you upgrade to the latest version of dpsearch released (it's 4.47) ? -

[dataparksearch] [Forum] Re: Поэтапное индексирование

2007-09-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ruler Subject: Re: Поэтапное индексирование Огромнейшее спасибо. А еще вопрос. Если я проиндексировал, к примеру, 1000 документов и при этом в базу на индексацию добавилось еще 5000. Они уже помечены на индексацию через Period? Т.е.

[dataparksearch] [Forum] Wrong Search-Results

2007-09-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Thomas Pajonk Subject: Wrong Search-Results Hi all, i´ve big trouble with dpsearch 4.45.1 on an opensuse 10.1 with mysql connection. I´ve indexed about 1.5 million url´s. using the search interface, the result are everything, but

[dataparksearch] [Forum] Re: Поэтапное индексирование

2007-09-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Поэтапное индексирование Новые документы добавляются в базу со временем очередной индексации, равным времени индексиования документа, гда найдена ссылка, которая добавляется в базу. Т.е. приповторном запуске

[dataparksearch] [Forum] Re: Detect clone algoritm

2007-09-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Владимир Subject: Re: Detect clone algoritm Клоны -- документы, имеющие одинаковые значения Hash32 вычисляемой по всем секциям документа. Копии одного и того же документа имеют одинаковые значения Hash32. Это позволяет не

[dataparksearch] [Forum] Re: can

2007-09-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: saung Subject: Re: can Wow I can't believe it was that simple. Thank you very very much! - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: How to Upgrade 4.45.1 to 4.47?

2007-09-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: How to Upgrade 4.45.1 to 4.47? The simplest way - setup new version over installed. It's compatible. But if you can make backup - make backup anyway. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the

[dataparksearch] [Forum] UTF-8 encoding problems

2007-10-08 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Marko Subject: UTF-8 encoding problems Hi! I am having problems with indexing some characters used in Slovenian language. I have pages in UTF-8. I am using MySQL support. čČ is decoded correctly šŠ and žŽ are not decoded correctly

[dataparksearch] [Forum] Re: lib error being seen in Apache logs

2007-10-22 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: lib error being seen in Apache logs Even if you have an SQL server on an another PC, you still require to have MySQL client library on PC where search.cgi is running. - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: indexing a very large number of urls

2007-10-24 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: indexing a very large number of urls DataparkSearch is able to index up to several million documents, depending on average document size and hardware used (this is for cache dbmode). I don't' know any provider with

[dataparksearch] [Forum] Re: Tag ServerWeight

2007-10-25 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: RageLT Subject: Re: Tag ServerWeight ./indexer -S Database statistics StatusExpired Total - 0 0 92 Not indexed yet 200 0 10 OK 302

[dataparksearch] [Forum] apache-module

2007-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: RageLT Subject: apache-module Установил dpsearch-4.49-26102007 с поддержкой mod_dpsearch. Всё работает прекрасно, за исключением одного, запрос с кириллицей не выдаёт никакого результата, хотя в базе данные точно есть, через

[dataparksearch] [Forum] Re: apache-module

2007-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: RageLT Subject: Re: apache-module At 11:34:23 26/10/07, RageLT wrote: apache_1.3.39 ./configure \ --enable-module=rewrite \ --disable-module=imap \ --disable-module=userdir \ --disable-module=autoindex \ --enable-module=so Конфиг по

[dataparksearch] [Forum] Re: apache-module

2007-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: apache-module Давайте проверим, правильно ли определяется кодировка документа при индексировании. Для этого переиндексируйте любой документ, который содержит слово портал таким образом: ./indexer -qamv4 -u _URL_

[dataparksearch] [Forum] Re: Ошибка конфигурирования

2007-10-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Ошибка конфигурирования Появился ли у вас файл install.options ? Если да, покажите его содержимое. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: не могу установить Datapark

2007-11-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: не могу установить Datapark вам нужно установить пэкаджи zlib и zlib-devel на вашу систему. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: не могу установить Datapark

2007-11-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: не могу установить Datapark По умолчанию перебираются несколько возможных вариантов и выбирается тот, где этот файл находится. попробуйте найти его командой find / -name mysql.h -print - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: не могу установить Datapark

2007-11-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Валентин Subject: Re: не могу установить Datapark эээ не знаю, видимо нет, ну а если установлен, то какую директорию в любом случае писать там, или ту что он по умолчанию предлогает - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: Ispell

2007-11-19 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Ispell К сожалению, такая возможность не предусмотрена. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Realm + Alias creates invalid SQL

2007-11-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Realm + Alias creates invalid SQL What version of DataparkSearch are you using ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Try also

2007-11-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Try also Нужно установить aspell и необходимые словари для него, после этого пересобрать dpsearch (как правило он сам его находит по умолчанию), в поисковом шаблоне командой Locale указать локаль, соответсвующую

[dataparksearch] [Forum] Re: Просьба ответить на массу вопросов

2007-11-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Валентин Subject: Re: Просьба ответить на массу вопросов а вот что мне выводит поисковик если + включить логи [EMAIL PROTECTED] dpsearch-4.48]# /usr/local/dpsearch/bin/search.cgi easy search.cgi[4010]: {00} search.cgi started with

[dataparksearch] [Forum] Re: WARNING: nonstandard use of \

2007-11-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: WARNING: nonstandard use of \ Yes, setting 'escape_string_warning' to off is a workaround solution. I'll update PgSQL stuff in a future release. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the

[dataparksearch] [Forum] Ошибка при установке

2007-11-29 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Ошибка при установке Добрый день! При установке получаю следующую ошибку: полный путь заменен на - path configure failed: -1 at /usr/home/path/111/install.pl line 176, STDIN line 33. полные параметры установки:

[dataparksearch] [Forum] Re: Просьба ответить на массу вопросов

2007-12-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Валентин Subject: Re: Просьба ответить на массу вопросов новый вопрос масса слов которые есть на странице почему то не ищутся, в чем дело , что делать? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Индексирование MediaWiki

2007-12-12 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Андрей Subject: Индексирование MediaWiki Здравствуйте, я хочу проиндексировать mediawiki, поможите кто чем может :-) 1) mediawiki для адресации использует не номера(индексы), а названия страниц, например:

[dataparksearch] [Forum] No 'Server' command for url

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: No 'Server' command for url Что делает indexer еще, кроме вывода сообщения No 'Server' command for url, когда он встречает такие условия? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic

[dataparksearch] [Forum] Re: segfault на 4.48

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: segfault на 4.48 Вчера тоже поймал segfault на dpsearch-4.48-mysql-freetds, правда, без core dump. Запускал просто как indexer -N 5. # uname -a Linux spider 2.6.17-gentoo-r4 #1 SMP Sat Aug 26 17:44:54 TJT 2006

[dataparksearch] [Forum] Странные записи в таблице server

2007-12-15 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Странные записи в таблице server Давно заметил, что в таблице server присутствуют странные записи, например, параметры из indexer.conf, такие как Disallow, а также неверно сформированные URL из индексируемых

[dataparksearch] [Forum] Re: Странные записи в таблице server

2007-12-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Странные записи в таблице server Да, это нормально. Фильтры тоже заносятся в таблицу server, а для неправильных URL (собственно как и для всех остальных URL) сохраняется имя сервера, т.к. по нему строится

[dataparksearch] [Forum] CrawlDelay

2007-12-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Sharon Subject: CrawlDelay My indexer.conf contains two sites: Realm Allow http://www.A.com/forum* Realm Allow http://www.B.com/* URL http://www.A.com/forums.php URL http://www.B.com/ I set at the end of indexer.conf CrawlDelay 10 I

[dataparksearch] [Forum] Re: segfault на 4.48

2007-12-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: segfault на 4.48 Сегодня поймал segfault сразу после тестового запуска: [pre]spider dpsearch # sbin/indexer -N 5 -r indexer[11166]: {00} indexer from dpsearch-4.48-mysql-freetds started with

[dataparksearch] [Forum] Re: No

2007-12-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: No Кстати, я заметил, что у меня появилось множество таких сообщений о том, что нет команды Server для каких-то URL. Это появилось только в версии 4.48, до этого данные URL нормально индексировались и попадали

[dataparksearch] [Forum] Re: No

2007-12-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: No [pre]spider dpsearch # sbin/indexer -qaimv5 -u http://www.varorud.org/ indexer.cfg[14726]: {00} URLDB: 8 records fetched indexer.cfg[14726]: {00} URLDB: http://www.1tv.tj/ indexer.cfg[14726]: {00} Allow by

[dataparksearch] [Forum] Re: No

2007-12-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: No Раскоментарьте, пожалуйста, #define DEBUG_MATCH 1 в заголовке src/match.c и пересоберите dpsearch, затем повторите команду sbin/indexer -qaimv5 -u http://www.varorud.org/ - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: Как проиндексировать две SQL таблицы

2007-12-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Андрей Subject: Re: Как проиндексировать две SQL таблицы А зачем path указывать явно, если он по умолчанию? path describes all documents which are under the same path with URL. Default value is path - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Unaccessible pages and documents

2007-12-19 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Marko Hrastovec Subject: Unaccessible pages and documents Hi! I have a question regarding searching different parts of web page. I have a site where not all pages are accessible to all users. We have groups of users which can see

[dataparksearch] [Forum] Re: Параллельное многосерверное индекирование

2007-12-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Параллельное многосерверное индекирование Вы также можете использовать команду MarkForIndex no в indexer.conf, она выкючает снятие пометки устаревания с документов, выбираемых к индексированию. Это позволит снизить

[dataparksearch] [Forum] Re: Unaccessible pages and documents

2007-12-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Unaccessible pages and documents I think this can be implemented using categories. At first, you need to created one category per document group, then you need to create one category per user group, and then you

[dataparksearch] [Forum] Re: Параллельное многосерверное индекирование

2007-12-20 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: Параллельное многосерверное индекирование Спасибо за совет относительно использования команды MarkForIndex no совместно к ключем -r, я его обязательно приму во внимание. Как я понял, переход с dbmode=multi на

[dataparksearch] [Forum] Re: Проблемы с резолвером

2007-12-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Проблемы с резолвером Почему вы решили, что он туда ломится ? Он всего лишь сообщает причину, по которой документ пропущен при индексировании. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full

[dataparksearch] [Forum] Re: Параллельное многосерверное индекирование

2007-12-21 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Параллельное многосерверное индекирование Записи в таблице сервер соответсуют конфигурации, неважно где она задана, в файле indexer.xonf или в вашей таблице. - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Как на FTP индексировать только *.txt, *.htm[l] и каталоги?

2007-12-22 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Как на FTP индексировать только *.txt, *.htm[l] и каталоги? Написал такое выражение: [pre]CheckOnly Regex ^ftp://.*(?!\.txt|\.htm|\.html|\/)$[/pre] Выражение валидно, отлажено в RegexBuddy, но indexer ругается на

[dataparksearch] [Forum] Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги?

2007-12-23 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги? не будут. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги?

2007-12-23 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги? Прописал в конфиге следующие параметры: [pre]Allow NoCase Regex ^ftp://.*(\.txt|\.htm|\.html|/)$ CheckOnly ftp://*[/pre] Затем удалил все документы,

[dataparksearch] [Forum] Как загружаются данные о серверах.

2007-12-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ruler Subject: Как загружаются данные о серверах. Максим, интересует как именно индексер подгружает ссылки на сервера. У нас данные о серверах хранятся в таблице и логично было бы чтобы, даже с опцией -r, индексер брал на

[dataparksearch] [Forum] Re: Как загружаются данные о серверах.

2007-12-26 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Как загружаются данные о серверах. Если конфигурация не меняется, попробуйте использовать ключ -q для indexer, это сокращает время его старта в таком случае. - - - - - - - - - - - - - - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: feduska Subject: Re: mod_apache не работает поиск тогда indexer выдаёт: unsupported media type - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: feduska Subject: Re: mod_apache не работает поиск Я результат отдаю в XML файле, a теперь ради интереса попробовал default (search.htm) И в результате вижу : Search for [b]telefon[/b]. Search results: [b]telefon: 112 / 204[/b] Также

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-27 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_apache не работает поиск 1. А как теперь выглядит вывод при выполнении этого запроса в консоле сервера ? По идее он должен выглядить также, как и ответ веб-сервера. 2. Добавьте команду LogLevel 5 в ваш

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: feduska Subject: Re: mod_apache не работает поиск шаблон search.htm [b]запрос через cgi[/b] (search.cgi?q=telefonast=SKE):: searchd[22231]: {00} [127.0.0.1] Connected. PORT: 218,18 searchd[22231]: {00} Waiting for command header

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_apache не работает поиск Выполните команду ./indexer -TW по не будут записаны данные об URL в базе cache mode. Повторите поиск. Эту команду нужно выполнять после каждого индексирования/переиндексирования. - - -

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: mod_apache не работает поиск Добавьте команду LogLevel 5 в ваш searchd.conf перестартуйте его. Покажите вывод отладочной информации при поиске. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the

[dataparksearch] [Forum] Re: mod_apache не работает поиск

2007-12-28 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: feduska Subject: Re: mod_apache не работает поиск 1. У меня в searchd.conf стоит LogLevel 5 и когда делаю поиск демон searchd выдаёт в консоль то, что я написал прежде... 2. Вопрос из другой оперы: A можно ли искать сразу по двум

[dataparksearch] [Forum] Re: segfault на 4.48

2008-01-01 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: segfault на 4.48 Регулярно c регулярностью 50% ловлю сегфолты в 4.48 на Debian GNU/Linux 4.0 (Etch), если заставляю индексер перечитывать конфигурацию по HUP. Индексация запускается с ключами -N 2 -r. [pre]Core

[dataparksearch] [Forum] Re: Оптимизация ReverseAlias

2008-01-03 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: Оптимизация ReverseAlias За объяснения алгоритма спасибо, а то из документации это неочевидно совсем. Про \d как альтернативу [0-9] мы тут уже беседовали в прошлом году. у меня на линуксе это поддерживается и я

[dataparksearch] [Forum] BUG: snapshot dpsearch-4.49-04012008

2008-01-04 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: BUG: snapshot dpsearch-4.49-04012008 После сборки снэпшота dpsearch-4.49-04012008 indexer при запуске с пареметрами -N значение -r выводит в лог всю информацию по SQL-запросам. Проверялось на Gentoo Linux 2007.0

[dataparksearch] [Forum] Re: Nutch DataparkSearch

2008-01-06 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Nutch DataparkSearch А какие у вас критерии лучшести и мощности ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Unaccessible pages and documents

2008-01-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Marko Hrastovec Subject: Re: Unaccessible pages and documents Hi! I have tried to set up categories and have come to many problems. When nothing worked I switched on MySQL query log and found out the following: If I try to search in

[dataparksearch] [Forum] Re: Странные записи в таблице server

2008-01-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: Странные записи в таблице server Постоянно такое чувство, что что-то ускользает от понимания. Вот-вот ухватишь вроде, но не тут-то было. Мы знаем, что: а) Все URL имеют server_id == rec_id такого сервера, parent

[dataparksearch] [Forum] Re: Unaccessible pages and documents

2008-01-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Unaccessible pages and documents Please add Category 0 32 to your sections.conf file and verify, that you do not have URLInfoSQL no command in your indexer.conf. Then you'll get categories in urlinfo table filled.

[dataparksearch] [Forum] Re: Unaccessible pages and documents

2008-01-07 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Marko Hrastovec Subject: Re: Unaccessible pages and documents I have tried to add Category 0 32 but it reported error. I have tried Section Category 0 32. Now errors are gone but no Category rows have been added after reindexing. I

[dataparksearch] [Forum] Re: использование tag

2008-01-08 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ruler Subject: Re: использование tag Добрый день, Максим! Я хотел бы использовать конструкцию ServerDB pgsql://foo:[EMAIL PROTECTED]/portal/links?field=url Но как в этом случае задавать теги, периоды, секции и другие параметры для

[dataparksearch] [Forum] Re: использование tag

2008-01-09 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: использование tag В этом случае вам скорее подойдет команда ServerTable: http://www.dataparksearch.org/dpsearch-srvtable.ru.html - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Все результаты с сайта

2008-01-10 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Все результаты с сайта Большое Спасибо за оперативный ответ! Ошибка исправилась! Максим, подскажите как реализовать функцию с Вашего поисковика Кто ссылается рылся в шаблонах дистрибутива - там решения нет Спасибо!

[dataparksearch] [Forum] Как проиндексировать несколько сайтов

2008-01-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Валентин Subject: Как проиндексировать несколько сайтов понимаю что обсуждалось но много почитав понял что не все понимаю... как я себе это представляю, нужно добавить в indexer.conf новый server или что? может как то изменится

[dataparksearch] [Forum] Re: Как проиндексировать несколько сайтов

2008-01-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Как проиндексировать несколько сайтов я создал таблицу в базе, в которую через php скрипт загружаю урлы indexer через крон их подцепляет и начинает обхаживать обращение к этой таблице указал в индексере через

[dataparksearch] [Forum] Re: Как проиндексировать несколько сайтов

2008-01-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Валентин Subject: Re: Как проиндексировать несколько сайтов а неужели нельзя тупо добавить server? еще есть вроде какие то многопоточные indexer'ы - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Все результаты с сайта

2008-01-11 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Все результаты с сайта Для этого нуэно аключить сбор ссылок командой CollectLinks yes в indexer.conf и указать команду Limit link:link так же, как указано выше. Далее в поисковом шаблоне в секции RES добавить в

[dataparksearch] [Forum] Re: sudo

2008-01-13 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: sudo Подтверждаю -- не запускается без ключика -f под sudo, setuidgid (из пакета daemontools) или любой другой программой, заменяющей UID/GID процесса. Похоже, не хочет или не может уходить в фоновый режим

[dataparksearch] [Forum] Re: percent-encode URL

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Андрей Subject: Re: percent-encode URL Максим, а посоветуйте пожалуйста, куда вставить преобразование, чтобы в выводе search.cgi URL были нормальные. К сожалению, в базе у меня URL со служебными символами. - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: percent-encode URL

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: percent-encode URL Попробуйте в поисковом шаблоне выводить URL мета-переменной $%(url) - запрещенные символы будут эскейпиться, но для такого способа выдачи не предусмотрена подсветка слов запроса в выводимом

[dataparksearch] [Forum] Ошибка урла

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Ошибка урла результат поиска ** 21.08.2007г. В питомнике От Шамэль absolute_url Tue, 18 Dec 2007, 13:03:18 MSK - 11K bytes - Score: 0.297% ** заголовок ведет на

[dataparksearch] [Forum] Re: Ошибка урла

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: Ошибка урла Какая версия DataparkSearch используется ? Встречается ли, и если да, то в каком контексте, подстрока absolute_url в ваших файлах конфигурации: indexer.conf и search.htm ? - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: Ошибка урла

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Ошибка урла забыл добавить, что из 10 результатов 9 нормальных, видимо ошибка наложилась на конкретную страницу - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: Ошибка урла

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: zabar Subject: Re: Ошибка урла dpsearch-4.48-pqsql - с портов dbmode=cache в indexer.conf и search.htm записи absolute_url - НЕТ! - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: sudo

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: ooptimum Subject: Re: sudo Нет, не остается. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here: http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1170054870

[dataparksearch] [Forum] Re: sudo

2008-01-14 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: sudo Попробуйте новый снпшот http://www.dataparksearch.org/dpsearch-4.49-15012008.tar.gz В нем при наличие в системе функции daemon(), именно эта функция будет использоваться для демонизации. - - - - - - - - - - -

[dataparksearch] [Forum] проблемы с кодировками

2008-01-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Sniper47 Subject: проблемы с кодировками Здравствуйте, Дамы и Господа! У нас возникла проблема с записью в базу данных русских букв, я просмотрел весь форум, но советы которые там давали в таких случаях нам не помогли! версия MySQL

[dataparksearch] [Forum] Re: проблемы с кодировками

2008-01-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: проблемы с кодировками Какая кодировка у самой базы в MySQL ? Если проиндексировать какую-нибудь страницу с ключом -v5 для indexer, кодировка и язык документа правильно определяются ? - - - - - - - - - - - - - - -

[dataparksearch] [Forum] Re: проблемы с кодировками

2008-01-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Sniper47 Subject: Re: проблемы с кодировками MySQL-кодировка: UTF-8 Unicode (utf8) Сопоставление соединения с MySQL: utf8 (когда пробовали с утф) и koi8-r (когда пробовали с koi8-r) Попробовали, кодировка и язык определяются

[dataparksearch] [Forum] Re: проблемы с кодировками

2008-01-16 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Maxime Subject: Re: проблемы с кодировками попробуйте в файле src/sqldbms.c раскоментарить определение DEBUG_SQL и пересобрать. После этого попробуйте проиндексировать один документ. На экран SQL-запросы будут выводиться в правильной

[dataparksearch] [Forum] Re: percent-encode URL

2008-01-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Андрей Subject: Re: percent-encode URL Спасибо, но в этом случае перекодируется все, включая двоеточия и слэши в http://. Попробую изменить функцию. - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full topic here:

[dataparksearch] [Forum] Re: проблемы с кодировками

2008-01-17 Пенетрантность DataparkSearchForum
- - - - - - - - - - - - - - - - - - - - - - - - - - - - Name: Sniper47 Subject: Re: проблемы с кодировками Сделали как Вы сказали, да действительно в консоли русские буквы(настоящие)!!! но в базу пишутся знаки вопросов :( - - - - - - - - - - - - - - - - - - - - - - - - - - - - Read the full

  1   2   3   4   5   6   7   8   9   >