- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: robots.txt:
Allow/Disallow commands are looking in order of appearance, and only the first
found applies. So Disallow *.cgi will still exclude *.cgi in this case.
- - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: robots.txt:
Yes, absolutely right.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=02;topic_id=1185818418;page=2
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Yelena
Subject: Re: No
yesterday the Server command worked whithout trailing slash(( today it doesn't
work.
I use Server command like
Server file:///path/to/folder/
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: No
If you would like to limit indexing by the folder specified only, you need to
specify the following Server command:
Server path file:///path/to/folder/
Please run indexer with -v5 switch specified, this
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Статистика по сайтам
Каких-либо средств cбора статистики в dpsearch нет.
Посчитать кол-во хостов можно следующим запросом:
SELECT COUNT(*) FROM server WHERE command='S' AND parent != 0;
Посчитать кол-во документов
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Vitaly
Subject: Re: не работает поиск
Думаю не помешает search.htm и если используется searchd, то searchd.conf. Ну и
ставшее стандартным - после индексации indexer -THW делали?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: не работает поиск
Указаны ли одинаковые значения WrdFiles в indexer.conf и в search.htm ?
Попробуйте в search.htm добавить команду
LogLevel 5
она включит максимальный уровен вывода отладочной информации, и покажите
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Непонятные результаты при поиске
Если выключить кэш поисковых запросов командой
Cache no
будет ли работать корректно ?
Какая версия dpsearch используется вами ?
- - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: статистика по словам по сайту
Для способов хранения cache, crc и crc-multi хранятся не сами лова, а их
контрольные суммы. Кроме этого, статистика частот слов при индексировании не
собирается и тем самым нигде не
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: 2 программы на сайте
Можно поставить.
А можно и не ставить, а создать вторую конфигурацию, для indexer можно
передавать файл конфигурации, отличный от дефолтного, в качестве параметра:
./indexer
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ruler
Subject: Re: Непонятные результаты при поиске
Максим, извини за беспокойство, но есть ли идеи по данному вопросу?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Непонятные результаты при поиске
Попробуйте dbmode=cache, или вам нужен именно multi ?
Еще можно попробоватьпоследний снапшот версии 4.48
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Обновление
Изменения на русском доступны по адресу:
http://www.dataparksearch.org/ChangeLog.ru
Всегда имеет смысл обновляться до последнего релиза, в вашем случае это 4.47
(вы используете один из его снапшотов,
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: SkyRanger
Subject: Re: Вывод части документа с подсвеченными результатами
Спасибо настроил stored и searchd все работает, но как то странно, только если
скопировать слово и вставить со страницы, если вводишь вручную ничего не
находит
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Владимир
Subject: Re: странный proc title у cached
dpsearch-4.47
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=06;topic_id=1190638123
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: saung
Subject: can't get search.cgi to work from browser
Hi,
This is probably a stupid question but I couldn't figure out what was wrong.
So I've compiled and installed everything and it seems to be fine. I grabbed
the search.cgi
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Wrong Search-Results
Please explain what is wrong with search results, what are you expecting as
correct results ?
What dbmode you use ?
Would you upgrade to the latest version of dpsearch released (it's 4.47) ?
-
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ruler
Subject: Re: Поэтапное индексирование
Огромнейшее спасибо.
А еще вопрос. Если я проиндексировал, к примеру, 1000 документов и при этом в
базу на индексацию добавилось еще 5000. Они уже помечены на индексацию через
Period? Т.е.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Thomas Pajonk
Subject: Wrong Search-Results
Hi all,
i´ve big trouble with dpsearch 4.45.1 on an opensuse 10.1 with mysql
connection. I´ve indexed about 1.5 million url´s. using the search interface,
the result are everything, but
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Поэтапное индексирование
Новые документы добавляются в базу со временем очередной индексации, равным
времени индексиования документа, гда найдена ссылка, которая добавляется в
базу. Т.е. приповторном запуске
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Владимир
Subject: Re: Detect clone algoritm
Клоны -- документы, имеющие одинаковые значения Hash32 вычисляемой по всем
секциям документа. Копии одного и того же документа имеют одинаковые значения
Hash32. Это позволяет не
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: saung
Subject: Re: can
Wow I can't believe it was that simple. Thank you very very much!
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: How to Upgrade 4.45.1 to 4.47?
The simplest way - setup new version over installed. It's compatible.
But if you can make backup - make backup anyway.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Marko
Subject: UTF-8 encoding problems
Hi!
I am having problems with indexing some characters used in Slovenian language.
I have pages in UTF-8. I am using MySQL support.
čČ is decoded correctly
šŠ and žŽ are not decoded correctly
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: lib error being seen in Apache logs
Even if you have an SQL server on an another PC, you still require to have
MySQL client library on PC where search.cgi is running.
- - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: indexing a very large number of urls
DataparkSearch is able to index up to several million documents, depending on
average document size and hardware used (this is for cache dbmode).
I don't' know any provider with
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: RageLT
Subject: Re: Tag ServerWeight
./indexer -S
Database statistics
StatusExpired Total
-
0 0 92 Not indexed yet
200 0 10 OK
302
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: RageLT
Subject: apache-module
Установил dpsearch-4.49-26102007 с поддержкой mod_dpsearch.
Всё работает прекрасно, за исключением одного, запрос с кириллицей
не выдаёт никакого результата, хотя в базе данные точно есть, через
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: RageLT
Subject: Re: apache-module
At 11:34:23 26/10/07, RageLT wrote:
apache_1.3.39
./configure \
--enable-module=rewrite \
--disable-module=imap \
--disable-module=userdir \
--disable-module=autoindex \
--enable-module=so
Конфиг по
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: apache-module
Давайте проверим, правильно ли определяется кодировка документа при
индексировании. Для этого переиндексируйте любой документ, который содержит
слово портал таким образом:
./indexer -qamv4 -u _URL_
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Ошибка конфигурирования
Появился ли у вас файл install.options ? Если да, покажите его содержимое.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: не могу установить Datapark
вам нужно установить пэкаджи zlib и zlib-devel на вашу систему.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: не могу установить Datapark
По умолчанию перебираются несколько возможных вариантов и выбирается тот, где
этот файл находится.
попробуйте найти его командой
find / -name mysql.h -print
- - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Валентин
Subject: Re: не могу установить Datapark
эээ не знаю, видимо нет, ну а если установлен, то какую директорию в любом
случае писать там, или ту что он по умолчанию предлогает
- - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Ispell
К сожалению, такая возможность не предусмотрена.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Realm + Alias creates invalid SQL
What version of DataparkSearch are you using ?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Try also
Нужно установить aspell и необходимые словари для него, после этого пересобрать
dpsearch (как правило он сам его находит по умолчанию), в поисковом шаблоне
командой Locale указать локаль, соответсвующую
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Валентин
Subject: Re: Просьба ответить на массу вопросов
а вот что мне выводит поисковик если + включить логи
[EMAIL PROTECTED] dpsearch-4.48]# /usr/local/dpsearch/bin/search.cgi easy
search.cgi[4010]: {00} search.cgi started with
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: WARNING: nonstandard use of \
Yes, setting 'escape_string_warning' to off is a workaround solution. I'll
update PgSQL stuff in a future release.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Ошибка при установке
Добрый день!
При установке получаю следующую ошибку:
полный путь заменен на - path
configure failed: -1 at /usr/home/path/111/install.pl line 176, STDIN line 33.
полные параметры установки:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Валентин
Subject: Re: Просьба ответить на массу вопросов
новый вопрос масса слов которые есть на странице почему то не ищутся, в чем
дело , что делать?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Андрей
Subject: Индексирование MediaWiki
Здравствуйте,
я хочу проиндексировать mediawiki, поможите кто чем может :-)
1) mediawiki для адресации использует не номера(индексы), а названия страниц,
например:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: No 'Server' command for url
Что делает indexer еще, кроме вывода сообщения No 'Server' command for url,
когда он встречает такие условия?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: segfault на 4.48
Вчера тоже поймал segfault на dpsearch-4.48-mysql-freetds, правда, без core
dump. Запускал просто как indexer -N 5.
# uname -a
Linux spider 2.6.17-gentoo-r4 #1 SMP Sat Aug 26 17:44:54 TJT 2006
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Странные записи в таблице server
Давно заметил, что в таблице server присутствуют странные записи, например,
параметры из indexer.conf, такие как Disallow, а также неверно сформированные
URL из индексируемых
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Странные записи в таблице server
Да, это нормально.
Фильтры тоже заносятся в таблицу server, а для неправильных URL (собственно как
и для всех остальных URL) сохраняется имя сервера, т.к. по нему строится
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Sharon
Subject: CrawlDelay
My indexer.conf contains two sites:
Realm Allow http://www.A.com/forum*
Realm Allow http://www.B.com/*
URL http://www.A.com/forums.php
URL http://www.B.com/
I set at the end of indexer.conf
CrawlDelay 10
I
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: segfault на 4.48
Сегодня поймал segfault сразу после тестового запуска:
[pre]spider dpsearch # sbin/indexer -N 5 -r
indexer[11166]: {00} indexer from dpsearch-4.48-mysql-freetds started with
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: No
Кстати, я заметил, что у меня появилось множество таких сообщений о том, что
нет команды Server для каких-то URL. Это появилось только в версии 4.48, до
этого данные URL нормально индексировались и попадали
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: No
[pre]spider dpsearch # sbin/indexer -qaimv5 -u http://www.varorud.org/
indexer.cfg[14726]: {00} URLDB: 8 records fetched
indexer.cfg[14726]: {00} URLDB: http://www.1tv.tj/
indexer.cfg[14726]: {00} Allow by
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: No
Раскоментарьте, пожалуйста,
#define DEBUG_MATCH 1
в заголовке src/match.c и пересоберите dpsearch, затем повторите команду
sbin/indexer -qaimv5 -u http://www.varorud.org/
- - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Андрей
Subject: Re: Как проиндексировать две SQL таблицы
А зачем path указывать явно, если он по умолчанию?
path describes all documents which are under the same path with URL.
Default value is path
- - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Marko Hrastovec
Subject: Unaccessible pages and documents
Hi!
I have a question regarding searching different parts of web page. I have a
site where not all pages are accessible to all users. We have groups of users
which can see
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Параллельное многосерверное индекирование
Вы также можете использовать команду
MarkForIndex no
в indexer.conf, она выкючает снятие пометки устаревания с документов,
выбираемых к индексированию. Это позволит снизить
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Unaccessible pages and documents
I think this can be implemented using categories. At first, you need to created
one category per document group, then you need to create one category per user
group, and then you
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: Параллельное многосерверное индекирование
Спасибо за совет относительно использования команды MarkForIndex no совместно
к ключем -r, я его обязательно приму во внимание.
Как я понял, переход с dbmode=multi на
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Проблемы с резолвером
Почему вы решили, что он туда ломится ? Он всего лишь сообщает причину, по
которой документ пропущен при индексировании.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Параллельное многосерверное индекирование
Записи в таблице сервер соответсуют конфигурации, неважно где она задана, в
файле indexer.xonf или в вашей таблице.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Как на FTP индексировать только *.txt, *.htm[l] и каталоги?
Написал такое выражение:
[pre]CheckOnly Regex ^ftp://.*(?!\.txt|\.htm|\.html|\/)$[/pre]
Выражение валидно, отлажено в RegexBuddy, но indexer ругается на
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги?
не будут.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: Как на FTP индексировать только *.txt, *.htm[l] и каталоги?
Прописал в конфиге следующие параметры:
[pre]Allow NoCase Regex ^ftp://.*(\.txt|\.htm|\.html|/)$
CheckOnly ftp://*[/pre]
Затем удалил все документы,
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ruler
Subject: Как загружаются данные о серверах.
Максим, интересует как именно индексер подгружает ссылки на сервера. У нас
данные о серверах хранятся в таблице и логично было бы чтобы, даже с опцией -r,
индексер брал на
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Как загружаются данные о серверах.
Если конфигурация не меняется, попробуйте использовать ключ -q для indexer, это
сокращает время его старта в таком случае.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: feduska
Subject: Re: mod_apache не работает поиск
тогда indexer выдаёт:
unsupported media type
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: feduska
Subject: Re: mod_apache не работает поиск
Я результат отдаю в XML файле, a теперь ради интереса попробовал default
(search.htm)
И в результате вижу :
Search for [b]telefon[/b]. Search results: [b]telefon: 112 / 204[/b]
Также
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_apache не работает поиск
1. А как теперь выглядит вывод при выполнении этого запроса в консоле сервера ?
По идее он должен выглядить также, как и ответ веб-сервера.
2. Добавьте команду
LogLevel 5
в ваш
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: feduska
Subject: Re: mod_apache не работает поиск
шаблон search.htm
[b]запрос через cgi[/b] (search.cgi?q=telefonast=SKE)::
searchd[22231]: {00} [127.0.0.1] Connected. PORT: 218,18
searchd[22231]: {00} Waiting for command header
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_apache не работает поиск
Выполните команду
./indexer -TW
по не будут записаны данные об URL в базе cache mode. Повторите поиск.
Эту команду нужно выполнять после каждого индексирования/переиндексирования.
- - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: mod_apache не работает поиск
Добавьте команду
LogLevel 5
в ваш searchd.conf перестартуйте его. Покажите вывод отладочной информации при
поиске.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: feduska
Subject: Re: mod_apache не работает поиск
1. У меня в searchd.conf стоит LogLevel 5 и когда делаю поиск демон searchd
выдаёт в консоль то,
что я написал прежде...
2. Вопрос из другой оперы:
A можно ли искать сразу по двум
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: segfault на 4.48
Регулярно c регулярностью 50% ловлю сегфолты в 4.48 на Debian GNU/Linux 4.0
(Etch), если заставляю индексер перечитывать конфигурацию по HUP. Индексация
запускается с ключами -N 2 -r.
[pre]Core
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: Оптимизация ReverseAlias
За объяснения алгоритма спасибо, а то из документации это неочевидно совсем.
Про \d как альтернативу [0-9] мы тут уже беседовали в прошлом году. у меня
на линуксе это поддерживается и я
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: BUG: snapshot dpsearch-4.49-04012008
После сборки снэпшота dpsearch-4.49-04012008 indexer при запуске с пареметрами
-N значение -r выводит в лог всю информацию по SQL-запросам. Проверялось на
Gentoo Linux 2007.0
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Nutch DataparkSearch
А какие у вас критерии лучшести и мощности ?
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Marko Hrastovec
Subject: Re: Unaccessible pages and documents
Hi!
I have tried to set up categories and have come to many problems.
When nothing worked I switched on MySQL query log and found out the following:
If I try to search in
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: Странные записи в таблице server
Постоянно такое чувство, что что-то ускользает от понимания. Вот-вот ухватишь
вроде, но не тут-то было. Мы знаем, что:
а) Все URL имеют server_id == rec_id такого сервера, parent
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Unaccessible pages and documents
Please add
Category 0 32
to your sections.conf file and verify, that you do not have URLInfoSQL no
command in your indexer.conf.
Then you'll get categories in urlinfo table filled.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Marko Hrastovec
Subject: Re: Unaccessible pages and documents
I have tried to add Category 0 32 but it reported error. I have tried
Section Category 0 32. Now errors are gone but no Category rows have been
added after reindexing. I
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ruler
Subject: Re: использование tag
Добрый день, Максим!
Я хотел бы использовать конструкцию ServerDB pgsql://foo:[EMAIL
PROTECTED]/portal/links?field=url
Но как в этом случае задавать теги, периоды, секции и другие параметры для
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: использование tag
В этом случае вам скорее подойдет команда ServerTable:
http://www.dataparksearch.org/dpsearch-srvtable.ru.html
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Все результаты с сайта
Большое Спасибо за оперативный ответ!
Ошибка исправилась!
Максим, подскажите как реализовать функцию с Вашего поисковика
Кто ссылается
рылся в шаблонах дистрибутива - там решения нет
Спасибо!
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Валентин
Subject: Как проиндексировать несколько сайтов
понимаю что обсуждалось но много почитав понял что не все понимаю...
как я себе это представляю, нужно добавить в indexer.conf новый server или что?
может как то изменится
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Как проиндексировать несколько сайтов
я создал таблицу в базе, в которую через php скрипт загружаю урлы
indexer через крон их подцепляет и начинает обхаживать
обращение к этой таблице указал в индексере через
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Валентин
Subject: Re: Как проиндексировать несколько сайтов
а неужели нельзя тупо добавить server?
еще есть вроде какие то многопоточные indexer'ы
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Все результаты с сайта
Для этого нуэно аключить сбор ссылок командой
CollectLinks yes
в indexer.conf и указать команду
Limit link:link
так же, как указано выше.
Далее в поисковом шаблоне в секции RES добавить в
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: sudo
Подтверждаю -- не запускается без ключика -f под sudo, setuidgid (из пакета
daemontools) или любой другой программой, заменяющей UID/GID процесса. Похоже,
не хочет или не может уходить в фоновый режим
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Андрей
Subject: Re: percent-encode URL
Максим, а посоветуйте пожалуйста, куда вставить преобразование, чтобы в выводе
search.cgi URL были нормальные. К сожалению, в базе у меня URL со служебными
символами.
- - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: percent-encode URL
Попробуйте в поисковом шаблоне выводить URL мета-переменной $%(url) -
запрещенные символы будут эскейпиться, но для такого способа выдачи не
предусмотрена подсветка слов запроса в выводимом
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Ошибка урла
результат поиска
**
21.08.2007г. В питомнике От Шамэль
absolute_url
Tue, 18 Dec 2007, 13:03:18 MSK - 11K bytes - Score: 0.297%
**
заголовок ведет на
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: Ошибка урла
Какая версия DataparkSearch используется ?
Встречается ли, и если да, то в каком контексте, подстрока absolute_url в ваших
файлах конфигурации: indexer.conf и search.htm ?
- - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Ошибка урла
забыл добавить, что из 10 результатов 9 нормальных, видимо ошибка наложилась на
конкретную страницу
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: zabar
Subject: Re: Ошибка урла
dpsearch-4.48-pqsql - с портов
dbmode=cache
в indexer.conf и search.htm записи absolute_url - НЕТ!
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: ooptimum
Subject: Re: sudo
Нет, не остается.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
http://www.dataparksearch.org/cgi-bin/simpleforum.cgi?fid=04;topic_id=1170054870
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: sudo
Попробуйте новый снпшот
http://www.dataparksearch.org/dpsearch-4.49-15012008.tar.gz
В нем при наличие в системе функции daemon(), именно эта функция будет
использоваться для демонизации.
- - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Sniper47
Subject: проблемы с кодировками
Здравствуйте, Дамы и Господа!
У нас возникла проблема с записью в базу данных русских букв, я просмотрел весь
форум, но советы которые там давали в таких случаях нам не помогли!
версия MySQL
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: проблемы с кодировками
Какая кодировка у самой базы в MySQL ?
Если проиндексировать какую-нибудь страницу с ключом -v5 для indexer, кодировка
и язык документа правильно определяются ?
- - - - - - - - - - - - - - -
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Sniper47
Subject: Re: проблемы с кодировками
MySQL-кодировка: UTF-8 Unicode (utf8)
Сопоставление соединения с MySQL: utf8 (когда пробовали с утф) и koi8-r (когда
пробовали с koi8-r)
Попробовали, кодировка и язык определяются
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Maxime
Subject: Re: проблемы с кодировками
попробуйте в файле src/sqldbms.c раскоментарить определение DEBUG_SQL и
пересобрать. После этого попробуйте проиндексировать один документ. На экран
SQL-запросы будут выводиться в правильной
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Андрей
Subject: Re: percent-encode URL
Спасибо, но в этом случае перекодируется все, включая двоеточия и слэши в
http://. Попробую изменить функцию.
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full topic here:
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Sniper47
Subject: Re: проблемы с кодировками
Сделали как Вы сказали, да действительно в консоли русские буквы(настоящие)!!!
но в базу пишутся знаки вопросов :(
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Read the full
Результаты 1 - 100 из 860 matches
Mail list logo