張です。
> 寺西です。
>
>> namazu -al の結果の文書を情報抽出の対象文書とする予定です。
>> "w_1 or w_2 or ... w_50" というような何十個の単語のdisjunctionの
>> クエリを投げて,検索結果としての順位付けの文書リストの上位1万ぐら
>> いまでの文書を取ろうとします。
>
> 「何十個の単語」の何十個が具体的にいくつなのかで Namazu の制限に
> 引っかかるかもしれません。
先日namazuコマンドを使ったときに, nmz/libnamazu.h のソースコードのBUFSIZE,
QUERY_TOKEN_MAX, QUER
寺西です。
Jianwei Zhang wrote:
>
> namazu -al の結果の文書を情報抽出の対象文書とする予定です。
> "w_1 or w_2 or ... w_50" というような何十個の単語のdisjunctionの
> クエリを投げて,検索結果としての順位付けの文書リストの上位1万ぐら
> いまでの文書を取ろうとします。
「何十個の単語」の何十個が具体的にいくつなのかで Namazu の制限に
引っかかるかもしれません。
--
===
張と申します。
臼田さん,寺西さん
> ただ、残念ながら結果は100件までですし、テンプレートで OFF 設定できない
> 余計なメッセージは出力されてしまいます。
>
> なので、
>
>> ruby からの使用を考えているのであれば
>>
>> rbnamazu または ruby 版の Seach::Namazu を試されては
>> どうでしょうか。
>
> でしょうね。Perl なら Search::Namazu をお使いください。
>
> http://www.akaneiro.jp/Search-Namazu/index.shtml
>
> ところで、-al の結果を何に使われ
寺西です。
Kenichi Maehashi wrote:
>
> さて、mknmz を行う際、以下のように実行していますが、
> テンプレート(NMZ.head.ja 等)が作成されません。
--template-dir オプションについては臼田さんの説明の通りです。
> とありますが、これは --template-dir に指定したディレクトリに新しい
> (文書数等を更新した)テンプレートを出力すると理解していたのですが・・・
NMZ.head.ja 等については、インデックス作成時にインデックスの出力
ディレクトリに出力されますので、これをコピーするなり、リンクして
おくな
寺西です。
> Jianwei Zhang wrote:
>
> 私の場合は,検索の結果がウェブページとしてクライアントに返されるのでは
> なく,サーバー側で検索結果(特にnamazu -alで取得する文書のリスト)を後
> 処理しようと思います。
namazu.cgi ではリストモードがありません。
namazu.cgi では最大でも100件までしか結果を返せません。
> a.cgi
> --
> #!/usr/bin/ruby
> ...
> `env SCRIPT_NAME='namazu.cgi' QUERY_STRING=