[Namazu-users-ja 1318] Re: Namazu-users-ja@namazu.org
寺西です。 On 2020/03/23 17:32, 加藤 美和 wrote: > 下記の環境で、namazuの新規構築中です。 > > OS Windows 10 64bit > > Perlバージョン ActivePerl-5.26.3 > > Namazuバージョン nmz2.0.22pre7.002-x64 Namazu for Windows に関するご質問は、 namazu-win32-users...@namazu.org にお送りください。 # エラーメッセージのまんまですが。 -- ===== 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1307] Re: インデックスが開けませんでした
寺西です。 (2014/08/06 15:52), K.N wrote: インデックスは間違いなく作成されているようで、コマンドラインからは検索で きるのですが、 WEB(namazu.cgi)から検索出来なくて困っております。 WEB上では検索ページは表示されるのですが、キーワードを入力し実行しても、 [ (インデックスが開けませんでした) ] の表示になります。 インデックスの指定が間違っているということです。 ・/htdocs/namazu/.namazurc に以下を設定 Index /htdocs/namazu/index Template /htdocs/namazu/index Index と Template が同じ場所を指しているというのは、間違っている においがプンプンします。 検索時のテンプレート機能は、カスタマイズしたテンプレートファイルを インデックスとは別の場所に配置し、該当ファイルをインデックス の代わりに使用する機能です。 このため、テンプレート機能を使う場合にはインデックスとは 別の場所を指しているはずです。 またテンプレート機能を使わない場合には、設定する必要はありません。 ・/htdocs/namazu/index/NMZ.head.ja に以下を設定 META HTTP-EQUIV=Content-Type CONTENT=text/html; charset=euc-jp input type=hidden name=idxname value=index a href={cgi}?idxname=index[検索方法]/a 通常はインデックスファイルを直接書き換えたりはしません。 mknmz 時に参照するテンプレートファイルを書き換えて使うか、 namazu, namazu.cgi 検索時に先のテンプレート機能を使うかのどちらか です。 検索時のテンプレート機能を使うなら、/htdocs/namazu/template ディレクトリを作成して、そこにインデックスの NMZ.head*, NMZ.foot*, NMZ.body*, NMZ.tips* をコピーして、テンプレートの方を書き換えます。 .namazurc の Template には /htdocs/namazu/template を指定します。 で、テンプレートの NMZ.head.ja の書き換えるところですが、 META HTTP-EQUIV=Content-Type CONTENT=text/html; charset=euc-jp を追加するだけでいいです。 input type=hidden name=idxname value=index a href={cgi}?idxname=index[検索方法]/a この2行はデフォルトから書き換えてしまっていますが、その書き換えが 大きな間違いです。インデックスディレクトリの下の index ディレクトリ を指しているので、インデックスが見つかるはずがありません。 デフォルトのものに戻しましょう。 idxname を使うのは複数のインデックスがある場合で、どのインデックス を使うのかを指定するもので、インデックスが1つしかない場合には 使いません。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1304] Re: namazu対応OSについて
寺西です。 (2014/04/18 9:36), 武藏大祐 / MUSASHI, DAISUKE wrote: namazuの対応OSについてご教授頂けますでしょうか。 Namazu は UNIX, Win32, OS/2 の上で動作可能 です。 ということになっていますが、現在では UNIX, Windows ということ になるかと思います。(Mac OS X も UNIX 扱い) RHEL6.5はnamazu2.0.21よりも後にリリースされたOSとなりますので、動作する か若干不安がございます。 特定の UNIX でしかサポートしていないような機能は使っていない はずなので、UNIX 全般で広く動かすことは可能だと思いますし、 実際動いています。 ただ、確かにインストールされているソフトウェアのバージョンが 新しすぎ、そのソフトの互換性が失われたことで、正しく動作しない といったことが発生する可能性は否定できません。 こういうケースは後追いになりますが、不具合の報告をしてもらえ れば、(そのソフトのバグでなければ)概ね対応できるものとは 思います。 また、そういうケースは多々起こるものでもないです。 http://www.namazu.org/doc/tutorial.html#prep-make にある各ソフトウェアの最新バージョンと書かれている バージョンですと概ね大丈夫だとは思います。 なお、今現在では、 Namazu 2.0.21 までの特定のフィルタが、Perl 5.18 では 想定通りには動かないことは判明しています。 (次のバージョンの 2.0.22 では対応予定) もしインストールされている Perl が 5.18 だった場合には、 その特定のフィルタは意図とおりには動かないということになります。 皆様の中で、RHEL6系のOSへnamazuを導入し特に問題なく動作した、等の情報が ございましたら、連携頂けないでしょうか。 CentOS 6.1 で簡単な動作確認はしています。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1300] Namazu 2.0.22 pre5 公開
寺西です。 Namazu 2.0.22 pre5 を以下に置きました。 ・アーカイブファイル 1633291 バイト http://www.namazu.org/test/namazu-2.0.22pre5.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.22pre5.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.22pre5.tar.gz.md5 (21eb61c0b43615faf008c3564122587f *namazu-2.0.22pre5.tar.gz) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.22pre5.tar.gz.sha1 (ab9d126416f1cd122b618bcf5c0ccc2f9a8c9673 *namazu-2.0.22pre5.tar.gz) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://pgp.mit.edu/ http://pgp.nic.ad.jp/pgp/ http://pgp.es.net/ http://pgp.zdv.uni-mainz.de/keyserver/pks-commands.html 2.0.22pre4 からの主な変更箇所 - コンパイル時のワーニングを消すためのキャストの追加 - Perl 5.8.1, 5.18.X 対応 - tutorial 更新 - nmzcat に headings 出力対応 - ユーティリティコマンドの man ファイル追加 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1299] Namazu 2.0.22 pre4 公開
寺西です。 Namazu 2.0.22 pre4 を以下に置きました。 ・アーカイブファイル 1373022 バイト http://www.namazu.org/test/namazu-2.0.22pre4.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.22pre4.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.22pre4.tar.gz.md5 (66bf4472b6c4945e355915fa8d2cad42 *namazu-2.0.22pre4.tar.gz) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.22pre4.tar.gz.sha1 (1a452a0be85770de75033b580e9273ad8def5eac *namazu-2.0.22pre4.tar.gz) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://www.cl.cam.ac.uk/PGP/pks-commands.html 2.0.22pre3 からの主な変更箇所 - list/namazu.el, gnus-nmz-1.el のコーディング指定を追加 - pl/extzip.pl の Compress/Zip.pm チェック削除 - EPUB フィルタおよびサンプルデータの追加 - File::MMagic の削除と configure のメッセージ変更 - pltests の env.pl に File::MMagic のバージョン出力を追加 - OLE フィルタの Office 2013 対応の見直し - x64 版 Office 2013 の対応を見送り(Visio 2013 を除く) - PowerPoint 2013 の対応を見送り(x86, x64 版共に) - tutorial 更新 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1292] Re: CentOS4 と
寺西です。 # 何が言いたいのかさっぱりわかりませんが...。 (2013/10/09 21:05), &1 wrote: 「CentOS」、「Namazu」で検索してもnkfモジュールの インストール方法が見つからない。 NKF の Perl モジュールをインストールするのに、 「CentOS」に限定したら、見つかりにくいですわな。 解凍した後でNKF.modディレクトリ中でperl Makefile.PL すれば良い事と、このヒットした記事の中にText-Kakashiの やり方も書いてあり、perlモジュールが無事インストール。 やれやれ。 詳細は書かれていませんが、 http://www.namazu.org/doc/tutorial.html.ja にもあっさりは書いてありますよ。 # メーリングリストの過去記事検索してもごろごろ出てくるとは思いますが。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1294] Re: CentOS4 とnkf
寺西です。 # 全文引用せぬように。 (2013/10/09 22:51), &1 wrote: yumが使えないCentOS4でnkfとkakashiの perlモジュールをインストールする方法を 最初に調べるのはそれぞれのモジュールの付属ドキュメントでしょう。 バージョンにより多少違いはあるでしょうけれども、 nkf は INSTALL.j Text-Kakasi は、README.jp を読めば事足りると思うんですが。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1297] Re: mknmz でのディレクトリ指定
寺西です。 (2013/10/09 23:19), &1 wrote: インデックスの作成でmknmz dir_pとするところを 誤って存在しないディレクトリを指定して実行したら ディレクトリが見つからないとエラーで止まらずに 空のインデックスが出来てしまいました。 ... 無効なディレクトリを指定した時はエラーで止まって欲しかった。 まぁそういう対応をしてもいいかとは思いますが、 結局指定するパスを間違えて、別の存在するディレクトリを指定 してしまった場合にも似たようなことが起こります。 そちらは回避しようがないので、インデックスを作成する際には 当然のことならがパスを間違わないようにするべきということと、 インデックスのバックアップは取っておくということでしょうね。 mknmz --helpとしてみると誤消去防止には-Uオプションでしょうか。 期待されている「誤消去防止」というものが何を指しているのか わかりませんが、おそらく違うでしょう。 -U, --no-encode-uri URIのencodeを行わない と書いてあるかと思います。 まあ通常は2回目以降のインデックス更新はスケジューラに やらせるので困る方は少ないでしょうね。 当方もcornで指定してミススペリングを回避して対応するので 無効なディレクトリを指定しても動作が止まらない報告まで。 その2回目には --update オプションで、更新するインデックスを指定する ということはできます。 こっちは存在しないインデックスを指定した場合には「インデックスが みつかりません」となります。 # 別のインデックスを間違って指定した場合には、別のインデックスを # 更新してしまいますけど...。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1290] Re: mknmz と環境変数
寺西です。 開発の話になってきたので、続きは Web で。 ではなくて、namazu-devel...@namazu.org で。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1274] Re: パスワード付き
寺西です。 (2013/07/21 22:36), &1 wrote: 各情報は以下の通りです *mknmz -C 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc システム: linux Namazu: 2.0.21 Perl: 5.010001 File-MMagic: 1.27 NKF: /usr/bin/nkf KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w KAKASI も Perl モジュールの方が速いので、そちらを お勧めします。 メッセージの言語: ja_JP.utf8 言語: ja_JP.utf8 ja_JP.utf8 はサポートしていないので、環境変数を設定して ja_JP.eucJP でご使用ください。(ja_JP.utf8 では正しく 動作しないです。) あとは問題なさそうです。 pdftotext version 3.03 Copyright 1996-2011 Glyph Cog, LLC Usage: pdftotext [options] PDF-file [text-file] Namazu 2.0.21 の filter/pdf.pl が想定している Glyph Cog, LLC 版の pdftotext を使われているようですので、 こちらは問題なさそうです。 # 正しくインストールされておればですが。 -opw string : owner password (for encrypted files) -upw string : user password (for encrypted files) オーナーパスワードとユーザパスワードがあります。 それぞれ -opw, -upw で指定します。 Namazu はとりあえず横においておいて、pdftotext コマンドを にパスワードを指定して PDF ファイルからテキストが抽出 できるかどうかご確認ください。 例) オーナーパスワード指定の場合 $ pdftotext -q -raw -enc EUC-JP -opw password pdffile これができないと、Namazu でも使えませんから。 pdfinfo version 3.03 Copyright 1996-2011 Glyph Cog, LLC Usage: pdfinfo [options] PDF-file こちらも Glyph Cog, LLC 版で -opw string : owner password (for encrypted files) -upw string : user password (for encrypted files) オーナーパスワードとユーザパスワードがあります。 こちらも pdfinfo コマンドにパスワードを指定して PDF ファイル の情報を出力できるかどうか確認してください。 例) オーナーパスワード指定の場合 $ pdfinfo -enc EUC-JP -opw password pdffile pdftotext, pdfinfo の両方共、うまく動作したなら、 次は filter/pdf.pl にパスワードを指定するように修正します。 pdftotext の引数は @pdfconvopts 配列に、 pdfinfo の引数は @pdfinfoopts 配列に指定しますので、 ここにパスワードの指定を追加します。 例えばこんな感じです。 @pdfconvopts = ('-q', '-raw', '-enc', 'EUC-JP', '-opw', 'password'); @pdfinfoopts = ('-enc', 'EUC-JP', '-opw', 'password'); -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1269] Re: namazu で日本語文字の検索が出来ません
寺西です。 (2013/07/20 20:51), &1 wrote: 先日からnamazuを使おうとインストールしたのですが、日本語文字の検索が 出来ないので教えてください。 ... 最初、mknmzで上手くpdfファイルの内部を検索して日本語単語を見つけてくれなかっ たのですが google検索でnkfの存在を確認した上でmknmzrcに#を取って$NKF=/usr/bin/nkf;を 有効にしろという情報を得て修正。 nkf を使うように設定を変更しても動きはしますが、 Namazu 2.0.21 のデフォルトでは、NKF Perl モジュール を使うように設定されていますので、NKF Perl モジュールを インストールされてそれを使うようすることをお勧めします。 NKF Perl モジュールを使う方が処理速度が速いので。 ところがnamazu 試験 /usr/local/var/namazu/index/centos|nkf -wとすると検索に 失敗。 nkf -w が何をしているかご存じでしょうか? UNIX の場合、namazu コマンドの出力は EUC-JP で出力されます。 これを nkf -w にパイプで渡すと UTF-8 に変換して、端末に出力され ます。ということは、端末の漢字コードは UTF-8 で使っている ということが推測できます。 端末の漢字コードが UTF-8 ということは、検索文字列に指定した 日本語も UTF-8 だということになります。 残念ながら namazu コマンドは UTF-8 に対応していませんので、 これでは正しく処理できません。 いろいろ方法はありますが、王道なのは 環境変数 LC_ALL 等を ja_JP.eucJP に設定して EUC-JP 環境で namazu を使うことです。そうすれば $ namazu 試験 /usr/local/var/namazu/index/centos で検索できるでしょう。 それでダメなら端末の漢字コードが EUC-JP になっているかどうか 確認しましょう。 LC_ALL 以外の環境変数も下記の内容を確認した上で正しく設定 しましょう。 http://www.namazu.org/doc/tutorial.html#japanese namazurcでの言語設定を探しましたがLang jaがコメントアウトされている状態でも Lang ja_JP.eucJPにしても変わりません。 環境変数の設定を行った上で $ namazu -C の結果を確認してください。 使用する言語(Lang): が ja_JP.eucJP になっていて、メッセージ も文字化けしていなければ OK です。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1264] Re: Namazu検索結果のタイトルにファイルのタイトルを表示しないようにする
寺西です。 (2013/05/28 18:43), inqu...@software.sanix.jp wrote: 検索結果のタイトルにファイルのタイトルを表示しないように したかったので、文書フィルタを一部変更しました。 しかし、対応として正しかったのかが分からずにいます。 それは、何をもって正しいというのか次第かと思いますが...。 文書ファイルのタイトルをなぜ表示したくないのか、その理由は 何でしょうか? 【確認しておきたいこと】 1.フィルタを変更するしか方法がないのか? 設定変更のみで対応出来ればそちらの方が安心ではあります。 普通はフィルタには手を加えず、テンプレートを作成して、 タイトルを表示しないようにするでしょねぇ。 2.ファイルのタイトルを取得しなくしたことで悪影響はないか? これまた何をもって悪影響というのか? という話になります。 $fields-{'title'} に文書のタイトルをいれなければ、当然ながら フィールド検索で、文書のタイトルの検索はできなくなります。 これは悪影響に入りますか? 意図した影響に入りますか? 上記2つ以外のフィルタの仕様も 「タイトルが取得できないときにファイル名を設定する」ようになっています。 何か理由があってこのような仕様になっているのであれば この変更は止めた方が良いのかなと考えております。 文書のタイトルを $fields-{'title'} に設定して、 検索結果に反映するというのが仕様です。 ただし、文書のタイトルが取得できない場合は、文書のタイトル の代わりに仕方なくファイル名をタイトルに代用するという仕様に なっています。 # no title では味気ないので。 過去ログを参照したのですが、フィルタの変更については触れられているものの なぜこのような仕様であるのかが分からなかったため確認の意味も込めて 投稿させていただきました。 文書のタイトルを表示したいからです。 そもそも検索結果の出力フォーマットをカスタマイズするのは、 フィルタでやることではないですし。 (もちろん、フィルタにまで手を入れないとできないような大幅な 変更は除きますが) -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1250] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。 (2013/05/24 16:28), earlybirdsinging wrote: 説明不足でした。 ja_JP.UTF-8 にしました。 情報が錯綜して申し訳ないのですが、 システム:C xpdfrc:ja_JP.UTF-8 の組み合わせだと、インデックスが出来るのですが システム:ja_JP.UTF-8 xpdfrc:ja_JP.UTF-8 の組み合わせだと、Unable to convert pdf file (maybe copying protection) と出てしまい、インデックスが出来ません。 先のメールに書いていますが、unix で日本語処理するには EUC-JP 一択です。 システムにより異なりますが普通は ja_JP.eucJP を使います。 以下、システム:ja_JP.UTF-8での「mknmz -C | nkf -w」の結果です。 (そのままだと一部文字化けしたのでnkf -wをつけました) ja_JP.UTF-8 をサポートしていませんので、端末が UTF-8 だとしても mknmz は UTF-8 では出力できません。 それはそうと mknmz -C の結果もツッコミどころ満載です。 -- 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc システム: linux Namazu: 2.0.21 Perl: 5.010001 File-MMagic: 1.27 NKF: no NKF の設定が no だと日本語処理できませんよ。 NKF の設定を見直しましょう。 てっとり早いのは NKF をインストールした後に、Namazu を 再インストールすることです。 KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 茶筌: no 和布蕪: no わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.UTF-8 UTF-8 はサポートしていませんので、ja_JP.eucJP とかで ないとダメです。 言語: ja_JP.UTF-8 こっちもです。 文字コード: euc とあるように内部は全て euc で処理していますので。 # ま、今時のシステムじゃないけどw namazu コマンドで検索できて、namazu.cgi で検索できない問題とは また別に、インデックスにも問題があるということになります。 pltests というのが、Namazu のソースに含まれているのですが、 Namazu をインストールしたら、それを実行してテストにパスするか 確認してください。 $ cd pltests $ rm test-log $ perl alltests.pl もしテストに失敗するようなら、テスト結果と、test-log をお知らせ ください。 それを見た方が問題点がよくわかります。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1256] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。 ちょっと気づいていませんでしたが、問題が見つかりました。 (2013/05/26 1:04), earlybirdsinging wrote: # pdfinfo -v pdfinfo version 0.12.4 Copyright 2005-2009 The Poppler Developers - http://poppler.freedesktop.org Copyright 1996-2004 Glyph Cog, LLC ー # xpdf -v xpdf version 3.02 Copyright 1996-2007 Glyph Cog, LLC ー xpdf は version 3.02 なのですが、 pdfinfo は version 0.12.4 になっており、問題が生じています。 オリジナルは、Glyph Cog, LLC のものですが、 The Poppler Developers が手を加えているようです。 ですが、それは Namazu としては想定外でしてバージョンが3.02 から 0.12.4 と下がっていまっていて(オリジナルの 3.02 に手を加えている ものとは思いますが)オリジナルの 0.12.4 という古いバージョン (というものが実際あるかどうかは別として)と誤認しています。 そのためうまく動作しません。 # こういう改変でバージョンを下げる(改変したものを基準でバージョン # を付ける)というのは、混乱の元でいただけませんが。 最も重要な pdftotext のバージョンはいくつになっているでしょうか? こちらも手が加わっていてバージョンが下がっていると問題が出る 可能性があります。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1257] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。 (2013/05/26 2:21), Tadamasa Teranishi wrote: ですが、それは Namazu としては想定外でしてバージョンが3.02 から 0.12.4 と下がっていまっていて(オリジナルの 3.02 に手を加えている ものとは思いますが)オリジナルの 0.12.4 という古いバージョン (というものが実際あるかどうかは別として)と誤認しています。 そのためうまく動作しません。 そういえば、以前、田中さんから [Namazu-users-ja 1237] で poppler 対応の pdf.pl パッチをご提供いただいていました。 そちらを pdf.pl に適応すれば poppler の pdftotext でもインデックス が作成できるかと思われます。お試しください。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1258] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。 (2013/05/26 1:09), earlybirdsinging wrote: pltests というのが、Namazu のソースに含まれているのですが、 Namazu をインストールしたら、それを実行してテストにパスするか 確認してください。 こちら、参考にさせて頂いていたサイトで「Namazu展開先ディレクトリを削除」 とやってしまっていたので、ありませんでした。。。 再度ソースを入手して、pltests を実行してください。 PDFの検索が主だったので、他文書の検索をしておりませんでした。。。 ... /var/www/cgi-bin に namazu.cgi を配置しているので同階層に .namazurc を配置して、Indexにはnamazurcと同様に Index /usr/local/var/namazu/index/open としております。 最初の症状の話に戻りますが、 同じインデックスを使っていて、namazu コマンドは検索できて、 namazu.cgi はダメというのは、namazu.cgi 側の設定の問題と 思われます。 それはとは別のところで htmlとtxtはインデックス作成されて、WEBで検索結果に出て閲覧可能だったの ですが、PDF文書はインデックス作成時に Unable to convert pdf file (maybe copying protection) と出てしまいます。 こちらの問題も発生していて、これは filter/pdf.pl を Poppler 対応 したものを使えば解決しそうです。 これを解決したからといって、 namazu コマンドは検索できて、namazu.cgi はダメというのを 解決することはできないはずですが、 html, txt が日本語でもちゃんと検索できている(ようになった)という ことでしたら、先の ja_JP.eucJP の設定等の対応でもう解決している ということかもしれません。 とはいうものの filter/pdf.pl の Poppler 対応後、pltests でテストして確認する ことをおすすめします。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1260] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。 (2013/05/26 3:35), earlybirdsinging wrote: # nkf --version Network Kanji Filter Version 2.0.8 (2007-07-20) Copyright (C) 1987, FUJITSU LTD. (I.Ichikawa),2000 S. Kono, COW Copyright (C) 2002-2007 Kono, Furukawa, Naruse, mastodon たぶん大丈夫でしょう。 # vi /etc/xpdfrc textEncoding EUC-JP にしました。 もしかすると Poppler バージョンは見てないかもしれませんね。 でも設定しておきましょう。 最も重要な pdftotext のバージョンはいくつになっているでしょうか? # pdftotext -v pdftotext version 0.12.4 Copyright 2005-2009 The Poppler Developers - http://poppler.freedesktop.org Copyright 1996-2004 Glyph Cog, LLC やっぱり Poppler バージョンですね。 そういえば、以前、田中さんから [Namazu-users-ja 1237] で poppler 対応の pdf.pl パッチをご提供いただいていました。 こちら確認させて頂いたのですが、このパッチの当て方がよく分かりませんでした。。。 大変申し訳ありませんが、ご教授願えますでしょうか。 面倒なので、添付しました。 $ tar xvzf pdf.pl.tar.gz で展開して pdf.pl を取り出してください。 これをインストール先の filter ディレクトリにある pdf.pl と 差し替えてください。 動作確認はしていませんが、たぶん動くはずです。 もし動作がおかしいようならお知らせ下さい。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E pdf.pl.tar.gz Description: application/gzip ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1262] Re: PDF検索がコマンドでは結果が出るがCGIでは結果がでません
寺西です。お疲れ様です。 (2013/05/26 4:05), earlybirdsinging wrote: 小笠原です。 差し替えてインデックスを作成したところ、PDFのインデックス も無事終えました! WEBからnamazu.cgiで検索しても、きちんと拾ってきている事が 確認できました。 うまく動いてよかったです。 pdf.pl の Poppler バージョン対応の動作確認をしてもらえた形に なったので、こちらとしても助かります。 Namazu の次のバージョンには対応済みの filter/pdf.pl を含めます。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1244] Re: cgi.c SERVER_SOFTWARE による処理分岐について
寺西です。 (2013/03/12 16:28), NOKUBI Takatsugu wrote: このSERVER_SOFTWAREを見る処理はどういう経緯でついたんでしたっけ。 ChangeLog, CVSのログには記述が見当たらないのでちょっとわからないでいます。 私が開発に参加する前のことなので、詳しいことは分かりませんが、 cgi を cgi として起動した場合か否かのチェックだと思います。 通常、QUERY_STRING が NULL になるはずですが、 一部の(とは言えなくなっているかもしれませんが)Webサーバだと /cgi-bin/namazu.cgi と呼び出すと、QUERY_STRING が NULL に なるものがあります。 (/cgi-bin/namazu.cgi? だと QUERY_STRING が になる) そのため、QUERY_STRING が NULL だから cgi として起動していない とは判断できないため、SERVER_SOFTWARE でそういう Web サーバ かどうかを補助的にチェックしているということかと思います。 (SERVER_SOFTWARE に何か設定されていればという判定でも よさそうですが、ま、そこは念のため動作が確認されているもの だけ許可しているという感じなのだと思います。) とりあえず、assertで終了するだけでなく、SERVER_SOFTWAREが定義されてい たらその中身も出力するようにした方がいいかな、と思いました。 char *server = getenv(SERVER_SOFTWARE); if (!server) { nmz_warn_printf(unknown SERVER_SOFTWARE : %s\n, server); } assert(0); って感じですかね。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1242] Re: cgi.c SERVER_SOFTWARE による処理分岐について
寺西です。 貴重な情報ありがとうございます。 (2013/03/06 15:54), masanobu hatanaka wrote: 「/* Must not be reached here. */」の箇所で終了していたので、 Web ServerのSERVER_SOFTWAREを確認したところ、 「Oracle-iPlanet-Web-Server/7.0」となっていました。 「Oracle iPlanet Web Server」にも対応するよう以下のような処 理を追加していただけないでしょうか。 || !(nmz_strprefixcasecmp(getenv(SERVER_SOFTWARE), Oracle-iPlanet-))) を追加しました。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1239] Re: インデックス作成方法について、実現可能かご教授下さい
寺西です。 (2012/02/15 22:24), kanami koushi wrote: 現在、nmz2.0.21.001-win32を利用し、CGIにて全文検索を しようとしております。 Namazu for Windows 版についてのご質問は、 namazu-win32-users...@namazu.org にお送りください。 また、メールの文字コードは ISO-2022-JP (いわゆる JIS) でお願いします。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1194] Re: excelの特定のシートの文字列 が検索できません。
寺西です。 蛭間 直道 wrote: # mknmz -C ... NKF: module_nkf KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 本件とは直接関係ないですが、KAKASI は、Perl モジュール版をお使いに なることを強くおすすめします。 処理速度が大きく異なりますので。 メッセージの言語: ja_JP.UTF-8 言語: ja_JP.UTF-8 根本的な問題として、Namazu は ja_JP.UTF-8 に対応していません。 EUC-JP 系をお使いください。 OS により値は多少異なりますが、おそらく ja_JP.eucJP になります。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1184] Re: 日本語全文検索システム Nama zu 2.0.20 リリース
寺西です。 Takahiro Kambe wrote: http://www.namazu.org/security.html この部分の英文のページはないのでしょうか? 残念ながらありません。 翻訳サイトを使って自動翻訳させる等してください。 もちろん英訳していただける方がいらっしゃるなら、歓迎です。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1183] Re: xlhtml実行時のセグメンテー ション違反について
寺西です。 酒井美那 wrote: Namazu インストール時にインストールされていれば使うようになり ますが、Namazu インストールの後からインストールした場合は、 mknmzrc の設定を変える必要があります。 インストールの順番は以下のように実施したつもりなのですが、 NAMAZUの初期設定ではPerlモジュールを参照しないようになっていました。 (1)kakasi-2.3.4 (2)Text-Kakasi-2.04 (3)namazu-2.0.19(File::MMagic) (4)namazu-2.0.19 インストール先がデフォルトであれば、この手順で Text::Kakasi を 参照するようになります。 もし、この手順で Text::Kakasi を参照しないのであれば、何らかの 問題があったということです。 config.log に何か記録されているかもしれません。 また、インストールされるのは mknmzrc-sample なので、 これを元に mknmzrc を作成するという手順が必要です。 (インストールにより、勝手に mknmzrc を書き換えるという危険なことは しませんので。) 「mknmzrc」ファイルを下記のように編集し、対応いたしました。 # $KAKASI = /usr/local/bin/kakasi -ieuc -oeuc -w; $KAKASI = module_kakasi -ieuc -oeuc -w; # $WAKATI = $KAKASI; $WAKATI = $KAKASI; これはこれで正しいです。 ただ、Text::Kakasi が正しく動作するならばですが...。 $ perl -e use Text::Kakasi; として何もエラーメッセージが表示されていなければ大丈夫だとは 思いますけど。 たぶん LANG=EUC-JP ではダメでしょう。おそらくは LANG=ja_JP.eucJP なお、mknmz だけではなく、namazu, namazu.cgi にも当てはまります。 この点、うろ覚えなまま発言しておりました…。 設定を見直したところ、ご指摘頂いたような記述となっておりました。 ざっと見た限りは問題ありません。 # 詳しく確認してませんが。 (3)mknmzrcでは 「$FILE_SIZE_MAX」「$TEXT_SIZE_MAX」「$WORD_LENG_MAX」以外は 全てコメントアウトされている状態であり、 とくに文字コードに関する指定はしていないのですが… よろしくないでしょうか。 いいえ。mknmz を実行する際の環境変数を使用しますので、スクリプト から mknmz を実行しており、そのスクリプトで環境変数を正しく設定して いるならば、それは正しいです。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1179] Re: xlhtml実行時のセグメンテー ション違反について
寺西です。 酒井美那 wrote: また、少々お伺いしたいのですが、 ある程度安定稼動を求められるサーバであるならば、 旧versionのNAMAZUやxlhtmlでは 無限ループやセグメンテーション違反の症状が出ていない場合は、 旧versionのもので運用を試みることが一般的でしょうか? 少なくとも Namazu に関しては常に最新リリースバージョンを使ってくだ さい。古いバージョンを使ういかなる理由もありません。 xlhtml に関しては少なくとも 0.51 にするべきでしょう。 ただ、0.51 以降はいろいろとディストリビューションのパッチがあった ている亜種バージョンで、どうも場当たり的な対処を行っているような ところもあって、必ずしも最新のものが良いということでもないような...。 ●mknmz -Cの結果 ... KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 本件と関係ありませんが、Perl モジュールを使った方が処理が速いので 良いでしょう。 ... インデックス生成の処理の遅さが非常に気になっていました。 Perlモジュールをインストールしたつもりではいたのですが、 インストールしただけで、利用されていると思い込んでおりました。 されません。 Namazu インストール時にインストールされていれば使うようになり ますが、Namazu インストールの後からインストールした場合は、 mknmzrc の設定を変える必要があります。 ja_JP.UTF-8 はサポートしていません。 環境変数を EUC-JP 系のものに変更して Namazu をご使用ください。 ご指摘ありがとうございます。 NAMAZUのインデックス生成に利用するスクリプト内に、 LANG=EUC-JPを記述し、NAMAZUのインデックスやログ関係に関しては EUC-JPで統一されるように対応を試みております。 たぶん LANG=EUC-JP ではダメでしょう。おそらくは LANG=ja_JP.eucJP なお、mknmz だけではなく、namazu, namazu.cgi にも当てはまります。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1177] Re: xlhtml実行時のセグメンテー ション違反について
寺西です。 酒井美那 wrote: /var/log/messagesには Sep 17 14:52:10 hoge_host kernel: xlhtml[5458]: segfault at 0048 rip 00405a0f rsp 7fffb54249d0 error 6 といったようにログが吐かれます。 ... サーバ上から、該当のxlsファイルを削除することは運用上困難であるため、 何らかの解決策がないかと、投稿させていただきました。 状況からすると、インデックスの作成は(そのファイルは除いて)特に 問題なくできているようなので、検索もできているのではないかと思い ます。 その上で、どのような対策を希望されているのでしょう。 1. /var/log/messages にエラーが記録されるのが嫌なので、該当ファイル をインデックス作成対象から外したい 2. xlhtml でセグメンテーション違反で落ちないようにしたい 1 ならば --exclude オプションが使えるでしょう。 2 ならば、開発元に相談するのが良いでしょう。 また、doccatのような有償ツールではなく、 無償のツールでxlhtmlの代用となるようなものをご存知でしたら、 お教えいただけたらと思っております。 メンテナンスしていませんが、namazu/contrib/spreadexcel.pl を filter/excel.pl の代わりに使うことができます。 (Spreadsheet::ParseExcel Perl モジュールが必要) ただし、処理は遅いですし、今回の問題が解決する保証はありません。 また、別の問題が出るかもしれません。 # 何せメンテナンスしていないものですので。 ●mknmz -Cの結果 $ /usr/local/bin/mknmz -C 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc システム: linux Namazu: 2.0.19 Perl: 5.008008 File-MMagic: 1.27 NKF: module_nkf KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 本件と関係ありませんが、Perl モジュールを使った方が処理が速いので 良いでしょう。 メッセージの言語: ja_JP.UTF-8 言語: ja_JP.UTF-8 ja_JP.UTF-8 はサポートしていません。 環境変数を EUC-JP 系のものに変更して Namazu をご使用ください。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1175] Namazu 2.0.20 pre1 公開
寺西です。 近日中に Namazu 2.0.20 のリリースを予定しております。 それに先立ち、Namazu 2.0.20 pre1 を公開いたします。 Namazu 2.0.20 pre1 を以下に置きました。 ・アーカイブファイル 1429659バイト http://www.namazu.org/test/namazu-2.0.20pre1.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.20pre1.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.20pre1.tar.gz.md5 (31e76334b631e0b251cff93ac6c4f073 *namazu-2.0.20pre1.tar.gz) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.20pre1.tar.gz.sha1 (89d6a2e0815c47acf4b17f58ea2c093f14a75c4a *namazu-2.0.20pre1.tar.gz) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://www.openpksd.org/ http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://pgp.dtype.org/ Known Problem なし -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1174] Re: PDFのプロパティで文書名があ っても本文自体に検索対象語が一 語もない場合検索できない
寺西です。 森田 光貴 wrote: なんとか最新ソースを入手して更新しようとしましたが 全く知識が追いつかずお手上げでした。 # apt-get install cvs # cvs -d :pserver:anonym...@cvs.namazu.org:/storage/cvsroot co -r stable-2-0 namazu # としたところ最新版のソースが入手できているかと思いきや エラーでなければ最新版のソースが入手できているはずです。 # ./configure いや、configure は含まれていないので、エラーになるでしょう。 # cd namazu # ./autogen.sh としてください。 # make # make install # make # env pkgdatadir=. make check でテストに全てパスするかを確認してください。 テストに問題なければインストールですが、古いバージョンの Namazu を アンインストールした後にインストールしましょう。 なお、/usr/local/libexec/namazu.cgi にインストールされた namazu.cgi は 所定の位置に手動でコピーする必要があるので注意しましょう。 # としても本文自体に検索対象語が一語もない場合、やはり検索できませんでした。 最新版を正しくコンパイル、インストールを行えば解決します。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1165] Re: mknmzにてPDFインデッ クス作成できない maybe copyin g protectionの表示
寺西です。 森田 光貴 wrote: 当初はnamazuでPDFだけではなくすべてのファイルの日本語の検索がうまくいかなくて 色々設定を変更していました。 その結果、mknmzを実行するときに --indexing-lang=EUC-JPではなくて --indexing-lang=ja_JP.eucjpを付加すると日本語検索がうまくいっていたので 現在も上記のようにja_JP.eucjpを指定していました。 ん〜。混同されていますが...。 mknmz の --indexing-lang オプションで指定する値は、環境変数 LANG や LC_ALL 等に指定する値でなければなりません。 つまり locale をサポートしている OS なら locale -a で出力される 値で、UNIX 系OS で日本語なら EUC-JP 系のものとなります。 つまり、ご利用の環境だと ja_JP.eucjp でなければなりません。 一方で xpdf の -enc オプションで指定できるのは xpdfrc に記述されて いる文字列であり、EUC-JP 系のものなら、EUC-JP ということになります。 mknmz の --indexing-lang と xpdf の -enc オプションの値は同じもの を指定するわけではなく、お互い独立しています。 当然、 現在でも --indexing-lang=euc-jp --indexing-lang=eucjp --indexing-lang=EUC-JP を指定すると日本語の検索が正常に行えず となり、 --indexing-lang=ja_JP.eucjpだと正常に検索できました。 となります。 話を xpdf に戻すと、 Japanese support package の導入に問題がある可能性 が高いと思います。 どのように導入されたのでしょう。 ほとんどHPに公開されていた手順を真似しただけなのですが たぶん、手順には問題なさそうですが、xpdfrc が読み込めていないよう です。 $ pdftotext -cfg /usr/local/etc/xpdfrc -enc EUC-JP file.pdf out.txt でエラーが発生するなら、/usr/local/etc/xpdfrc を編集している間に ファイルの内容を壊してしまっているのでしょう。 再度、中身を確認しましょう。 また、エラーが発生しないなら、xpdfrc の置き場所が違うということです。 $ strings `which pdftotext` | grep xpdfrc で何と表示されるでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1162] Re: mknmzにてPDFインデッ クス作成できない maybe copyin g protectionの表示
寺西です。 森田 光貴 wrote: やはりPDFファイルはすべて変換できないようです。 そうですか、それならば 完全にこの結果からPDFファイルに問題があるのではなく 当方のxpdfの設定がおかしいとは思うのですが。。。 その可能性が高いですね。 念のためにpdftotextも実行しましたがすべてエラーでした。 /usr/local/etc/xpdfrcには記載しているつもりなのですが。 この xpdfrc が読まれていないか、設定に問題があるということでしょう。 ...で、すみません。タイプミスしていました。 # pdftotext -enc ECU-JP Book2.pdf out.txt Error: Couldn't find unicodeMap file for the 'ECU-JP' encoding Error: Couldn't get text encoding EUC-JP が正解ですので、ECU-JP ならエラーが出て当然です。済みません。 再度 EUC-JP で試してください。 # pdftotext -enc ja_JP.eucjp Book2.pdf out.txt Error: Couldn't find unicodeMap file for the 'ja_JP.eucjp' encoding Error: Couldn't get text encoding # pdftotext -enc eucjp Book2.pdf out.txt Error: Couldn't find unicodeMap file for the 'eucjp' encoding Error: Couldn't get text encoding Namazu-users-ja#1156 では見過ごしましたが、ja_JP.eucjp や eucjp を xpdfrc に追加されていますが、どういう理由で追加されている のでしょう。 これらは削除してください。 今回の検証に使用したPDFファイルを寺西様個人のアドレスに添付させていただきます。 わかりました。そちらは確認しておきます。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1163] Re: mknmzにてPDFインデッ クス作成できない maybe copyin g protectionの表示
寺西です。 Tadamasa Teranishi wrote: 今回の検証に使用したPDFファイルを寺西様個人のアドレスに添付させていただきます。 わかりました。そちらは確認しておきます。 基本的に変換はできましたので、xpdf 環境の問題のようです。 それで、 パスワードも添付されておりませんし、xpdfのlangauge packも導入しています。 とのことですが、Japanese support package の導入に問題がある可能性 が高いと思います。 どのように導入されたのでしょう。 xpdfrc に下記の行がありますが、この場所にきちんとファイルがあり ますか? また、パーミッションの設定に問題ありませんか? unicodeMap EUC-JP /usr/local/share/xpdf/japanese/EUC-JP.unicodeMap ご確認ください。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1157] Re: mknmzにてPDFインデッ クス作成できない maybe copyin g protectionの表示
寺西です。 森田 光貴 wrote: しかし、題名どおりにPDFをインデックス化しようとすると maybe copying protectionの表示がありインデックス化できません。 ... パスワードも添付されておりませんし、xpdfのlangauge packも導入しています。 ちなみに読み込んでいるPDFは紙媒体をスキャンしたものもありますし、 WORDなどからPDF作成したものもあります。(adobe acrobat 7 standard 使用) ざっと見た限りでは設定に問題はなさそうです。 それでは、特定の PDF ファイルで発生するのか、全ての PDF ファイルで 発生するのかを確認してみてください。 特定の PDF ファイルで問題が発生する場合は、そのファイルを pdftotext で変換してみてください。 $ pdftotext -enc ECU-JP file.pdf out.txt 何かエラーメッセージが表示されるでしょうか? out.txt ファイルは作成されるでしょうか? 作成された場合、0バイトの ファイルになっていないでしょうか? 確認してみてください。 ちなみに 紙媒体をスキャンしたもの については画像データしか PDF に 含まれていない場合は、テキストは抽出できません。 スキャンした時に OCR でテキストを抽出して、それが PDF に含まれて いる場合は抽出できると思います。 また、公開しても大丈夫なサンプルデータを提供していただけるなら、 手元の環境でテキスト抽出が可能かどうかを確認することぐらいは できます。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1155] Re: mknmzにてインデックス作成で 日本語ファイル文字化け
寺西です。 # メイルの文字コードは ISO-2022-JP (いわゆる JIS) でお願いします # 不必要な全文引用をしないでください http://www.namazu.org/ml.html#html を読み直してください。 で、既に [Namazu-users-ja 1153] で回答済みですので、そちらを読み 直しましょう。 ■locale -aの出力結果 locale -a の出力結果を示せとは言ってませんよ。 locale -a の出力結果にja:euc_JPがあるのかどうかを確認しただけです。 で。 locale: Cannot set LC_CTYPE to default locale: No such file or directory locale: Cannot set LC_MESSAGES to default locale: No such file or directory locale: Cannot set LC_COLLATE to default locale: No such file or directory とエラーメッセージが出ていますが、気になったりはしないのでしょうか? 出力のうち日本語関係と言えば ja_JP ja_JP.eucjp ja_JP.ujis ja_JP.utf8 japanese japanese.euc です。このうち EUC-JP 関係のものというと ja_JP.eucjp がありますので、 これを環境変数 LANG, LANGUAGE, LC_ALL に設定すれば良いということです。 # ja:euc_JP ってどこから出てきたんだか? ■KAKASI: /usr/local/bin/kakasi -ija -oja kakasiの引数を変更したのは、jaにしたほうがいいのかとおもったからでした ご指摘ありがとうございます。変更いたします。 思いつきでデタラメに設定したんでは、正しい動作をするわけが ありません。きちんとお調べになるべきです。 ところで、[Namazu-users-ja 1153] で指摘した内容が反映されていま せんが、何故でしょう。 再度、[Namazu-users-ja 1153] を読み直しましょう。 ■mknmzの出力結果を省略した理由 メール本文が大量の文字数になるのでは考えたためでした。改めて 出力結果を載せます。 再度修正したので、前回のメールと出力結果と差異がございますがご了承ください。 perl: warning: Setting locale failed. perl: warning: Please check that your locale settings: と Perl がワーニングを出しているのですから、おかしいとか思わなかった のでしょうか? LANGUAGE = ja, LC_ALL = ja, LANG = en_US.UTF-8,ja_JP.UTF-8 LANG については[Namazu-users-ja 1153]で指摘済み。 are supported and installed on your system. perl: warning: Falling back to the standard locale (C). 設定がデタラメなので locale には C を使うと Perl が言ってます。 - application/excel: excel.pl ... - application/msword: msword.pl - application/pdf: pdf.pl と、Excel と Word と PDF の全てが未サポートとなっています。 サポートするには必要なソフトをインストールしてください。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1153] Re: mknmzにてインデックス作成で 日本語ファイル文字化け
寺西です。 taka wrote: mknmzコマンドでインディクスを作成しようとした際、日本語ファイル名が正し く表記 されないため、検索してもヒットしないという状態が続いています。 日本語ファイル名と、検索してもヒットしないという状態は問題として 別のような気はします。 ■基本情報 namazu 2.0.19 kakasi 2.3.4 nkf 2.0.7 ご使用の OS は何でしょう。 echo $LANG en_US.UTF-8,ja_JP.UTF-8 *.UTF-8 には対応していません。UNIX で日本語なら EUC-JP 系の値を 設定しましょう。 また、カンマを区切って複数指定することはできません。 echo $LANGUAGE ja:euc_JP echo $LC_ALL ja:euc_JP どちらもコロンが含まれますが、そのような指定には対応していません。 あまり見たことがありませんが、それは正しい値でしょうか? $ locale -a で出力される文字列に、そのような文字列は含まれるのでしょうか? ■mknmz -Cの出力結果 ... NKF: /usr/bin/nkf Perl モジュールを使った方が高速ですよ。 KAKASI: /usr/local/bin/kakasi -ija -oja これも Perl モジュールの方が高速で良いですが、それ以前に引数が 無茶苦茶です。 デフォルトの引数は -ieuc -oeuc -w だと思いますが、書き換えては いけません。 何故書き換えたのでしょう。 application/ichitaro6: taro56.pl ※以下省略 省略しないで書きましょう。重要な情報が省かれてしまっています。 ■インディクス作成 mknmz -O /usr/local/var/namazu/index /home/taka/testtest [/e...@23:32] これは何でしょうか? ^ 以下、mknmz のメッセージ通りですが Looking for indexing files... 5 files are found to be indexed. 1/5 - /root/%82%B3%82%DB%8F%95%83X%83C%83b%83%60%89%5E%97p%83h%83L%83%85%83%81%83%93%83g.doc Unsupported media type (application/msword) skipped. Word をサポートしていないので処理がスキップされているだけです。 Word の処理がしたいのなら、フィルタに必要なツールのインストール が必要です。 http://www.namazu.org/doc/manual.html#doc-filter をご覧ください。 1/4 - /root/%83X%83L%83%83%83%930001.pdf is larger than your setup before filtered, skipped: conf::FILE_SIZE_MAX (200) 5156999 ファイルサイズが大きすぎて処理がスキップされているだけです。 1/3 - /root/%8B%CE%96%B1%95%5C%81i%94%D1%96%EC%97l%81j.xls Unsupported media type (application/excel) skipped. 1/2 - /root/%8C%F0%92%CA%94%EF%90%B8%8EZ%8F%91.xls Unsupported media type (application/excel) skipped. 1/1 - /root/%94%D1%96%EC%8D%EC%8B%C6%95%F1%8D%90%8F%91NEC.xls Unsupported media type (application/excel) skipped. Excel をサポートしていないので処理がスキップされているだけです。 Word と同様です。 mknmz -C の結果に Unsupported media types: (12) marked with minus (-) probably missing application in your $path. - application/excel: excel.pl とあるように exce.pl が無効になっており、メディアタイプが application/excel (つまり Excel) の処理ができません。 mknmz -C の結果が省略されているので何ですが、Word の方も同様の情報が 出力されているはずです。 /home/taka/testtest の 5 つのファイルを処理しようとしていますが、 5 つとも処理がスキップされていますので、インデックスにこれらの ファイルは反映されません。 当然、検索して見つかるはずがありません。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1151] Re: [Namazu-win32-users-ja 1189] 日本語全文検索システム Namazu 2.0.19 リリース
寺西です。 Tadamasa Teranishi wrote: ■ 配布元 Namazu 2.0.19 は、 Namazu Web サイト http://www.namazu.org/ で配布しています。 Namazu for Windows 2.0.19 バイナリアーカイブの配布は 4/12 以降を 予定しています。 諸般の事情により作業が遅れています。 さらに一ヶ月ほど遅れるかもしれません。申し訳ない。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1150] 日本語全文検索システム Namazu 2.0.19 リリース
2009年03月12日 Namazu Project 日本語全文検索システム Namazu 2.0.19 リリース Namazu Project は、オープンソースソフトウェア Namazu 2.0.19 を 2009年03月12日にリリースいたしました。 GPL2(GNU General Public License version 2)に従って、Webサイトにて 一般公開したことを発表します。 Namazu は手軽に使えることを第一に目指した日本語全文検索システムです。 CGI として動作させることにより小中規模の WWW 全文検索システムを構築す ることができるほか、コマンドラインから利用する用途にも使えます。 ■ 主な変更内容 1.追加/修正 - LTVERSION=8:1:1 に変更。 - mknmz にファイルサイズのチェックを追加。 - 各フィルタを extutf8.pl, extzip.pl 拡張機能モジュールに対応。 - pltests にテストを追加。 2.バグフィックス 下記の不具合を修正 - namazu, namazu.cgi フレーズ検索を含む複雑な検索式の解析部分を 修正。 ■ 拡張機能モジュール * 個々のフィルタで行っていた処理を拡張機能モジュールとして統合整理。 * 2つの拡張機能モジュールを用意しました。 pl/extutf8.pl: UTF-8 処理拡張モジュール - extutf8.pl 対応フィルタから呼び出され、UTF-8 処理を行います。 - UTF-8 処理に必要なツール、モジュールの判定を次の順で行い、 利用可能な場合は UTF-8 処理にそれらのツール、モジュールを利用しま す。 1. NKF Perl モジュール 2.04 以上 2. Perl 5.8 以上 3. lv コマンド 4. unicode.pl モジュール pl/extzip.pl: zip 処理拡張モジュール - extzip.pl 対応フィルタから呼び出され、zip 処理を行います。 - zip 処理に必要なツール、モジュールの判定を次の順で行い、 利用可能な場合は zip 処理にそれらのツール、モジュールを利用します。 1. Compress::Zlib, Archive::Zip, (IO::String) IO::String がインストールされている場合は処理が高速化します。 2. unzip コマンド ■ バージョンアップのすすめ 現在、Namazu 2.0.17 以前のバージョンをご使用の方は、セキュリティ上 の問題がありますので、早急に Namazu 2.0.18 以降にバージョンアップ してください。 現在、Namazu 2.0.18 をご使用の方は必ずしも 最新バージョンである Namazu 2.0.19 にバージョンアップする必要はありませんが、Namazu Project がサポートするのは最新バージョンのみです。 このため、Namazu Project がサポートする Namazu 2.0.19 にバージョン アップすることをおすすめします。 ■ 配布元 Namazu 2.0.19 は、 Namazu Web サイト http://www.namazu.org/ で配布しています。 Namazu for Windows 2.0.19 バイナリアーカイブの配布は 4/12 以降を 予定しています。 ■ ライセンス GPL2 ■ 商標について 商品名・会社名等はすべて各社、各組織の商標または登録商標です。 ■ 本件に関するお問合せ先 Namazu Project e-mail: i...@namazu.org URL: http://www.namazu.org/ -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1148] Namazu 2.0.19 RC1 公開
寺西です。 3/12 に Namazu 2.0.19 のリリースを予定しております。 (Windows 版のバイナリアーカイブの公開は、2.0.19 公開 1ヶ月後を予定) それに先立ち、Namazu 2.0.19 RC1 を公開いたします。 この Namazu 2.0.19 RC1 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 現在のところドキュメント類の準備はまったくできていません。 2.0.19 pre1 と基本的には変わりません。 Namazu 2.0.19 RC1 を以下に置きました。 ・アーカイブファイル 1391522バイト http://www.namazu.org/test/namazu-2.0.19RC1.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.19RC1.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.19RC1.tar.gz.md5 (978a07eea1e4968fb7b43ff9ac1079fe *namazu-2.0.19RC1.tar.gz) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.19RC1.tar.gz.sha1 (ae1becea5f85a93c9ad478fa7113870549d5022b *namazu-2.0.19RC1.tar.gz) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://www.openpksd.org/ http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://pgp.dtype.org/ Known Problem なし - 動作チェックに協力していただける方募集 動作チェックに協力していただけるボランティアを募集いたします。 手伝っていただける方は名乗りを上げていただけると助かります。 (動作確認できる OS 等の環境もお知らせください。) 皆様、ふるってご参加ください。 募集期間: 2009年3月11日まで 動作チェック期間: 2009年3月11日まで 対象OS: Linux, FreeBSD, OpenBSD, NetBSD, Solaris, Windows, MacOS X 他。 同じ OS でも複数の方が動作チェックに協力していただけると嬉しい です。 資格: - Namazu をソースからコンパイルできる環境を整えられる方。 - Namazu 2.0.18 のソースをコンパイルした経験のある方。 - Namazu のインストール、アンインストール経験のある方。 動作チェック方法(1): namazu-2.0.19RCX.tar.gz を展開後、コンパイル+インストールした上で、 make check を行ってください。 次にその結果を報告してください。 また、tests/test-log の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 動作チェック方法(2): 1. pltests に移動し、perl alltests.pl を実行します。 画面にチェック結果が出力されます。また、test-log ファイルに ログが出力されます。 2. OS, Perl のバージョンをお知らせください。 3. 画面に出力された結果をお知らせください。 4. test-log の中の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 以上が最低限の動作確認と考えていますが、更に手元のデータで 検証していただけるのであれば、なお嬉しいです。 そちらで、何か不具合が確認されましたら、その内容を報告して ください。 注意事項: - Namazu 2.0.18 でも同じように生じる不具合に関しては、致命的な ものでない限り、2.0.19 で修正することは見送ります。 (2.0.19 のリリースを優先します。) 次の 2.0.20 には反映したいと思いますので、報告は随時受け付けます。 - rpm などのパッケージは用意しておりません。ソースからコンパイル して動作確認してください。 - 大切な文書はバックアップを取った上でご使用ください。十分注意して おりますが、開発中のもののため、対象文書を削除する危険がある かもしれません。 - 開発環境再構築のため 2.0.18 までの環境と異なっています。 (特に AutoTool 関係) コンパイルでトラブルが起こるかもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1145] Re: pdfのタイトルで検索をしたい
寺西です。 森田 光貴 wrote: そのためレベニンRを検索したいときには 検索窓に『+title:レベニンR or レベニンR』と入力する必要があると思うのですが これをなんとか検索窓に『レベニンR』としただけで 上記の検索式に相当することができないかと考えています。 入力文字列からクエリを作成して、CGI を呼び出せば良いだけですから、 その方法としてはいろいろあるかと思いますが...。 # ほとんど Namazu とは関係ない話ですね。 たとえば、JavaScript を使って入力文字列を加工してクエリを作成し、 namazu.cgi を呼ぶようなことは簡単にできますよね? NMZ.head.* に JavaScript でそういう加工を行うプログラムを仕込めば 良いのです。 JavaScript はダメだという条件があるなら、ラッパ CGI を作って namazu.cgi の代わりにラッパ CGI を呼び出し、 そのラッパ CGI の内部で文字列を加工して、namazu.cgi を呼び出せば 良いだけです。 いずれにしても何らかのプログラムは必要になりますが、それは文字列加工 するだけの単純で簡単なものです。 あるいは namazu.cgi は使わず、Search::Namazu をつかった Perl スクリプトで CGI を作ればより自由度の高い検索クライアントを作る こともできます。(ただし便利な機能は用意されていないので、自力で 追加する必要はありますが...。) NMZ.head.jaに記述を行ってなんとかと思ったのですが、 手がでない状態です。 ご自分で手に負えないなら、業者に頼めば良いのではないでしょうか。 簡単なプログラムですから、CGI やら JavaScript のプログラムの作成 を行っているところなら安価で請け負ってくれるんじゃないかと 思いますよ。 -- = 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1121] Re: 教えてください
寺西です。 # plain text 形式でお送りください。 # 「投稿のマナー」をお読みください。 # http://www.namazu.org/ml.html#html Takseshi Sakata(坂田 毅) wrote: Namazu 2.0.14 for Win32 β版 を現在使っています。 : Namazu 2.0.18 をに変更したいのですがどのファイルを入れ替えたら良いの かお教えください。よろしくお願いします。 Namazu for Windows のことは [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] にご質問ください。 http://www.namazu.org/ml.html#subscribe -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1117] Re: namazurc 内の設定について
寺西です。 # 全文引用はやめましょう。 # see http://www.namazu.org/ml.html#misc [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: アパッチのドキュメントルートを変更したのですが、 ... 何か設定がおかしいのでしょうか?。またはインデックスがこ われている? 設定が正しくないので、結果が望むものではないのでしょう。 Apache の ドキュメントルートを何から何に変更したのかわかりませんし、 インデックス対象の文書ファイルはどこにあるのかわかりませんし、 インデックスをどこで作成したのか分かりませんし、 Replace でどのように URI の置換を行いたいのかわかりませんので、 具体的には何ともお答えしようがありません。 namazu, namazu.cgi の URI 置換機能というのは、 NMZ.field.uri に文書ファイルのパス名を namazurc(.namazurc) で設定 した Replace に従って URI 置換を行うものです。 NMZ.field.uri の中身を見て、これをどのような URI に置換すれば良い のかを考えて Replace にその置換パターンを設定してください。 正しく設定できれば望む結果が得られるでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1112] Re: mknmz コマンド実行時に以下 のエラーがでてしまいます。
寺西です。 mknmzも無事動きました。 お手も間ととえらせました。 とにかく無事コンパイルできておめでとうございます。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: make clean して、 configure からやり直してみてください。 その時に何かエラーでませんか? 寺西さんのサイトを見て、もう1回ダウンロードし、別の場所 に解凍後、インストールしてみました。 エラーでませんでした。 なぜ? たぶん、KAKASI のコンパイルの途中で中断したとか、エラーになったことが あったのではないかと思います。 その後、make clean を実行していなかったので、壊れたオブジェクトファイル が更新されず、それをリンクして libkakasi.so が作られたので壊れた libkakasi.so ができたのではないでしょうか。 普通は make だけで壊れたオブジェクトが作り直されるはずですが、残念なが らそうではなかったということではないかと推測されます。 # KAKASI の依存関係に何か問題があるのかもしれません。 同じことで困る人は少ないとは思いますが、さすがにこれは予測不能ですね。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1110] Re: mknmz コマンド実行時に以下 のエラーがでてしまいます。
寺西です。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: ロードしてから、 ロードしてから?って、いったい何をしたのでしょう。 ...無視ぜず答えてくださいな。 すみません。 ldd /usr/local/lib/libkakasi.so のようなコマンドを行ったと思います。 それはロードではありませんね。 # man ldd で調べてみてください。 kakasi_do が未定義ということは、libkakasi.so が正しく作られていない ということかもしれません。 どうやら、libkakasi.so が正しく作られていないようです。 もう一回makeしてみましたが、エラーらしいものは、でません でした。 make clean して、 configure からやり直してみてください。 その時に何かエラーでませんか? $ objdump -t /usr/local/lib/libkakasi.so | grep kakasi_do と実行するとどうなるでしょう。 何もでてきませんでした。 明らかに libkakasi.so がおかしいです。問題の原因は libkakasi.so が 正しく作成されていないということでまず間違いありません。 ただ、何故 libkakasi.so が正しく作られていないかについては少々謎では あります。 $ gcc test.c -I /usr/local/include -L /usr/local/lib -lkakasi でコンパイルした時、エラーが発生しませんか? エラーでました。 # gcc test.c -I /usr/local/include -L /usr/local/lib /tmp/cc3OuHCo.o: In function `main': test.c:(.text+0x19): undefined reference to `kakasi_do' collect2: ld はステータス 1 で終了しました libkakasi.so が正しく作られていないため、リンクに失敗しているよう です。 同じ理由で Text::Kakasi で libkakasi.so がリンクできていないという ことになります。 libkakasi.so が正しく作られればコンパイルでエラーはでませんし、 Text::Kakasi もロードできるようになります。 エラーができれば、できるのでしょうか?↓ できたバイナリ a.out を実行して はい。libkakasi.so が正しく作られていれば、a.out が作られて実行でき ます。 ただ、これは問題を切り分けるために libkakasi.so が正しく作られてい るか否かを調べるための作業でした。 ここまでで libkakasi.so が正しく作られていないことがわかりましたので、 次は libkakasi.so を正しく作るための作業に移りましょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1108] Re: mknmz コマンド実行時に以下 のエラーがでてしまいます。
寺西です。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: ロードしてから、 ロードしてから?って、いったい何をしたのでしょう。 ...無視ぜず答えてくださいな。 それはともかく $ ldd `which kakasi` の結果は? []# ldd `which kakasi` linux-gate.so.1 = (0x0011) libc.so.6 = /lib/libc.so.6 (0x027fb000) /lib/ld-linux.so.2 (0x00241000) ちょっと勘違いしていました。kakasi は libkakasi のシェアード ライブラリをリンクしていませんでした。だから、kakasi が動いても、 libkakasi が正しく動く保障はありませんでした。 で。 $ ldd /home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so とやるとどうなりますか? []# ldd /home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so linux-gate.so.1 = (0x0011) libkakasi.so.2 = /usr/local/lib/libkakasi.so.2 (0x00114000) libc.so.6 = /lib/libc.so.6 (0x0025e000) /lib/ld-linux.so.2 (0x00241000) シェアードライブラリ /usr/local/lib/libkakasi.so.2 は見つかって いますね。 となると、arch/auto/Text/Kakasi/Kakasi.so がロードできない理由とは 何でしょうね。う〜む。 -e test_harness(0, 'blib/lib', 'blib/arch') t/*.t t/01-func..NOK 1Can't load '/home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so' for module Text::Kakasi: /home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so: undefined symbol: kakasi_do at /usr/lib/perl5/5.8.8/i386-linux-thread-multi/DynaLoader.pm line 230. kakasi_do が未定義ということは、libkakasi.so が正しく作られていない ということかもしれません。 KAKASI をコンパイルした時に何もエラーはでていませんか? $ objdump -t /usr/local/lib/libkakasi.so | grep kakasi_do と実行するとどうなるでしょう。 test.c という名前で以下のファイルを作成し、 ===ここから #include stdio.h #include libkakasi.h main() { kakasi_do(); } ===ここまで $ gcc test.c -I /usr/local/include -L /usr/local/lib -lkakasi でコンパイルした時、エラーが発生しませんか? できたバイナリ a.out を実行して $ ./a.out エラーがでませんか? $ ldd a.out の結果は? libkakasi.so が問題ないとなると、あとは Perl からの読み込み処理で 問題が起こっているということになるかと思います。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1106] Re: mknmz コマンド実行時に以下 のエラーがでてしまいます。
寺西です。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: ロードしてから、 ロードしてから?って、いったい何をしたのでしょう。 make testをやってみたのですが、まだエラーがでます。 PERL_DL_NONLAZY=1 /usr/bin/perl -MExtUtils::Command::MM -e test_harness(0, 'blib/lib', 'blib/arch') t/*.t t/01-func..NOK 1Can't load '/home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so' ロードできてませんね。 $ ldd /home/fedora/Text-Kakasi/blib/arch/auto/Text/Kakasi/Kakasi.so とやるとどうなりますか? Can't locate auto/Text/Kakasi/xs_getopt_a.al in @INC (@INC contains: t /home/fedora/Text-Kakasi/blib/lib /home/fedora/Text-Kakasi/blib/arch /usr/lib/perl5/site_perl/5.8.8/i386-linux-thread-multi /usr/lib/perl5/site_perl/5.8.7/i386-linux-thread-multi /usr/lib/perl5/site_perl/5.8.6/i386-linux-thread-multi /usr/lib/perl5/site_perl/5.8.5/i386-linux-thread-multi /usr/lib/perl5/site_perl/5.8.8 /usr/lib/perl5/site_perl/5.8.7 /usr/lib/perl5/site_perl/5.8.6 /usr/lib/perl5/site_perl/5.8.5 /usr/lib/perl5/site_perl /usr/lib/perl5/vendor_perl/5.8.8/i386-linux-thread-multi /usr/lib/perl5/vendor_perl/5.8.7/i386-linux-thread-multi /usr/lib/perl5/vendor_perl/5.8.6/i386-linux-thread-multi /usr/lib/perl5/vendor_perl/5.8.5/i386-linux-thread-multi /usr/lib/perl5/vendor_perl/5.8.8 /usr/lib/perl5/vendor_perl/5.8.7 /usr/lib/perl5/vendor_perl/5.8.6 /usr/lib/perl5/vendor_perl/5.8.5 /usr/lib/perl5/vendor_perl /usr/lib/perl5/5.8.8/i386-linux-thread-multi /usr/lib/perl5/5.8.8 .) at /home/fedora/Text-Kakasi/blib/lib/Text/Kakasi.pm line 84 ん〜。5.8.5〜5.8.7 まで検索しているのはおかしいのでは? たぶん、kakasi コマンドを実行してもエラーが発生するのでは? ... KAKASI - Kanji Kana Simple Inverter Version 2.3.4 Copyright (C) 1992-1999 Hironobu Takahashi. All rights reserved. おっと。予想に反して kakasi は動きますね。 $ ldd `which kakasi` の結果は? -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1104] Re: mknmz コマンド実行時に以下 のエラーがでてしまいます。
寺西です。 # ちょっと補足。 Tadamasa Teranishi wrote: とエラーメッセージがあるように arch/auto/Text/Kakasi/Kakasi.so のロードが出来ていませんね。 KAKASI のシェアードライブラリを (デフォルトなら) /usr/local/lib/libkakasi.so にインストールされたかと思いますが、 これがロードされていないのではないでしょうか。 Text-Kakasi モジュールは、arch/auto/Text/Kakasi/Kakasi.so とリンク されています。 arch/auto/Text/Kakasi/Kakasi.so は、KAKASI をインストールした時に インストールされる libkakasi.so にリンクされています。 このため、Text-Kakasi を起動する時に、arch/auto/Text/Kakasi/Kakasi.so をロードしますが、ここで更に libkakasi.so をロードします。 しかし、libkakasi.so が見つからなければ、arch/auto/Text/Kakasi/Kakasi.so のロードに失敗するということになります。 なお、KAKASI ではなく ChaSen の話ですが、類似の話を namazu-users-ja#1091, #1093 に書いていますので、こちらも参考にしてください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1101] Re: インデックス作成でエラー
寺西です。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: インデックスを分割して作成することは推奨しています。 ... このような場合は、 ヘッダ部 NMZ.head.ja ... が表示されなかったのですが、何か指定する方法は、あるので しょうか? Namazu 説明書の 「複数のインデックスを選択する」の雛形ファイル(テンプレート)の ところを参考にしてください。 http://www.namazu.org/doc/manual.html.ja#form-idxnames 複数のインデックスを検索する場合、テンプレートとして使うファイル (NMZ.head.xx 等)をどのインデックスのものとするのか勝手には決められ ないためです。 Template を指定した場合は Template の場所のものを使いますので、 どれかのインデックスからテンプレートをコピーしてください。 Template を指定しなかった場合は、上記の URL に書かれた順で選択され ます。 なお、複数インデックスを検索する場合には、単一のテンプレート (NMZ.head.xx) を使うことになるため、 「現在、XX の文書がインデックス化され、XX 個のキーワードが登録 されています。 インデックスの最終更新日: 」 という箇所は削除してご利用ください。 これは個々のインデックスの NMZ.head.xx に書かれた内容を集計する 機能はないため、複数のインデックスの合計等をテンプレートに書く ことはできないためです。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1099] Re: インデックス作成でエラー
寺西です。 [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] wrote: syslog に何か記録されていませんか? 何も記録されていませんか? その後、インデックスを削除し、 65個のHTMLファイルのインデックスの再作成をおこなって いるのですが、同様のエラーがでず、かれこれ2週間以上イン デックス作成をしているようです。 2週間も実行していますが、ちゃんと中間ファイルやらログ等を確認して、 無限ループに入っていないということを確認されていますか? 通常の運用でもそうですが、検証する場合はそれほど大量のファイルを インデックスするのはあまり適しているとはいえないでしょう。 なお、本当に遅いだけなら... NKF, KAKASI(分かち書きに KAKASI を用いている場合) は Perl モジュール 版を利用されているでしょうか? そもそも pltests は合格しているのでしょうか? 通常は、文書ファイルの数が多い場合は、文書ファイルを分けて インデックスを作成します。(複数のインデックスに分ける) Namazu-users-ja#1096 でも、 インデックス作成対象のファイルをいくつかに分けて、それぞれ別の インデックスを作成するようにすると、問題の HTML が見つかるかもしれ と書いたように、インデックスを分けて検証するのが楽で良いです。 また、mknmzrc の $ON_MEMORY_SIZE パラメータを調整することで 処理時間を短縮することも可能です。 実績としてインデックスを作成するのにどのくらいの時間がか かるのでしょうか? 使用するマシンの性能、処理する文書の種類とその内容、 mknmz から利用するツールの種類(Perl モジュール版か否かを含む)、 mknmzrc の設定、インデックスの分割数等に依存するため、 単純に求めることはできません。 また、インデックス作成途中で、作成できた分のインデックス を検索対象にするのは、無理なのでしょうか? 作成中のものは中間ファイルとして存在しますが、これは本来のインデックス とは異なるため、検索はできません。 しかし、このことは問題にはなりません。何故ならいくらでも回避方法が あるからです。 (分割して合成するみたいなことは可能?) インデックスを分割して作成することは推奨しています。 マージする場合には nmzmerge コマンドを利用しますが、インデックス はマージせずに、複数のインデックスを検索対象にすることができます ので、マージしなくても目的は果たせることが多いです。 また、インデックスは削除ファイルを無視して追加もできますので、 少しずつインデックスにファイルを追加していくということもできます。 この場合は、前回作成したインデックスは検索が可能です。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1091] Re: Text-chasenをmknmzに 組み込めない
寺西です。 morita wrote: http://www.daionet.gr.jp/~knok/chasen/ を参考に, Makefile.PL の WriteMakefile に LIBS に -lstdc++ を追加しました. ChaSen legacy のチェックはしていませんが、 http://www.asahi-net.or.jp/~yw3t-trns/namazu/chasen/index.htm に(legacy でない)ChaSen のインストール方法をまとめています。 ご参考までに。 となり,どうもmodule_chasenを組みこんでくれていません. ... なので,text-chasenのインストールまではうまくいって,namazu のインストールのところで,text-chasenの組み込みに失敗するようです. たぶん Text-ChaSen が正しく動作していないのでしょう。 $ perl -MText::ChaSen -e と実行してエラーが出れば正常動作していません。 Text-ChaSen が正常動作していないなら、Namazu は Text-ChaSen を 組み込みません。 Text-ChaSen を正常動作させるのが先ということになるでしょう。 今回,何がよくないのか分からずかれこれ休日を半日費やし調べたのですが, 結論がでないので,どうすれば問題を回避できるか, ご教示いただけないでしょうか? Text-ChaSen が正常動作しないのは、 シェアードライブラリ ChaSen.so のロード時に、必要な別のシェアード ライブラリが見つからないのではないかと思います。 $ objdump -p ChaSen.so | grep .so とやって必要なシェアードライブラリを調べ、/etc/ld.so.conf に記述 されたパスにシェアードライブラリが含まれるかどうか確認してみま しょう。 なお、「Perl モジュールの代わりに .exe 実行コマンドを使うには」 という内容で Namazu インストール後に Perl モジュールの代わりに コマンドを使うように設定を変更する方法を書いています。 本件とは逆で Windows 向けの内容となっていますが、Namazu インストール 後に、chasen コマンドを Text-ChaSen に設定を変更する場合にも 参考になるでしょう。 http://namazu.asablo.jp/blog/2008/03/26/2851191 この切り替えのためだけに、Namazu の再インストール作業を行う必要は ありません。(もっとも、その方が何も考えずにできるので楽という方も いらっしゃるでしょうけれども。) -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1053] Re: gcnmz が 非常な時間を要するようになった
寺西です。 野宮 賢 / NOMIYA Masaru wrote: # mknmz -azEK update ~/News.nmz ~/var/news と,日々走らせています.( ~/var/news 配下には,凡そ 63.5万ファイルがあります). インデックス分けたらどうでしょうか? 2つに分けると、通常、個々のインデックスの作成時間は1/2以下になります。 gcnmz も同様に個々の処理時間はそれぞれ 1/2 以下になり、トータル時間は 短縮されます。 また、-a を日常的に使うのはどうかと思いますよ。 考えられる原因は,従来,text/plain で取り込んでいたものを text/html 形式で 取り込むようにし,その多くのファイルが, Content-Transfer-Encoding: base64 Content-Disposition: inline Content-Type: image/jpeg Content-ID: shimbun.inline.0.0.256020.20370762.20370762%news.japan.cnet.com /9j/4RmlRXhpZgAASUkqAAgLAA4BAgAgkg8BAgAFsgAAABABAgAHuAAA [...] pvvt9asB8f3fxpoln//Z という形式の添付ファイルを含むからでは?,と考えています. まぁそうでしょう。 (申し訳ありませんが,著作権の関係でファイルをお見せすることは出来ません ならば、自力でなんとかしてくださいとしか言えません。 何せ、どんな形式のファイルなのかもわからないのでは、対応しようが ありませんから。 この base64 な添付ファイルを含むものが増えた為に時間が掛かるようになった, という理解は間違いでしょうか? あまりにも情報が少ないので何ともいえませんが、その可能性が高い のではないでしょうか? たぶん、インデックスのサイズがその前後で随分変わったんではないかと 思いますよ。 何とか gcnmz に要する時間を短縮したいのですが,方策を思い付きません. よくわかりませんが、text/html 形式で取り込む前に、添付ファイルを削除 する処理を追加すれば良いのではないかと思います。 そうすれば、インデックス作成時間も短縮されるでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1032] Re: [Namazu-devel- ja 1673] Namazu 2.0.17RC6 公開 + 動作チェックに協力していた だける方募集
寺西です。 野宮 賢 / NOMIYA Masaru wrote: 寺西さんNKF: module_nkf (2.0.8) 寺西さん NKF 2.0.8 は微妙なバージョンです。 えっ,そうなんですか? NKF の最新バージョンですが、2.0.7 から 2.0.8 の間の修正でちょっと問題 があったりで、パッチが出ていたりします。 また、Namazu で使う分には 2.0.7 以降の修正は必要ないです。 2.0.8 での修正によるメリットよりも、修正されたことによる悪影響の方が ちょっと心配なバージョンです。 ということで微妙なバージョンです。けっしてダメなバージョンということ ではありません。 寺西さん 2.0.18RC1 はインストールはされていますよね? はい,インストールしています. が,どうにも不思議ですので,今一度,./configure make make uninstall make install をしてみました(何となく,思い当たる節がありますので). その思い当たる節とはどのようなことだったのでしょうか? -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1020] Re: インデッ クス作成と、CGI 実行を別 々のサーバーで行う場合
寺西です。 qa_n_no wrote: CGI実行側のサーバAで2.0.13を使い、 インデックス作成側のサーバBで最新版を使うことによる問題はありますでしょ うか。 Web サーバで Namazu 2.0.13 を使うこと自体に問題があります。 http://www.namazu.org/security.html サーバAはすでにNamazu2.0.13がインストールされていて、 私は手出しが出来ないので、2.0.13を使わざるを得ない状態です。 あなたがどのような立場なのかは知りませんが、Web サーバの Namazu の バージョンアップを要求するべきでしょう。 それがかなわないのなら、別のサーバでインデックスを作ってそれを使う といったシステムを構築するのは断るべきでしょう。 # ...と私は思いますが。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1022] Re: インデッ クス作成と、CGI 実行を別 々のサーバーで行う場合
寺西です。 qa_n_no wrote: サーバA,サーバBで最新のNamazuを使用した場合での インデックス作成と、CGI 実行を別々のサーバーで行うことについて その他に問題点はありますでしょうか。 最新版の Namazu 2.0.17 なら大きな問題はないでしょう。 あえてあげるとしたら、ファイル名/ディレクトリ名の制限と、インデックス ファイルをコピーする際の問題ぐらいかと思います。 [ファイル名/ディレクトリ名の制限] UNIX - UNIX や Windows - Windows の場合はこれくらいでしょうか。 - ファイル名、ディレクトリ名は、英数字と一部の記号でのみ構成すること。 - スペースは含めない。 - 特殊な記号は使わない。 - 漢字は含めない。 UNIX - Windows や Windows - UNIX の場合は更に制限が掛かります。 - 相手側の OS のファイル名/ディレクトリ名として使用できない文字、 文字列を使わない。 [インデックスファイルをコピーする際の問題] - サーバ B からサーバ A へインデックスをコピーしている間、検索が できませんし、その間は CGI の実行を避けるべきです。 - インデックスを別の場所にコピーして、コピーが完了した時点で、 .namazurc で指定するインデックスの場所を変えるとか工夫するのが 良いでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1018] Re: インデッ クス作成と、CGI 実行を別 々のサーバーで行う場合
寺西です。 qa_n_no wrote: サーバAとサーバBでインデックス作成とCGI実行を別々にしたいと思います。 ... この方法で何か問題点はありますでしょうか。 Namazu 2.0.13 は使わず、必ず最新版の Namazu を使いましょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1016] Re: PDF検索 について
寺西です。 Ikegi Arata wrote: 強調文字も当然ありません。先頭数行ではなく、最初にキーワードが ある箇所の前後数行という表示にはならないのでしょうか。 現状ではなりませんね。 この要約部分というのは、この文書がどのような内容のものかを示すもの にすぎず、検索語近辺の文書を表示するものではないためです。 現在のところ PDF に限らず、文書の要約はインデックス作成時に作成し ます。要約は主に文書の先頭部分から作られ、NMZ.field.summary に1文書 1行単位で保存されます。*1 文字列の最大長は $MAX_FIELD_LENGTH で指定できますが、デフォルトで 200文字、最大でも1024文字までとなっています。 つまり、要約部分は表示されている部分のテキストしかインデックスには 保存されておらず、それ以外の領域のテキストはインデックスにはありま せん。 将来的には、インデックス作成時に抽出したテキスト全てを圧縮して インデックスに保存することで、この機能を実装するかもしれません。 しかし、インデックスの巨大化は避けられないでしょう。 なお、該当文書を nmzcat でテキストの抽出が可能ですので、これと検索語 から、検索語近辺の文書を抽出する CGI を作成して組み合わせれば、 それらしいものが作れなくもないとは思いますが...。 *1 これは、フィルタや後処理によって、NMZ.field.summary の中身を書き 換えることが可能であるということにもなります。これにyり、静的では ありますが、要約を好きな文書に書き換えるということもできます。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1013] Re: ゞ を含む text/html 形式の ファイルで mknmz がエラ ーを吐く
寺西です。 野宮 賢 / NOMIYA Masaru wrote: 寺西さん text/plain でも発生しますか? 寺西さん 再現可能な最小限のファイルをご提示ください。 はい,ゞ を入力しただけの text/plain ファイル(文字コードは,ISO-2022-JP)で も再現します. そのファイル名を text.txt とした場合、 $ kakasi -w -ijis -oeuc text.txt | od -tx1 の結果はどうなりますか? KAKASI のバージョンは? Text-KAKASI, KAKASI はソースからインストールしましたか? 寺西さん Text-Kakasi を使わないという手はあるかもしれません。 確かに,Text-Kakasi を外すと,無事 INDEX が作成されました. ChaSen なり MeCab を使うとという意味です。 問題の切り分けに Text-Kakasi ではなく、KAKASI を使ってみるというのも 方法ですけど。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 1006] Re: シンボリ ックリンクへの参照について
寺西です。 masaaki watanabe wrote: Namazu2-2.0.17を使用しております。 これはパッケージ名でしょうか? よく分かりませんが、Namazu 2.0.17 ってこと?? 自サーバ上にTESTディレクトリを作り、その下にTEST1、TEST2、TEST3と言うディ レクトリをシンボリックリンクで張る。 そのシンボリックリンクするフォルダ自体は、他サーバーのディレクトリを自サー バーにマウントしたディレクトリ配下のディレクトリです。 シンボリックリンクうんぬんより、他のサーバのディスクってことの方が 重要な話なんではないかと思いますが、何故最初のメールにそのことが書かれ ていなかったのでしょう。 それでマウントは NFS でしょうか? この状況で、TESTディレクトリ以下のフォルダを対象にindex作成をしたのです が、対象ファイルが見つかりませんとのメッセージが出て終了。 そもそもシンボリックリンクはる必要があるのでしょうか? マウントしたディレクトリを読みに行けば良いだけでは? その時のコマンドは mknmz -U /usr/local/www/TEST -C /usr/local/var/namazu/index/TEST 嘘でしょう。もう一度見直してみてください。 インターネット上で検索した時は、「namazu2になってから、シンボリックを廻 らない」と言う書き込みがあったので、そう思っていたのですが、環境によって はシンボリックは可能って事なんでしょうか? 環境によらず今の Namazu はシンボリックリンクに対応しています。 # が、あくまでもローカルディスクの話。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 977] Re: samba上 のインデックス作成時の権限エラ ー
寺西です。 Yukio USUDA wrote: smbmount ではなく nfs の例ですが 似たような現象があります。 http://www.namazu.org/ml/namazu-users-ja/msg7.html 補足すると、 http://www.namazu.org/ml/namazu-users-ja/msg6.html にあるように、通常は mknmzは対象ファイルのリストを作るときに perl の -r演算子 -r File is readable by effective uid/gid. を用いてファイルが読み込み可能か確認します。もし読み込み不可 ならば、そのファイルを除外します。よって、インデックス作成の 途中で permission deniedで停止してしまうことはまずありません。 です。ただ、当時以降でバグが入った可能性はあります。 また、 しかし、root権限で NFS上のファイルに対して mknmz を実行する という多田さんの環境では、 -r は通過するけど実際に open する ときに、 permission denied が起きてしまうわけですよね。 と root + NFS での話がありますが、smbmount の場合にはアクセス許可 がない場合には -r は通過するが実際に open する時に permission denied が起きてしまうのかもしれません。 Windows の場合にも同様のことがあって、NTFS のアクセス権を ActivePerl が見ないため、-r は通過するが open する時に permission denied が 起きました。(これは対応済みです。) http://www.namazu.org/pipermail/namazu-win32-users-ja/2006-February/001192.html そんなわけで 通常のファイルだとスキップするはずです。smbmount 固有の問題でしょう かねぇ? という話になりますが、とりあえずは --debug オプションの結果をお待ち しています。 # たぶん、util::canopen を改良すればスキップできるようになるとは # 思いますけど。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 965] Re: 拡張子の 無いファイルのインデックスにつ いて
寺西です。 # マルチパートのHTMLメールの使用は控えてください。 aida wrote: この度NAMAZU2.0.17(Linux)をインストールいたしました。 「拡張子の無いファイルはインデックス化しない」といった記述は可能でしょ うか? 可能ですが、そもそも標準では拡張子のないファイルは対象外となって いるはずです。 やりたいことは、「拡張子の無いファイルはインデックス化しない」という ことではなくて、「拡張子のあるファイルは全てインデックス化したい」と いうことでしょうか? もう少し具体的に何がしたくて、どんなことに困っているのか説明して ください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 967] Re: 拡張子の 無いファイルのインデックスにつ いて
寺西です。 Hideyuki SHIRAI (白井秀行) wrote: 白井です。釈迦に説法ですが。。。 いえいえ。別に釈迦では...。 可能ですが、そもそも標準では拡張子のないファイルは対象外となって いるはずです。 拡張子を持たずとも、数字だけのファイル名は対象になっています。 おお。 |.*\\.eml|\\d+|[-\\w]+\\.[1-9n]; メール用ですね。忘れてました。 数字だけのものも除外したいということなら mknmzrc の $ALLOW_FILE を 編集して \\d+ のところを次のように削除してください。 |.*\\.eml|[-\\w]+\\.[1-9n]; なお、デフォルトではコメントアウトされているので、$ALLOW_FILE の ブロックの先頭文字 '#' を削除する必要があることに注意してください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [#x30E1;#x30FC;#x30EB;#x30A2;#x30C9;#x30EC;#x30B9;#x4FDD;#x8B77;] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 962] Re: xlhtmlの 無限ループについて
寺西です。 メイルの文字コードは ISO-2022-JP (いわゆる JIS) でお願いします http://www.namazu.org/ml.html.ja#html -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 953] Re: [Namazu-devel- ja 1508] Namazu 2.0.17RC5 公開 + 動作チェックに協力していた だける方募集
寺西です。 Tadamasa Teranishi wrote: Namazu 2.0.17 のリリースを予定しております。 それに先立ち、Namazu 2.0.17RC5 を公開いたします。 この Namazu 2.0.17RC5 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 MeCab 0.94 がリリースされましたが、現在手元の環境ではコンパイルでき ていません。 このため、MeCab 0.94 での動作確認はできていません。 動作確認できる方はよろしくお願いいたします。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 952] Namazu 2.0.17RC5 公開 + 動作チェックに協 力していただける方募集
寺西です。 Namazu 2.0.17 のリリースを予定しております。 それに先立ち、Namazu 2.0.17RC5 を公開いたします。 この Namazu 2.0.17RC5 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 # namazu-devel-ja 向きの内容ですが、 # 2.0.17RC1 より namazu-user-ja にも CC: しておきます。 ・アーカイブファイル http://www.namazu.org/test/namazu-2.0.17RC5.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.17RC5.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.17RC5.tar.gz.md5 (MD5sum: 32a66d6904ede2821f979b8ed80032cb) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.17RC5.tar.gz.sha1 (sha1sum: df6d01cf902f56b854dedeca0404a340c086e47d) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://www.openpksd.org/ http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://pgp.dtype.org/ 2.0.17RC5 からの変更点 ・ドキュメントを更新 ・OLEコントロールフィルタの Office 2007 対応 ・実験的に msofficexml.pl, visio.pl フィルタを追加 ・nmzcat のバグ修正 Known Problem なし - 動作チェックに協力していただける方募集 動作チェックに協力していただけるボランティアを募集いたします。 手伝っていただける方は名乗りを上げていただけると助かります。 (動作確認できる OS 等の環境もお知らせください。) 皆様、ふるってご参加ください。 募集期間: 随時 動作チェック期間: 02/23〜02/26 を予定(状況により、変更の可能性あり) 対象OS: Linux, FreeBSD, OpenBSD, NetBSD, Solaris, Windows, MacOS X 他。 同じ OS でも複数の方が動作チェックに協力していただけると嬉しい です。 資格: - Namazu をソースからコンパイルできる環境を整えられる方。 - Namazu 2.0.16 のソースをコンパイルした経験のある方。 - Namazu のインストール、アンインストール経験のある方。 動作チェック方法(1): namazu-2.0.17RCX.tar.gz を展開後、コンパイル+インストールした上で、 make check を行ってください。 次にその結果を報告してください。 また、tests/test-log の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 動作チェック方法(2): 1. pltests に移動し、perl alltests.pl を実行します。 画面にチェック結果が出力されます。また、test-log ファイルに ログが出力されます。 2. OS, Perl のバージョンをお知らせください。 3. 画面に出力された結果をお知らせください。 4. test-log の中の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 以上が最低限の動作確認と考えていますが、更に手元のデータで 検証していただけるのであれば、なお嬉しいです。 そちらで、何か不具合が確認されましたら、その内容を報告して ください。 注意事項: - Namazu 2.0.16 でも同じように生じる不具合に関しては、致命的な ものでない限り、2.0.17 で修正することは見送ります。 (2.0.17 のリリースを優先します。) 次の 2.0.18 には反映したいと思いますので、報告は随時受け付けます。 - rpm などのパッケージは用意しておりません。ソースからコンパイル して動作確認してください。 - 大切な文書はバックアップを取った上でご使用ください。十分注意して おりますが、開発中のもののため、対象文書を削除する危険がある かもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 945] Namazu 2.0.17RC4 公開 + 動作チェックに協 力していただける方募集
寺西です。 Namazu 2.0.17 のリリースを予定しております。 それに先立ち、Namazu 2.0.17RC4 を公開いたします。 この Namazu 2.0.17RC4 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 # namazu-devel-ja 向きの内容ですが、 # 2.0.17RC1 より namazu-user-ja にも CC: しておきます。 ・アーカイブファイル http://www.namazu.org/test/namazu-2.0.17RC4.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.17RC4.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.17RC4.tar.gz.md5 (MD5sum: c2db95151b673afaa95a3c6594020a76) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.17RC3.tar.gz.sha1 (sha1sum: df97499c760787ba75f587c0e3ff71dd68b587ec) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://www.openpksd.org/ http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://pgp.dtype.org/ 2.0.17RC4 からの変更点 ・ドキュメントを更新 ・日付の値が不正な場合、エラーメッセージを出して日付情報を無効とする ように修正 ・mailutime の些細なバグの修正 ・autogen.sh 内の URI 変更 ・tests/namazu-cgi-9 で NAMAZUNORC の値を復帰するように修正 ・VPATH 機能のための修正 Known Problem なし - 動作チェックに協力していただける方募集 動作チェックに協力していただけるボランティアを募集いたします。 手伝っていただける方は名乗りを上げていただけると助かります。 (動作確認できる OS 等の環境もお知らせください。) 皆様、ふるってご参加ください。 募集期間: 随時 動作チェック期間: 11/18〜11/25 を予定(状況により、変更の可能性あり) 対象OS: Linux, FreeBSD, OpenBSD, NetBSD, Solaris, Win32, MacOS X 他。 同じ OS でも複数の方が動作チェックに協力していただけると嬉しい です。 資格: - Namazu をソースからコンパイルできる環境を整えられる方。 - Namazu 2.0.16 のソースをコンパイルした経験のある方。 - Namazu のインストール、アンインストール経験のある方。 動作チェック方法(1): namazu-2.0.17RCX.tar.gz を展開後、コンパイル+インストールした上で、 make check を行ってください。 次にその結果を報告してください。 また、tests/test-log の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 動作チェック方法(2): 1. pltests に移動し、perl alltests.pl を実行します。 画面にチェック結果が出力されます。また、test-log ファイルに ログが出力されます。 2. OS, Perl のバージョンをお知らせください。 3. 画面に出力された結果をお知らせください。 4. test-log の中の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 以上が最低限の動作確認と考えていますが、更に手元のデータで 検証していただけるのであれば、なお嬉しいです。 そちらで、何か不具合が確認されましたら、その内容を報告して ください。 注意事項: - Namazu 2.0.16 でも同じように生じる不具合に関しては、致命的な ものでない限り、2.0.17 で修正することは見送ります。 (2.0.17 のリリースを優先します。) 次の 2.0.18 には反映したいと思いますので、報告は随時受け付けます。 - rpm などのパッケージは用意しておりません。ソースからコンパイル して動作確認してください。 - 大切な文書はバックアップを取った上でご使用ください。十分注意して おりますが、開発中のもののため、対象文書を削除する危険がある かもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 944] Re: [Namazu-devel- ja 1384] (2.0.17RC3) VPATH を 使った時の問題
寺西です。 藤原 誠/ Makoto Fujiwara wrote: tar 形式を展開した位置でそのまま configure せずに、別にディレ クトリを作って、その中で configure する場合、つまり VPATH 機能 を使った時に、二つの問題がありましたのでお知らせします。 pltests は全く考慮していません。そのため、 (1) 問題 1 ... Making all in decodebase64 Making all in pltests sed -e 's!%PERL%!/usr/pkg/bin/perl!g' -e '[EMAIL PROTECTED]@!/usr/local/share/namazu!g' pltests.pl.in pltests.pl.tmp sed: pltests.pl.in: No such file or directory *** Error code 1 となりますね。これは 解決方法: http://www.ki.nu/~makoto/diary/attach/2006/20061106-namazu-2.0.17RC3.pltest.diff で、表面上は解決するのですが、pltests を実行するとアウトだという ことがわかります。 pltests は VPATH 機能未対応ということでお願いします。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 934] Namazu 2.0.17RC3 公開 + 動作チェックに協 力していただける方募集
寺西です。 Namazu 2.0.17 のリリースを予定しております。 それに先立ち、Namazu 2.0.17RC3 を公開いたします。 この Namazu 2.0.17RC3 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 # namazu-devel-ja 向きの内容ですが、 # 2.0.17RC1 より namazu-user-ja にも CC: しておきます。 ・アーカイブファイル http://www.namazu.org/test/namazu-2.0.17RC3.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.17RC3.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.17RC3.tar.gz.md5 (MD5sum: b579bdce11a865e1d73788f038f6d166) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.17RC3.tar.gz.sha1 (sha1sum: 890ee2e0b832ea1bb5b034eb5db35a77510b02e9) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://www.openpksd.org/ http://pgp.nic.ad.jp/pgp/ http://pgp.mit.edu/ http://pgp.dtype.org/ 2.0.17RC3 からの変更点 ・ドキュメントを更新 ・日付が 2038 年より未来の場合、日付情報を無効とするように修正 ・pltests/namazu-cgi-9 を修正 Known Problem なし - 動作チェックに協力していただける方募集 動作チェックに協力していただけるボランティアを募集いたします。 手伝っていただける方は名乗りを上げていただけると助かります。 (動作確認できる OS 等の環境もお知らせください。) 皆様、ふるってご参加ください。 募集期間: 随時 動作チェック期間: 11/05〜11/11 を予定(状況により、変更の可能性あり) 対象OS: Linux, FreeBSD, OpenBSD, NetBSD, Solaris, Win32, MacOS X 他。 同じ OS でも複数の方が動作チェックに協力していただけると嬉しい です。 資格: - Namazu をソースからコンパイルできる環境を整えられる方。 - Namazu 2.0.16 のソースをコンパイルした経験のある方。 - Namazu のインストール、アンインストール経験のある方。 動作チェック方法(1): namazu-2.0.17RCX.tar.gz を展開後、コンパイル+インストールした上で、 make check を行ってください。 次にその結果を報告してください。 また、tests/test-log の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 動作チェック方法(2): 1. pltests に移動し、perl alltests.pl を実行します。 画面にチェック結果が出力されます。また、test-log ファイルに ログが出力されます。 2. OS, Perl のバージョンをお知らせください。 3. 画面に出力された結果をお知らせください。 4. test-log の中の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 以上が最低限の動作確認と考えていますが、更に手元のデータで 検証していただけるのであれば、なお嬉しいです。 そちらで、何か不具合が確認されましたら、その内容を報告して ください。 注意事項: - Namazu 2.0.16 でも同じように生じる不具合に関しては、致命的な ものでない限り、2.0.17 で修正することは見送ります。 (2.0.17 のリリースを優先します。) 次の 2.0.18 には反映したいと思いますので、報告は随時受け付けます。 - rpm などのパッケージは用意しておりません。ソースからコンパイル して動作確認してください。 - 大切な文書はバックアップを取った上でご使用ください。十分注意して おりますが、開発中のもののため、対象文書を削除する危険がある かもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 935] Re: [Namazu-devel- ja 1368] Namazu 2.0.17RC3 公開 + 動作チェックに協力していた だける方募集
寺西です。 Tadamasa Teranishi wrote: それに先立ち、Namazu 2.0.17RC3 を公開いたします。 特に問題がないようでしたら、この 2.0.17RC3 をほぼそのまま 2.0.17 と してリリースする予定です。 この Namazu 2.0.17RC3 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 ... 動作チェック期間: 11/05〜11/11 を予定(状況により、変更の可能性あり) 2.0.17リリース日についてですが、 動作チェック数がまだまだ少ないので、数がある程度そろった時点で 決定したいと考えています。動作チェック期間は延長する可能性があります。 皆様、ご参加のほどよろしくお願いいたします。 特に Solaris 系での動作チェックを行っていただける方、いらっしゃい ませんか? -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 936] Namazu 2.0.17RC3 動作確認 (Linux RedHat9)
寺西です。 以下の環境で 2.0.17RC3 の動作確認しました。 ・ 動作確認環境 1) Linux (RedHat9) システム: linux 2.4.20-46.9 Perl: 5.008 NKF: module_nkf (2.0.7) Wakati: module_kakasi KAKASI: 2.3.4 ChaSen: 2.3.3 MeCab: 0.93 wvWare: 1.0.3 xlhtml: 0.5.1 xpdf: 2.01 ・make check の結果 All PASS です。 === All 50 tests passed === *** mknmz -C システム: linux Namazu: 2.0.17RC3 Perl: 5.008000 File-MMagic: 1.27 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: module_chasen -i e -j -F %m 和布蕪: module_mecab -Owakati -b 8192 わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /usr/local/etc/namazu LIBDIR: ../pl FILTERDIR: ../filter TEMPLATEDIR: ../template 対応メディアタイプ: (38) 未対応メディアタイプ: (6) 必要ツールが $path にないものには (-) を表示 application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl ・pltests の結果 : PASS: namazu-cgi-8.pl PASS: namazu-cgi-9.pl PASS: namazu-cgi-10.pl PASS: chasen-1.pl PASS: chasen-2.pl PASS: chasen-3.pl PASS: mecab-1.pl PASS: mecab-2.pl PASS: mecab-3.pl PASS: kakasi-1.pl PASS: kakasi-2.pl PASS: kakasi-3.pl === All 48 tests passed === *** ../scripts/mknmz -C システム: linux Namazu: 2.0.17RC3 Perl: 5.008000 File-MMagic: 1.27 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: module_chasen -i e -j -F %m 和布蕪: module_mecab -Owakati -b 8192 わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /usr/local/etc/namazu LIBDIR: /usr/local/share/namazu/pl FILTERDIR: /usr/local/share/namazu/filter TEMPLATEDIR: /usr/local/share/namazu/template 対応メディアタイプ: (39) 未対応メディアタイプ: (6) 必要ツールが $path にないものには (-) を表示 application/applefile: applefile.pl application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E
[Namazu-users-ja 939] Namazu 2.0.17RC3 動作確認 (FreeBSD 4.7 RELEASE)
寺西です。 以下の環境で 2.0.17RC3 の動作確認しました。 ・ 動作確認環境 2) FreeBSD システム: FreeBSD 4.7 RELEASE Perl: 5.005_03 built for i386-freebsd NKF: module_nkf (2.07) Wakati: module_kakasi (kakasi 2.3.4) iconv: iconv (GNU libiconv 1.8) gettext: 0.13.1 ・make check の結果 All PASS です。 === All 50 tests passed === *** mknmz -C システム: freebsd Namazu: 2.0.17RC3 Perl: 5.005030 File-MMagic: 1.27 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: no 和布蕪: no わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /home/www/dbitt000/etc/namazu LIBDIR: ../pl FILTERDIR: ../filter TEMPLATEDIR: ../template 対応メディアタイプ: (36) 未対応メディアタイプ: (8) 必要ツールが $path にないものには (-) を表示 application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl - application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl - audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl ・pltests の結果 PASS: namazu-cgi-8.pl PASS: namazu-cgi-9.pl PASS: namazu-cgi-10.pl PASS: kakasi-1.pl PASS: kakasi-2.pl PASS: kakasi-3.pl === All 42 tests passed === *** ../scripts/mknmz -C システム: freebsd Namazu: 2.0.17RC3 Perl: 5.005030 File-MMagic: 1.27 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: no 和布蕪: no わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /home/www/dbitt000/etc/namazu LIBDIR: /home/www/dbitt000/src/namazu-2.0.17RC3/pl FILTERDIR: /home/www/dbitt000/src/namazu-2.0.17RC3/filter TEMPLATEDIR: /home/www/dbitt000/src/namazu-2.0.17RC3/template 対応メディアタイプ: (36) 未対応メディアタイプ: (8) 必要ツールが $path にないものには (-) を表示 application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl - application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl - audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 925] Re: [Namazu-devel- ja 1308] Namazu 2.0.17RC2 公開 + 動作チェックに協力していた だける方募集
-- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 926] Namazu 2.0.17RC2 動作確認 (Windows XP / Office 未インストール )
寺西です。 以下の環境で 2.0.17RC2 の動作確認しました。 ・ 動作確認環境 3) Windows XP (Office 未インストール) システム: Windows XP Perl: v5.8.7 built for MSWin32-x86-multi-thread NKF: module_nkf (2.07) Text::Kakasi: 2.04 Text::ChaSen: 1.03 MeCab module: 0.92 iconv: iconv (GNU libiconv 1.10-ja) ・pltests の結果 All PASS です。 : === All 46 tests passed === *** perl ..\bin\mknmz.bat -C システム: MSWin32 Namazu: 2.0.17RC2 Perl: 5.008007 File-MMagic: 1.27 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: module_chasen -i e -j -F %m 和布蕪: module_mecab -Owakati -b 8192 わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.SJIS 言語: ja_JP.SJIS 文字コード: sjis CONFDIR: C:/namazu/etc/namazu LIBDIR: C:\namazu\share\namazu/pl FILTERDIR: C:\namazu\share\namazu/filter TEMPLATEDIR: C:\namazu\share\namazu/template 対応メディアタイプ: (16) 未対応メディアタイプ: (32) 必要ツールが $path にないものには (-) を表示 - application/excel: excel.pl application/gnumeric: gnumeric.pl - application/ichitaro4: ichitaro456.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl - application/ms-visio: olevisio.pl - application/msword: msword.pl - application/pdf: pdf.pl - application/postscript: postscript.pl - application/powerpoint: powerpoint.pl - application/rtf: rtf.pl - application/visio: olevisio.pl - application/vnd.kde.kivio: koffice.pl - application/vnd.kde.kpresenter: koffice.pl - application/vnd.kde.kspread: koffice.pl - application/vnd.kde.kword: koffice.pl - application/vnd.oasis.opendocument.graphics: ooo.pl - application/vnd.oasis.opendocument.presentation: ooo.pl - application/vnd.oasis.opendocument.spreadsheet: ooo.pl - application/vnd.oasis.opendocument.text: ooo.pl - application/vnd.sun.xml.calc: ooo.pl - application/vnd.sun.xml.draw: ooo.pl - application/vnd.sun.xml.impress: ooo.pl - application/vnd.sun.xml.writer: ooo.pl - application/vnd.visio: olevisio.pl application/x-apache-cache: apachecache.pl - application/x-bzip2: bzip2.pl - application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl - application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl - audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl - text/x-roff: man.pl -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 924] Re: Unicode(UTF-8) の使用
寺西です。 田中 wrote: NamazuでUTF-8を使用してインデックス作成、検索を行いたいと思います。 現在の安定版ソースコード(Namazu2.0.16)でUTF-8は使用可能でしょうか? Namazu 2.0.X は UTF-8 に対応していません。内部コードは EUC-JP です。 開発版(2.3.X)は UTF-8 対応ですが、開発版であり仕様変更も頻繁に行われ ます。2.0.X と互換性のない部分も多々あります。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 915] Re: cgi プロ グラムから namazu コマン ドを呼び出せる?
寺西です。 Jianwei Zhang wrote: namazu -al の結果の文書を情報抽出の対象文書とする予定です。 w_1 or w_2 or ... w_50 というような何十個の単語のdisjunctionの クエリを投げて,検索結果としての順位付けの文書リストの上位1万ぐら いまでの文書を取ろうとします。 「何十個の単語」の何十個が具体的にいくつなのかで Namazu の制限に 引っかかるかもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 904] Re: Namazu 2.0.17R C1動作確認 (SuSeLinux 10.0)
寺西です。 野宮 賢 / NOMIYA Masaru wrote: ここで,namazu-2.0.17RC1 をインストールし.mknmz,gcnmz を実行しましたとこ ろ,gcnmz で : processing NMZ.p Argument 396,754 isn't numeric in printf at /usr/lib/perl5/5.8.7/x86_64-linux-thread-multi/IO/Handle.pm line 405. Argument 885,600 isn't numeric in printf at /usr/lib/perl5/5.8.7/x86_64-linux-thread-multi/IO/Handle.pm line 405. というエラー・メッセージが表示されました. ご報告ありがとうございます。 思い当たるところがあるので、これからチェックします。 因に,namazu 2.0.16 では.このようなことはありません. ん〜、2.0.16 でもそうなっていたような気がしますが、調べてみます。 報告のみで申し訳ありませんが,宜しくお願いします. いえいえ。助かります。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 897] Re: namazuコ マンドをweb経由で実行し たい
寺西です。 NOKUBI Takatsugu wrote: At Wed, 11 Oct 2006 04:09:16 +0900, Tadamasa Teranishi wrote: # exec って B シェルで走るんじゃなかったっけ??? 忘れた...。 察するに、PHPから呼ぼうとしているように見受けられます。なのでshellは 経由しないような気がします。 あぅ。system じゃないから SHELL は呼ばないですね。 もしそうであれば、PHP側で環境変数を消す等の処理が必要です。状況が許 ですね。失礼しました。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 880] Re: [Namazu-devel- ja 1272] Namazu 2.0.17RC1 公開 + 動作チェックに協力していた だける方募集
寺西です。 NOKUBI Takatsugu wrote: 最終的なリリース目標日はいつごろになりそうでしょうか。うまく間に合え ばDebianの次のリリースにぎりぎり間に合いそうです。 当初予定では 10/29 です。 ですが、本業が忙しいので、それまでに準備できるかどうかはわかりません。 残念ながら、Fedora Core6には間に合あいませんでしたが... Fedora Core6 ってまだ Namazu パッケージのメンテナンスしているのでした っけ? -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 881] Re: Namazu 2.0.17R C1動作について
寺西です。 中島 健次 wrote: Namazu 2.0.16と 2.0.17RC1で、約6万ファイル(約3GB)をインデックスした結果 です。環境の差はNamazuのバージョンのみです。 「Size」や「Added Keywords」等は全く同じで、処理時間が約5分短縮されまし た!(約20時間かかる処理で) う〜ん、誤差の範囲ではないかと思います。 インデクサの方の修正は主にバグフィックスですので、速度が速くなるような 修正は入っていません。 もちろん、バグ修正によって処理が多少変わる部分もあるので、その結果 速くなった可能性はありますが。 namazu や namazu.cgi の方は、異常に時間がかかる不具合は修正されてい ます。 なお、約6万ファイル(約3GB)ものファイルを扱うのでしたら、mknmzrc の $ON_MEMORY_MAX をかなり大きめに設定すると、インデックスの作成時間が 短縮されると思います。 この $ON_MEMORY_MAX は、まぎらわしい名前なのですが、メモリサイズ とは関係ないので、実メモリサイズ以上の値を設定しても何の問題も ありません。 ・ 動作確認環境 1) Linux (RedHat AS) ... xlhtml: 0.5.1vd2 本件とは関係ありませんが、この 0.5.1vd2 とはどこにあるのでしょう? RedHat AS のディストリビューション用のバージョンでしょうか? -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 882] Re: Namazu のカスタマイズについて
寺西です。 syokora wrote: 同義語のデータベースを作り、それと照合して、上記の様な例 でも検索にヒットさせるためにはNamazuをカスタマイズしなけ ればならないと思うのですが、やはり、Namazuのシステムの部 分(ソースコード)も変更をしなければならないでしょうか? ねばならないのか? という問いには答えにくいのですが、変更しないで 行う方法もあれば、変更して行う方法もあるでしょう。 それぞれに長所と短所はあります。 例えば、変更しないで行う方法には、 「サーバ」から「サーバ」「サーバー」をデータベースから得られたの なら、これらの OR 検索となるような検索式を作り、それを namazu に 与えてやれば、とりあえず検索はできるでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 883] Re: namazuコ マンドをweb経由で実行し たい
寺西です。 sishii wrote: 表題の件で、namazuコマンドをweb経由で実行しようとすると 『You should use namazu.cgi instead of namazu command.』 のメッセージが表示されます。 何故、わざわざそのような表示を出して、使用しないようにしているのか をよく理解した上でお使いください。 # もっとも、その危険性を理解している方なら、以下の質問はされないので # はないかと思いますが...。 QUERY_STRING の値を消すにはどのようにしたらいいのでしょうか? SHELL について勉強する必要があるでしょう。 (1) exec(setenv QUERY_STRING; setenv SCRIPT_NAME; namazu -q keyword path/to/index); C シェルなら unsetenv ではないかと思いますが、そもそもシェルは C シェルなのでしょうか? # exec って B シェルで走るんじゃなかったっけ??? 忘れた...。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 874] Re: [Namazu-devel- ja 1272] Namazu 2.0.17RC1 公開 + 動作チェックに協力していた だける方募集
寺西です。 # またミスが...。 Tadamasa Teranishi wrote: 募集期間: 随時 動作チェック期間: 4/5〜4/8 を予定(状況により、変更の可能性あり) 10/7〜10/15 を予定(状況により、変更の可能性あり) RC2 が公開された場合は、その時点でRC1の動作チェックは終了、 RC2 の動作チェック期間がスタートすることになります。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 870] Namazu 2.0.17RC1 公開 + 動作チェックに協 力していただける方募集
寺西です。 Namazu 2.0.17 のリリースを予定しております。 それに先立ち、Namazu 2.0.17RC1 を公開いたします。 この Namazu 2.0.17RC1 のコンパイル + 動作チェックをしていただける方を 広く募集しておりますので、皆様ご参加のほどよろしくお願いします。 # namazu-devel-ja 向きの内容ですが、 # 2.0.17RC1 より namazu-user-ja にも CC: しておきます。 ・アーカイブファイル http://www.namazu.org/test/namazu-2.0.17RC1.tar.gz ・署名ファイル http://www.namazu.org/test/namazu-2.0.17RC1.tar.gz.sig ・MD5sumファイル http://www.namazu.org/test/namazu-2.0.17RC1.tar.gz.md5 (MD5sum: c16b11a297eb39a46c2bf319aed9cd99) ・sha1sumファイル http://www.namazu.org/test/namazu-2.0.17RC1.tar.gz.sha1 (sha1sum: 50bcde832a6c7be84e2d41fa7fa95cb14c74ee4c) 配布アーカイブには PGP による電子署名を行なっています。 署名は寺西忠勝の個人の鍵 (Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E) にて行なわれています。 この鍵は以下の PGP 公開鍵サーバ他より検索/取得が可能です。 http://pgp.nic.ad.jp/pgp/ http://pgp.dtype.org/ 2.0.17pre1 からの変更点 ・Cygwin で、I won't mmap that file, using a slower method という メッセージが出るため、wvWare の STDERR を捨て修正を加えました。 ・ja-namazu-cgi で、namazu.cgi に引数を与えている部分を変更しました。 また、デバッグ用に tests/test-log に検索結果を書き込むように 変更しました。 ・namazu, namazu-cgi でメモリを壊していた部分を修正 (Interix で namazu-9 が fail する問題の対策、おそらく FreeBSD 5.2-CURRENT で namazu-9 が fail するのも直るものと 思います。) Known Problem なし - 動作チェックに協力していただける方募集 動作チェックに協力していただけるボランティアを募集いたします。 手伝っていただける方は名乗りを上げていただけると助かります。 (動作確認できる OS 等の環境もお知らせください。) 皆様、ふるってご参加ください。 募集期間: 随時 動作チェック期間: 4/5〜4/8 を予定(状況により、変更の可能性あり) 対象OS: Linux, FreeBSD, OpenBSD, NetBSD, Solaris, Win32, MacOS X 他。 同じ OS でも複数の方が動作チェックに協力していただけると嬉しい です。 資格: - Namazu をソースからコンパイルできる環境を整えられる方。 - Namazu 2.0.16 のソースをコンパイルした経験のある方。 - Namazu のインストール、アンインストール経験のある方。 動作チェック方法(1): namazu-2.0.17preX.tar.gz を展開後、コンパイル+インストールした上で、 make check を行ってください。 次にその結果を報告してください。 また、tests/test-log の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 動作チェック方法(2): 1. pltests に移動し、perl alltests.pl を実行します。 画面にチェック結果が出力されます。また、test-log ファイルに ログが出力されます。 2. OS, Perl のバージョンをお知らせください。 3. 画面に出力された結果をお知らせください。 4. test-log の中の最初の方に記録される mknmz -C の 出力結果も省略せずお知らせください。(テスト時に有効となって いるフィルタを確認するため) 以上が最低限の動作確認と考えていますが、更に手元のデータで 検証していただけるのであれば、なお嬉しいです。 そちらで、何か不具合が確認されましたら、その内容を報告して ください。 注意事項: - Namazu 2.0.16 でも同じように生じる不具合に関しては、致命的な ものでない限り、2.0.17 で修正することは見送ります。 (2.0.17 のリリースを優先します。) 次の 2.0.18 には反映したいと思いますので、報告は随時受け付けます。 - rpm などのパッケージは用意しておりません。ソースからコンパイル して動作確認してください。 - Windows ネイティブ版のインストーラは用意しておりませんが、コンパ イル済みバイナリは準備ができ次第公開する予定です。 - 大切な文書はバックアップを取った上でご使用ください。十分注意して おりますが、開発中のもののため、対象文書を削除する危険がある かもしれません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 871] Re: Namazu 2.0.17R C1 公開 + 動作チェックに 協力していただける方募集
寺西です。 Tadamasa Teranishi wrote: 2.0.17pre1 からの変更点 ・Cygwin で、I won't mmap that file, using a slower method という メッセージが出るため、wvWare の STDERR を捨て修正を加えました。 ・ja-namazu-cgi で、namazu.cgi に引数を与えている部分を変更しました。 また、デバッグ用に tests/test-log に検索結果を書き込むように 変更しました。 ・namazu, namazu-cgi でメモリを壊していた部分を修正 (Interix で namazu-9 が fail する問題の対策、おそらく FreeBSD 5.2-CURRENT で namazu-9 が fail するのも直るものと 思います。) 失礼。この部分は随分と前のバージョンでの修正内容で、2.0.17pre1 から の変更点ではありません。 以下が主な変更点です。 [2.0.16からの主な変更点] ・filter/html.pl script タグの不具合を修正 ・filter/html.pl META タグの の XHTML 形式 / に未対応の不具合修正 ・filter/win32/olevisio.pl Visio 2000 Type Library を追加 ・filename_to_title パス区切り文字を含まないファイルに対応 ・filter/zip.pl テンポラリファイルが残るバグを修正 ・oleexcel.pl の Perl_VERSION を PERL_VERSION へ ・Windows版で強調表示できない場合があるバグを修正 (isalpha - nmz_isalpha の置き換え) ・ファイルサイズが$FILE_SIZE_MAXを超えた場合のエラーメッセージが不正 ・make clean で失敗する環境のために pltests/Makefile.am を修正 ・filter/mailnews.pl base64/qcode でエンコーディングされた日本語 テキストに対応(シングルパート/マルチパート) ・mailtonews.pl マルチパートの途中で切れているメールのための対策を行う ・--debug 付きの filter/pdf.pl でプロテクト付きファイルと誤認される 問題を修正 ・mknmz.in の process_file() の仮引数の数が間違っていたのを修正 ・mknmz で --update オプションで指定したディレクトリの NMZ.status の内容が読み取れない場合、終了するように修正 ・テンプレートをカスタマイズした場合にバッファオーバーフローを起こす 可能性があったのを修正 ・部分一致検索の場合にも、強調表示するように修正 ・taro56.pl 機種依存文字、外字の処理のデバッグ ・taro56.pl 罫線処理のデバッグ。無限ループに入る問題を修正 ・gcnmz,nmzmergeのログの形式をmknmzに合わせた ・/ 出力している部分を / に変更 ・フィールド検索で正規表現検索を無効にできないバグを修正(REGEX_SEARCH) ・namazurc-sample の SUICIDE_TIME の項に (Only UNIX) と追加 ・MinGw で未サポートの SIGALRM を signal に使っていることと、alarm を SetTimer としているので、これを使わないように修正 ・「」「/」で検索すると強調表示で無限ループに入るバグを修正 ・強調とHTMLエンコードの順番を変更。HTMLエンコードされるキーワードが 強調されない場合があった ・whence, max に空の値を設定した場合は、デフォルト値を使うように修正 [2.0.17pre1 からの主な変更点] ・po ファイルの更新 ・フレーズ検索で free したメモリをアクセスする不具合を修正 ・nmzchkw.pl を contrib に追加 ・HIT数が多く、削除文書が多い場合のパフォーマンスを改善 ・不要な nmz_copy_hlist() の呼び出しを省略し最適化 [2.0.17pre2 からの主な変更点] なし -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 872] Namazu 2.0.17RC1 動作確認 (Linux RedHat9)
寺西です。 以下の環境で 2.0.17RC1 の動作確認しました。 ・ 動作確認環境 1) Linux (RedHat9) システム: linux 2.4.20-46.9 Perl: 5.008 NKF: module_nkf (2.0.7) Wakati: module_kakasi KAKASI: 2.3.4 ChaSen: 2.3.3 MeCab: 0.93 wvWare: 1.0.3 xlhtml: 0.5.1 xpdf: 2.01 ・make check の結果 All PASS です。 === All 50 tests passed === *** mknmz -C システム: linux Namazu: 2.0.17RC1 Perl: 5.008000 File-MMagic: 1.25 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: module_chasen -i e -j -F %m 和布蕪: module_mecab -Owakati -b 8192 わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /usr/local/etc/namazu LIBDIR: ../pl FILTERDIR: ../filter TEMPLATEDIR: ../template 対応メディアタイプ: (38) 未対応メディアタイプ: (6) 必要ツールが $path にないものには (-) を表示 application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl ・pltests の結果 : PASS: namazu-cgi-8.pl PASS: namazu-cgi-9.pl PASS: namazu-cgi-10.pl PASS: chasen-1.pl PASS: chasen-2.pl PASS: chasen-3.pl PASS: mecab-1.pl PASS: mecab-2.pl PASS: mecab-3.pl PASS: kakasi-1.pl PASS: kakasi-2.pl PASS: kakasi-3.pl === All 47 tests passed === *** ../scripts/mknmz -C システム: linux Namazu: 2.0.17RC1 Perl: 5.008000 File-MMagic: 1.25 NKF: module_nkf KAKASI: module_kakasi -ieuc -oeuc -w 茶筌: module_chasen -i e -j -F %m 和布蕪: module_mecab -Owakati -b 8192 わかち書き: module_kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /usr/local/etc/namazu LIBDIR: /usr/local/share/namazu/pl FILTERDIR: /usr/local/share/namazu/filter TEMPLATEDIR: /usr/local/share/namazu/template 対応メディアタイプ: (38) 未対応メディアタイプ: (6) 必要ツールが $path にないものには (-) を表示 application/excel: excel.pl application/gnumeric: gnumeric.pl application/ichitaro5: taro56.pl application/ichitaro6: taro56.pl - application/ichitaro7: taro7_10.pl application/macbinary: macbinary.pl application/msword: msword.pl application/pdf: pdf.pl - application/postscript: postscript.pl application/powerpoint: powerpoint.pl application/rtf: rtf.pl application/vnd.kde.kivio: koffice.pl application/vnd.kde.kpresenter: koffice.pl application/vnd.kde.kspread: koffice.pl application/vnd.kde.kword: koffice.pl application/vnd.oasis.opendocument.graphics: ooo.pl application/vnd.oasis.opendocument.presentation: ooo.pl application/vnd.oasis.opendocument.spreadsheet: ooo.pl application/vnd.oasis.opendocument.text: ooo.pl application/vnd.sun.xml.calc: ooo.pl application/vnd.sun.xml.draw: ooo.pl application/vnd.sun.xml.impress: ooo.pl application/vnd.sun.xml.writer: ooo.pl application/x-apache-cache: apachecache.pl application/x-bzip2: bzip2.pl application/x-compress: compress.pl - application/x-deb: deb.pl - application/x-dvi: dvi.pl application/x-gzip: gzip.pl - application/x-js-taro: taro7_10.pl application/x-rpm: rpm.pl - application/x-tex: tex.pl application/x-zip: zip.pl audio/mpeg: mp3.pl message/news: mailnews.pl message/rfc822: mailnews.pl text/hnf: hnf.pl text/html: html.pl text/html; x-type=mhonarc: mhonarc.pl text/html; x-type=pipermail: pipermail.pl text/plain text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl *** starting mknmz-1.pl *** ../scripts/mknmz -O /tmp/namazu-2.0.17RC1/pltests/idx1 /tmp/namazu-2.0.17RC1/pltests/../tests/data/ja text/plain; x-type=rfc: rfc.pl text/x-hdml: hdml.pl text/x-roff: man.pl -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL
[Namazu-users-ja 869] Re: xlhtmlの 無限ループについて
寺西です。 中島 健次 wrote: Namazu 2.0.17リリース前の忙しい時期とは思いますが、よろしくお願いします。 # 実は今、何にもしていません。(^^; 「あるExcelファイルをmknmzでインデックス化しようとすると、xlhtmlの処理が 無限ループしてmknmzが終わらない」という事象が発生して困っていました。 以下の過去情報を参考に、xlhtmlのxlhtml.cに修正を加えたところ、無限ループ しなくなり、一応インデックス化されて解決しました。 あっ!! ■参考にした過去情報■ 「[Namazu-users-ja 703] フィルタ xlhtml」 http://www.namazu.org/pipermail/namazu-users-ja/2006-March/000703.html 「[Namazu-devel-ja 1046] Re: [Namazu-users-ja 739] Re: mailnews.pl with--decode-base64」 http://www.namazu.org/pipermail/namazu-devel-ja/2006-April/001045.html この辺りで解析して、それなりの対処を行うパッチを作ったのですが、 公開するのを忘れていました。 今は時間がないので、いつか公開するようにします。 自分では事象と、上記の修正で直ったという状況しか分からないでいるので、も し今後の改善などにお役に立てばと思い、事象が発生するExcelファイルを添付 します。 ありがとうございます。ありがたく使わせていただきます。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 867] Re: pnamazu での表示形式の変更について
寺西です。 Oogata Naohiro wrote: 今日初めて pnamazu を設置してみましたところ、 表示形式の切り替え(標準or簡潔)がうまく動作せず、 簡潔を選んでも標準用の表示がされてしまったので、 ソースを見てみました。 ... この、条件の中の $var というのは、ひょっとして $val ではないでしょうか…? お恥ずかしい。ご指摘の通り $val の間違いです。 この部分は バージョンは 2006.02.28 で私が追加した部分ですが、 バグを入れてしまっていますね。 ここの修正はそもそも必須ではなくて、冗長な(念のため)ものだったので すが、そこでバグを入れてはいけませんね。 私の方から著者に連絡しておきます。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 863] Re: PHP で N amazu を利用するにあたってお聞 きしたいことがあります。
寺西です。 NOKUBI Takatsugu wrote: です。しかし、(有償/無償問わず)他のサイトの構築を請負たりすると アウトになります。ですので、あくまでも個人的に使うことしかできません。 ここはどうなんでしょうね。このあたりが一番不明瞭な気がします。 他のサイトの構築とは、PHP Namazu モジュールのバイナリを納品して、 サイトを構築するという場合の話です。 もちろん司法判断が出ていないので、裁判でもしてみないとはっきりした ことは誰にも言えないとは思いますが、アウトでしょうね。 成果物として納品するわけですから。 既にそのサイトで PHP Namazu が使える場合で、PHP Namazu を利用した サイトを構築する場合だと微妙ですが、こっちはグレーかな?シロかな? PHP Namazu が使えるレンタルサーバで、利用者がPHP Namazu を利用 してサイトを作るのは、シロな気はしますが、この場合レンタルサーバ屋 さんは、シロなんだろうか?? ...と、ケースバイケースでいろいろと難しい話がでてきて法律の素人には 判断がつかないところも多々あります。 というわけで、 ところで、PHP の Namazu モジュールから GPL の libnmz を使うのは ライセンス的にグレーですのでご注意ください。 というお茶を濁した説明になります。 ライセンスの縛りがある以上、その縛りが外れる例外条件でなければ 使うことはできないので、自分がそれに当てはまるのかどうかを判断しな ければなりません。 結局のところ、ソフトウェアのライセンスに詳しい弁護士さんとご相談の上、 ご利用になるのが安全かと思います。 # 弁護士によっては判断が異なったりするので、 # 弁護士が必ずしも正しいわけでもないのが、また困るところですが...。 で、話の発端は、こういうグレーな状況を改善して PHP からも Namazu が 使える環境を作って皆がハッピーになれる状況にしないといけないなぁと いうところから来ています。 結局問題なのは * GPLは強すぎる * Apache, PHPはいわゆる宣伝条項が困る この2点につきますね。 # 加えて、GPL のライセンスは曖昧すぎるというのも困る話です。 まぁ、それぞれの考え方なので尊重しましょうということですね。 我々は異なるライセンスのソフトからも Namazu が使えるような手段を 提供することが必要なんですけど、手がまわっていないというところが 一番の問題です。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 865] Re: PHP で N amazu を利用するにあたってお聞 きしたいことがあります。
寺西です。 syokora wrote: ・Namazu(最新版)をWindows XPで使う場合、ソースコードでイ ンストールするか、バイナリでインストールするかというのは 、何を基準に判断すればよいのでしょうか? それは貴方が何をしたいのかによります。 しかし、自分で判断ができないのであれば、バイナリをインストールする べきでしょう。 失礼ながらそういった質問をされる方では、ソースをコンパイルすることは まず不可能だと思います。ですので、そういう場合はソースを修正しないと いけないカスタマイズはあきらめましょう。 ・PHP5でNamazuを用いるためのモジュールには、ライセンスの 問題があるということでしたが、結局のところ、個人的に使う 分には問題ないということでしょうか? ということは、どのように使うのか、個人的にとはどこまでの範囲かにも よる部分もあるので、 結局のところ、ソフトウェアのライセンスに詳しい弁護士さんとご相談の 上、 ご利用になるのが安全かと思います。 ということです。 ここで仮に大丈夫だと言っても、その言葉に何の法的な効力はあり ませんから、後で問題になった(ならないとは思うけど)時は、もちろん あなたに法的な責任がかかりますから。 # だから、グレーだから注意してねとしか言えないわけです。 なお、 投稿者が Namazu Project であれ他人であれ、メーリングリストに 投稿された情報についての保証を Namazu Project はすべて放棄します。 この免責事項には、商業的適性やある特定の目的への適合性についての 暗黙の保証も含まれます。 Namazu メーリングリストに投稿されたあら ゆる情報の利用の結果として (もしくはその利用に伴って) 利用・データ ・利益が失われても、その結果として生じるあらゆる特別損害・間接損害 またはその他のいかなる種類の損害に関しては、いかなる場合も Namazu Project は責任を負いません。 ということも忘れないでください。 ・Namazuで使う分かち書きのツールにChasen,kakashi,Mecabな どがありますが、処理速度や辞書の充実度から考えるとどれを 用いるべきでしょうか? それぞれに長所と短所がありますので、お好みでお選びください。 何もわからなければ、KAKASI を使うのが手軽で良いかと思います。 また、速度面で言えば、Perl モジュール版を使うべきだとは言えます。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 851] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: 今、設定ファイルはこう置いています /var/www/html/foo/namazu.cgi /var/www/html/foo/.namazurc /var/www/html/foo/mknmzrc ということはもちろん -f オプションでこの /var/www/html/foo/mknmzrc ファイルを指定しているのですよね? mknmz -C の実行結果は確か # mknmz -C システム: linux Namazu: 2.0.16 Perl: 5.008000 File-MMagic: 1.25 NKF: /usr/bin/nkf KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 茶筌: no 和布蕪: no わかち書き: /usr/local/bin/kakasi -ieuc -oeuc -w メッセージの言語: ja_JP.eucJP 言語: ja_JP.eucJP 文字コード: euc CONFDIR: /usr/local/etc/namazu でしたから、-f で指定しないと /usr/local/etc/namazu/mknmzrc を 読込んでいるはずです。 再度 mknmz -C で確認してください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 854] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: # -fオプション付けていませんでした・・・。 ... マニュアルを読みましょう。 そもそも何故そんな場所に mknmzrc を置くのでしょうか? はい、ダメでした・・・ mknmz -f /var/www/html/foo/mknmzrc /var/www/html/hoge 何故、いきなりそんなことをしようとするのでしょうか? $ mknmz -f /var/www/html/foo/mknmzrc -C の結果はどうなりますか? $ perl -wc /var/www/html/foo/mknmzrc の結果はどうなりますか? $ ppthtml /var/www/html/hogehoge/hogehoge.ppt | nkf -e | wc の結果はどうなりますか? $ mknmz -f /var/www/html/foo/mknmzrc --debug /var/www/html/hogehoge/hogehoge.ppt の結果はどうなりますか? (関係ありそうな所の抜粋) 関係があるかないかの判断ができるかどうか疑わしいので、ログはあまり カットしないようにしましょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 856] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: $ mknmz -f /var/www/html/foo/mknmzrc -C 読み込んだ設定ファイル: load failed /var/www/html/foo/mknmzrc'Can't modify concatenation (.) or string in scalar assignment at /var/www/html/foo/mknmzrc line 136, near 300;' あからさまにエラーです。 /var/www/html/foo/mknmzrc の 136行辺りに誤りがあるのでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 859] Re: PHP で N amazu を利用するにあたってお聞 きしたいことがあります。
寺西です。 プレーンテキストでお送りください。 # http://www.namazu.org/ml.html#html syokora wrote: ・Namazu(最新版)をWindows XPで使いたいのですが、カスタマイズを行う 場合は、バイナリではなく、ソースコードからインストールしなければなら な いでしょうか? どのようなカスタマイズをしたいのかによります。 ・PHP5でNamazuを使いたいのですが、これはいったん、バイナリやソース コードからNamazuをインストールした上で、さらにPHPのNamazuモジュー ルを導入するということでしょうか? おそらく libnmz (この場合は libnmz.dll) を使うでしょうから、Namazu のインストールは必要になるでしょうね。 そもそもインデックスを作るために Namazu が必要になるので、どのみち Namazu をインストールするしかないのでは? ところで、PHP の Namazu モジュールから GPL の libnmz を使うのは ライセンス的にグレーですのでご注意ください。 ・PHP の Chasen モジュールを作成するための Patchという記述のある HP(http://www.asahi-net.or.jp/~wv7y-kmr/memo/pecl.html#Namazu)がある のですが、PHPからNamazuを利用する場合、普通に茶せんをインストールする だけでなく、上記のChasen モジュールというのも必要になるのでしょうか? これは PHP から Chasen を使う場合の話ではないかと思いますが、それは Namazu とは直接関係ありません。詳しくはサイトの著者にお尋ねください。 なお、Namazu で分かち書きに ChaSen を使うことはできますが、その場合 は、ChaSen だけでもかまいませんし、より高速な処理が必要なら Text-ChaSen (ChaSen Perl モジュール)を更にインストールしてもかまい ません。 もちろん、分かち書きに KAKASI や MeCab を使うのなら ChaSen をインス トールしなくてもかまいません。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 861] Re: PHP で N amazu を利用するにあたってお聞 きしたいことがあります。
寺西です。 NOKUBI Takatsugu wrote: At Mon, 25 Sep 2006 23:49:31 +0900, Tadamasa Teranishi wrote: ところで、PHP の Namazu モジュールから GPL の libnmz を使うのは ライセンス的にグレーですのでご注意ください。 このあたりを正確にいうと、 PHP が Namazu のライセンスの GPL と矛盾するライセンスだからです。 残念なことです。 * PHPのNamazuモジュールソースコード自体を配布するのは問題ない これはリンクするライブラリが GPL の libnmz であるとは限らないため です。 しかし、現実問題として GPL 以外の libnmz が存在しないので * 組み込んだ状態でのバイナリ配布はライセンスが衝突するのでできない ということが発生します。 そして、とりあえず逃げ道として * ユーザが自力でコンパイルしてPHP, Namazuモジュールを使う分には問題ない * これをWebでサービスのみ公開するのは現状では問題ない です。しかし、(有償/無償問わず)他のサイトの構築を請負たりすると アウトになります。ですので、あくまでも個人的に使うことしかできません。 そういうわけで、自前で PHP の Namazu モジュールをコンパイルできない と使えなかったりします。 です。GPLv2での話ですけど。v3で今後どうなるかはわかりません。 Namazu は GPL2 あるいはそれ以降の各バージョンの中からいずれかを選択し、 そのバージョンが定める条項に従って本プログラムを再頒布または変更する ことができます。 v3 が出ると v3 を選択することが可能ですので、v3 で緩和される部分が あれば、上記の縛りから外れるかもしれません。 # もっとも、v3 の方が縛りはきついようですけどね...。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 846] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: そこで致命的なエラーとなるファイルに対して以下のコマンドを発行しました。 ... // == インデックスすべきファイル == // /var/www/html/hogehoge/hogehoge.ppt // load_document 実行後: /var/www/html/hogehoge/hogehoge.ppt: 4847616, 4847616, 0, x-system/x-error 1/1 - /var/www/html/hogehoge/hogehoge.ppt 致命的なエラー(x-system/x-error)無視します // status: keys = 42469 エラーメッセージが適切ではありませんが、(これは Namazu 2.0.17で修正 されます)ファイルサイズの上限に引っかかっているのでしょう。 mknmzrc の $FILE_SIZE_MAX の値を増やしてください。デフォルトは 200 です。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 844] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: [EMAIL PROTECTED] 842]の追加記入です # mknmz -C ... application/pdf: pdf.pl pdfの頭にマイナスはありません。 だから おかげさまで、エクセルのxls、それにPDF,WORD文書を検索出来るようになっ たのですが、 パワーポイント(ppt)のインデックスを作成できません。 とあるように PDF の検索ができるようになったのでは? powerpoint なら application/powerpoint でしょ。 もっとも、 NMZ.errには以下の記述があります。 /var/www/html/hogehoge/hogehoge.ppt 致命的なエラー(x-system/x-error) 無視します ということなら、別の原因だろうとは思いますが。 $ mknmz --debug /var/www/html/hogehoge/hogehoge.ppt の結果は見せてください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 839] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: namazuのインデックスがうまく作成されずに悩んでおります。 ... すると以下のような結果が返ってきます。実際に検索対象としたいhoge フォルダの中には、xlsファイルが1つ、 phpファイルが19個含まれているのですが・・・ php にはそもそも対応していませんが...。 ここから 検索対象のファイルを調べています... 1個のファイルがインデックス作成の対象として見つかりました 1/1 - /var/www/html/people/favo/enq-result20.xls 未対応の形式 (application/excel)無視します $ mknmz -C の出力を確認してください。おそらく - application/excel: excel.pl と頭にマイナスが付いているでしょう。 http://www.namazu.org/doc/manual.html.ja#doc-filter を確認して、excel.pl に必要なプログラムをインストールしてください。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 841] Re: mknmzの 不具合
寺西です。 FROM/ [EMAIL PROTECTED] wrote: Tadamasa Teranishi ([EMAIL PROTECTED]さんwrote php にはそもそも対応していませんが...。 げ、そ、そうですか私には死刑宣告に近い衝撃の事実です。 この場合、php はスクリプト言語ですから、スクリプトファイルの中身を 検索できるようにしてもあまり意味がありません。 というのも、スクリプトを実行して得られた出力結果のHTMLに意味が あるからです。 phpも、こんな具合に、テンプレートを追加することで 検索可能にする方法はない、という認識になるのでしょうか どこにもこんな具合にテンプレートを追加するなどという話はしていない ので、何処からテンプレートの追加という話が出てくるのかまったく謎 ですが...。 # きちんとご理解しておられますか? で、本題ですが。 php スクリプトファイルの中身を検索するのではなく、スクリプトを 実行して得られた出力結果のHTMLを検索するには、どうすれば良いかと いうことを考えれば良いわけです。 wget でサイトのファイルをダウンロードすると、得られる php ファイル は、スクリプトが実行されて得られたHTMLがファイルとなります。 このダウンロードしたファイルに対して mknmz を実行すれば目的が 果たせます。 その場合には、mknmzrc の $HTML_SUFFIX や $ALLOW_FILE に php に対する 設定を追加する必要ぐらいはあります。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 822] Re: namazu/namazu. cgiで core-dump
寺西です。 報告ありがとうございます。 [EMAIL PROTECTED] wrote: [現象] namazurcのMaxHitを上回る出現件数の検索語は、結果表示から無視されるのだと 思いますが、そうした語が検索語の先頭に現れ、かつ、連続した語となっている 場合、namazu,namazu.cgi双方とも、coreを吐いて死亡します。 具体的には、 「日本の歴史」 の様な検索語、つまり、日本 の 歴史 というような複数の語からなる検索語 で、「日本」と「の」がMaxHitを越えている状態であるならば、core を吐きます。 手元の Linux で試してみると、 $ namazu -f namazurc 日本の歴史 . 検索結果 参考ヒット数: { [ 日本 (ヒット数が多すぎるので無視しました) ] [ の ( ヒット数が多すぎるので無視しました) ] [ 歴: 0 ] [ 史: 0 ] :: 0 } 検索式にマッチする文書はありませんでした。 となり、問題はありませんでした。 core ダンプする理由はもう少し条件が必要なのかもしれません。 インデックスに含まれる「日本」や「の」の数はどれくらいかわかりますか? そのインデックスが壊れている可能性はないでしょうか? nmzchkw.pl で一度チェックしてみてください。 また、インデックスを削除して新規にインデックスを作成した場合でも 同様に問題が起きるでしょうか? http://www.namazu.org/pipermail/namazu-users-ja/2005-November/000571.html -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 823] Re: namazu/namazu. cgiで core-dump
寺西です。 Tadamasa Teranishi wrote: 手元の Linux で試してみると、 $ namazu -f namazurc 日本の歴史 . 検索結果 参考ヒット数: { [ 日本 (ヒット数が多すぎるので無視しました) ] [ の ( ヒット数が多すぎるので無視しました) ] [ 歴: 0 ] [ 史: 0 ] :: 0 } 検索式にマッチする文書はありませんでした。 となり、問題はありませんでした。 core ダンプする理由はもう少し条件が必要なのかもしれません。 手元の FreeBSD 4.7-RELEASE では問題ありませんでした。 $ namazu -f namazurc 日本の歴史 . 検索結果 参考ヒット数: { [ 日本 (ヒット数が多すぎるので無視しました) ] [ の ( ヒット数が多すぎるので無視しました) ] [ 歴: 0 ] [ 史: 0 ] :: 0 } 検索式にマッチする文書はありませんでした。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 826] Re: namazu/namazu. cgiで core-dump
寺西です。 [EMAIL PROTECTED] wrote: となり、問題はありませんでした。 core ダンプする理由はもう少し条件が必要なのかもしれません。 うーん、ちょっと厭んな現象を持ち込んでしまったかもしれません_o_ 何らかの条件が重なった場合に core ダンプするのでしょう。 core ダンプしない場合であっても、どこかでメモリを壊している可能性が ありますので、できれば原因を突き止めてデバッグしたいものです。 現在 2.0.17 リリースの準備中ですので、この問題に対応したものを リリースしたいものです。 インデックスに含まれる「日本」や「の」の数はどれくらいかわかりますか? 調べました。 日本 : 10714 の : 34318 歴史 : 1437 でした。 このぐらいの数がひとつの条件となるのかもしれませんね。 私がテストしたのは2件程度のものですから。 そのインデックスが壊れている可能性はないでしょうか? nmzchkw.pl で一度チェックしてみてください。 ここで初めて、nmzchkw.plの存在を知りました。ごっつい便利ですね。 NMZ.w と NMZ.wi の整合性を簡単にチェックするものです。 (次の Namazu 2.0.17 では contrib に入る予定です。) このチェックが通ったとしても、インデックスが壊れていないとはいえない のですが、NMZ.w, NMZ.wi についてはほぼ問題がないといえるでしょう。 本件の場合は、NMZ.i, NMZ.ii が壊れている可能性もありますが、 FreeBSD ということで BSD 関係の問題かもしれません。 (過去に BSD 関係でメモリ関連の問題が多少見つかっていまして、原因不明 なので対処療法的な対策を行っています。) また、インデックスを削除して新規にインデックスを作成した場合でも 同様に問題が起きるでしょうか? これは、現在試している最中です。総文書数が4万件以上あり、今、3万件 目まできた所です。 多量のPDFが含まれているので、処理にごつい時間が掛かるです。 余談ですが... $ON_MEMORY_MAX を相当大きな値にすると時間が短縮されるかもしれません。 (この値は、実メモリサイズと無関係なので、実メモリサイズを超えても 何ら問題ありません。) また、ディレクトリ単位等でインデックスを分けて作成し、最後に nmzmerge でマージするとトータル時間は短縮されるでしょう。 -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 831] Re: namazu/namazu. cgiで core-dump
寺西です。 [EMAIL PROTECTED] wrote: #0 0x08065c1a in cmp_phrase_hash (hash_key=58168, val= {num = 34318, stat = ERR_TOO_MUCH_HIT, data = 0x81d9000}, phrase=0x2827c440, phrase_index=0x2827c498) at search.c:380 #1 0x08066183 in do_phrase_search (key=0xbfbfd340 仙台\tの\t歴史, src= {num = 0, stat = SUCCESS, data = 0x0}) at search.c:497 ... #2 0x08067be4 in nmz_do_searching (key=0x81745a4 仙台の歴史, src= {num = 0, stat = SUCCESS, data = 0x0}) at search.c:1162 ... #6 0x08067074 in nmz_search_sub (hlist= {num = 0, stat = SUCCESS, data = 0x0}, query=0xbfbfdbf0 仙台の歴史, n=0) at search.c:868 #7 0x0806773e in nmz_search (query=0xbfbfdbf0 仙台の歴史) at search.c:1055 search.c の 497 行目から 868 行目までの間に6行ほど追加されているで しょうか? 行番号が一致していません。 デバッグ目的に何か追加されているのなら問題ないですが、普段 Namazu を 改造して使われているということでしたら話が変わってきますので、念のため 確認させてください。 Namazu 2.0.16 をオリジナルのまま使われていますか? -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja
[Namazu-users-ja 832] Re: namazu/namazu. cgiで core-dump
寺西です。 Tadamasa Teranishi wrote: この情報を元にちょっと調べてみます。 いろいろ調べてみると、cmp_phrase_hash 内で free した val.data に アクセスする可能性がありました。 # デバッガの情報のまんまですけど。 素人考えでは、val.data[j]に入っているポインタの値が変になってる 様に思えるのですが、これがどこで alloc されてるのかが追えなくて… その通りでした。 もう少し書くと、フレーズ検索の際に do_phrase_search の中から cmp_phrase_hash を呼び出すのですが、この第二引数 val が TOO_MUCH_* の場合に val.data は free 済みとなっています。 にもかかわらず、cmp_phrase_hash で使っているのでコアダンプするよう です。 コアダンプせずに動く環境は、たまたま動いているだけでした。 おそらく 日本の歴史 で検索するのではなく、日本 の 歴史 で検索 すればコアダンプしないと思います。 とりあえず、以下の修正を行えばコアダンプしないようになると思います。 ただ、 $ namazu -f namazurc 日本の歴史 . 検索結果 参考ヒット数: { [ 日本 (ヒット数が多すぎるので無視しました) ] [ の ( ヒット数が多すぎるので無視しました) ] [ 歴史: 1 ] :: 0 } 検索式にマッチする文書はありませんでした。 ですが、 $ namazu -f namazurc 日本 の 歴史 . 検索結果 参考ヒット数: [ 日本 (ヒット数が多すぎるので無視しました) ] [ の (ヒ ット数が多すぎるので無視しました) ] [ 歴史: 1 ] 検索式にマッチする 1 個の文書が見つかりました。 1. test3.txt (スコア: 2) 著者: 不明 日付: Thu, 14 Sep 2006 17:14:26 +0900 歴史 /tmp/debug/test3.txt (5 bytes) 現在のリスト: 1 - 1 となります。フレーズ検索の場合、「ヒット数が多すぎるので無視しました」 というメッセージですが、個々のワードを無視しているのではなく、 フレーズ全体を無視するような動作となり、メッセージが適当とはいえない かもしれません。 $ diff -up search.c.org search.c --- search.c.org2006-09-15 02:03:06.0 +0900 +++ search.c2006-09-15 02:03:46.0 +0900 @@ -355,6 +355,10 @@ cmp_phrase_hash(int hash_key, NmzResult if (val.num == 0) { return val; } +if (val.stat != SUCCESS) { +nmz_debug_printf(cmp_phrase_hash: val.stat [%d]\n, val.stat); +return val; +} ptr = nmz_getidxptr(phrase_index, hash_key); if (ptr 0) { nmz_free_hlist(val); -- = 寺西 忠勝(TADAMASA TERANISHI) [EMAIL PROTECTED] http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E ___ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja