寺西です。 酒井美那 wrote: > > /var/log/messagesには > Sep 17 14:52:10 hoge_host kernel: xlhtml[5458]: segfault at > 0000000000000048 rip 0000000000405a0f rsp 00007fffb54249d0 error 6 > といったようにログが吐かれます。 ... > サーバ上から、該当のxlsファイルを削除することは運用上困難であるため、 > 何らかの解決策がないかと、投稿させていただきました。
状況からすると、インデックスの作成は(そのファイルは除いて)特に 問題なくできているようなので、検索もできているのではないかと思い ます。 その上で、どのような対策を希望されているのでしょう。 1. /var/log/messages にエラーが記録されるのが嫌なので、該当ファイル をインデックス作成対象から外したい 2. xlhtml でセグメンテーション違反で落ちないようにしたい 1 ならば --exclude オプションが使えるでしょう。 2 ならば、開発元に相談するのが良いでしょう。 > また、doccatのような有償ツールではなく、 > 無償のツールでxlhtmlの代用となるようなものをご存知でしたら、 > お教えいただけたらと思っております。 メンテナンスしていませんが、namazu/contrib/spreadexcel.pl を filter/excel.pl の代わりに使うことができます。 (Spreadsheet::ParseExcel Perl モジュールが必要) ただし、処理は遅いですし、今回の問題が解決する保証はありません。 また、別の問題が出るかもしれません。 # 何せメンテナンスしていないものですので。 > ●mknmz -Cの結果 > $ /usr/local/bin/mknmz -C > 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc > システム: linux > Namazu: 2.0.19 > Perl: 5.008008 > File-MMagic: 1.27 > NKF: module_nkf > KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w 本件と関係ありませんが、Perl モジュールを使った方が処理が速いので 良いでしょう。 > メッセージの言語: ja_JP.UTF-8 > 言語: ja_JP.UTF-8 ja_JP.UTF-8 はサポートしていません。 環境変数を EUC-JP 系のものに変更して Namazu をご使用ください。 -- ===================================================================== 寺西 忠勝(TADAMASA TERANISHI) yw3t-t...@asahi-net.or.jp http://www.asahi-net.or.jp/~yw3t-trns/index.htm Key fingerprint = 474E 4D93 8E97 11F6 662D 8A42 17F5 52F4 10E7 D14E _______________________________________________ Namazu-users-ja mailing list Namazu-users-ja@namazu.org http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja