寺西です。

酒井美那 wrote:
> 
> /var/log/messagesには
> Sep 17 14:52:10 hoge_host kernel: xlhtml[5458]: segfault at
> 0000000000000048 rip 0000000000405a0f rsp 00007fffb54249d0 error 6
> といったようにログが吐かれます。
...
> サーバ上から、該当のxlsファイルを削除することは運用上困難であるため、
> 何らかの解決策がないかと、投稿させていただきました。

状況からすると、インデックスの作成は(そのファイルは除いて)特に
問題なくできているようなので、検索もできているのではないかと思い
ます。

その上で、どのような対策を希望されているのでしょう。
1. /var/log/messages にエラーが記録されるのが嫌なので、該当ファイル
   をインデックス作成対象から外したい
2. xlhtml でセグメンテーション違反で落ちないようにしたい

1 ならば --exclude オプションが使えるでしょう。

2 ならば、開発元に相談するのが良いでしょう。


> また、doccatのような有償ツールではなく、
> 無償のツールでxlhtmlの代用となるようなものをご存知でしたら、
> お教えいただけたらと思っております。

メンテナンスしていませんが、namazu/contrib/spreadexcel.pl
を filter/excel.pl の代わりに使うことができます。
(Spreadsheet::ParseExcel Perl モジュールが必要)

ただし、処理は遅いですし、今回の問題が解決する保証はありません。
また、別の問題が出るかもしれません。
# 何せメンテナンスしていないものですので。

> ●mknmz -Cの結果
> $ /usr/local/bin/mknmz -C
> 読み込んだ設定ファイル: /usr/local/etc/namazu/mknmzrc
> システム: linux
> Namazu: 2.0.19
> Perl: 5.008008
> File-MMagic: 1.27
> NKF: module_nkf
> KAKASI: /usr/local/bin/kakasi -ieuc -oeuc -w

本件と関係ありませんが、Perl モジュールを使った方が処理が速いので
良いでしょう。

> メッセージの言語: ja_JP.UTF-8
> 言語: ja_JP.UTF-8

ja_JP.UTF-8 はサポートしていません。
環境変数を EUC-JP 系のものに変更して Namazu をご使用ください。

-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  yw3t-t...@asahi-net.or.jp
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

メールによる返信