初めまして、山川と申します。
確認したいことがあり投稿いたします。


検索結果のタイトルにファイルのタイトルを表示しないように
したかったので、文書フィルタを一部変更しました。
しかし、対応として正しかったのかが分からずにいます。

【変更箇所】
filter/pdf.pl
 以下をコメントアウト

#        if ($result =~ /Title:\s+(.*)/) { # or /Subject:\s+(.*)/
#            $fields->{'title'} = $1;
#            if ($fields->{'title'} =~ /<unicode>/) {
#                delete $fields->{'title'};
#            }
#            elsif ($fields->{'title'} =~ /^\s*$/) {
#                delete $fields->{'title'};
#            }
#        }

filter/msofficexml.pl
 以下を変更

sub filter_metafile ($$$) 内の

#    my $title = ooo::get_title(\$xml);   ←コメントアウト
    my $title = "";             ←追加

※PDF/Excel/Word/PowerPoint ファイルのみが対象なので
 上記2ファイルだけ変更しました。
※excel.pl/msword.pl/powerpoint.plに関しては、
 Doccatを利用しているとタイトルが取得できないのか
 ファイル名を必ず表示してくれるため変更していません。


【確認しておきたいこと】
 1.フィルタを変更するしか方法がないのか?
   設定変更のみで対応出来ればそちらの方が安心ではあります。

 2.ファイルのタイトルを取得しなくしたことで悪影響はないか?
   上記2つ以外のフィルタの仕様も
   「タイトルが取得できないときにファイル名を設定する」ようになっています。
   何か理由があってこのような仕様になっているのであれば
   この変更は止めた方が良いのかなと考えております。


【環境】
・OS:Red Hat Enterprise Linux 5.9
・Namazu:namazu-2.0.21
・Perl: 5.008008
・File-MMagic: 1.27
・NKF: 2.0.7


過去ログを参照したのですが、フィルタの変更については触れられているものの
なぜこのような仕様であるのかが分からなかったため確認の意味も込めて
投稿させていただきました。
もし、分かればで構いません。


どうぞ、よろしくお願いいたします。

_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

メールによる返信