山川です。

お返事いただきありがとうございます。
遅くなりましたが、説明不足の点補足いたします。


> それは、何をもって正しいというのか次第かと思いますが...。
>
> 文書ファイルのタイトルをなぜ表示したくないのか、その理由は
> 何でしょうか?

経緯のご説明が足りておりませんでした。

社内でNamazuを運用しているのですが、
最近になってOffice2007・2010文書(xlsx/docx/pptx)も
対応しようという話になりまして、Namazuにて検索できるのかを検証しておりました。

Office2000や2003の文書(xls/doc/ppt)であれば
ファイル名が検索結果のタイトルとして表示されていたのですが、
Office2007・2010で作成した文書インデックス作成すると
必ずファイルのタイトルが検索結果のタイトルとなり、戸惑っておりました。

※ppt(Office2000・2003形式)ファイルの検索結果
 1. FileName.ppt (スコア: 17)
  著者: 不明
  日付: Tue, 21 May 2013 11:52:27 +0900
   XXXXX XXXXX XXXXX (55,890 bytes)

※pptx(Office2007・2010形式)ファイルの検索結果
 1. PowerPoint プレゼンテーション (スコア: 17)
  著者: 不明
  日付: Tue, 21 May 2013 11:52:27 +0900
   XXXXX XXXXX XXXXX (55,890 bytes)

↑どちらのファイルも内容は一緒です。

msofficexml.plとexcel.pl/msword.pl/powerpoint.plの動作の違いだと思い
調べていると、excel.pl/msword.pl/powerpoint.plにてDoccatを利用しているときは
ファイルのタイトルを取得していないようでした。
(ここで初めて通常であればファイルのタイトルが優先されるのだと知りました)

Namazuを利用している人はずっと「ファイル名が検索結果のタイトル」で
慣れ親しんでいる為、出来れば同じ挙動にしたいと思い調査するに至りました。


>>  2.ファイルのタイトルを取得しなくしたことで悪影響はないか?
>
> これまた何をもって悪影響というのか? という話になります。
>
> $fields->{'title'} に文書のタイトルをいれなければ、当然ながら
> フィールド検索で、文書のタイトルの検索はできなくなります。
> これは悪影響に入りますか? 意図した影響に入りますか?

これは悪影響になってしまいますね。考慮が足りておりませんでした。
もう少し考えなおさないといけないようです。


> 文書のタイトルを $fields->{'title'} に設定して、
> 検索結果に反映するというのが仕様です。
> ただし、文書のタイトルが取得できない場合は、文書のタイトル
> の代わりに仕方なくファイル名をタイトルに代用するという仕様に
> なっています。
> # no title では味気ないので。

ずっとNamazuを利用しておりましたが、こちらの仕様は恥ずかしながら
今回初めて知りました。
本来であればファイル名がおまけのような扱いなのですね。


> 文書のタイトルを表示したいからです。
>
> そもそも検索結果の出力フォーマットをカスタマイズするのは、
> フィルタでやることではないですし。
> (もちろん、フィルタにまで手を入れないとできないような大幅な
> 変更は除きますが)

普通に利用していればこのようなことをすることは無いのでしょうね。
こちらが特殊な使い方をしている状態だとは認識いたしました。


_______________________________________________
Namazu-users-ja mailing list
Namazu-users-ja@namazu.org
http://www.namazu.org/cgi-bin/mailman/listinfo/namazu-users-ja

メールによる返信