森田です。
ソースからコンパイルした場合のデフォルトのインストール先は
/usr/local/ 以下ですから、ご自身で変更されたということでなければ、
xpdf はパッケージからインストールしたということではないかと思います。
xpdfはとりあえずコマンドうってインストールできたのでまあよかったと思いきや
language packはapt-getではインストールできず(できるかもしれませんが)
ソースを探してインストールしました。
現在インストールされているファイルの管理状況はかなりぐちゃぐちゃしているので
今後は注意したいと思います。
ご指摘ありがとうございました。
先日から質問させていただいていた森田です。
ようやく日本語PDFもindex化できたかと思ったら
またエラーがでてしまい、お力を貸していただければと思います。
紙媒体をスキャンした際にはファイル名としては適当なものをつけ、
Adobe acrobatなどをインストールした際に書き込みが可能となる
PDFのプロパティでの文書名(namazuでPDFを検索されるときに表示されるタイトル部分)
を編集していました。
それで従来の職場の環境では
本文自体には検索対象語が一語もない場合でもPDFのプロパティでの文書名が登録されていれば
お世話になります。
森田です。
タイプミスに全然気づきませんでした。失礼しました。
しかし、訂正を行っても結果は同様でした。
pdftotext -enc EUC-JP Book2.pdf out.txt
Error: Couldn't find unicodeMap file for the 'EUC-JP' encoding
Error: Couldn't get text encoding
Namazu-users-ja#1156 では見過ごしましたが、ja_JP.eucjp や
eucjp を xpdfrc に追加されていますが、どういう理由で追加されている
森田です。
# ほとんど Namazu とは関係ない話ですね。
たしかにそうですよね。
アドバイスをいただいたJavaScriptで思っていた挙動をだすことができました。
このメーリングリストを見られている方は
ほとんど対応できるとは思いますが、
一応記載しておきます。
ほとんど某掲示板からのコピペですが。
script type=text/javascript
function moveURI(){
森田と申します。
とある病院にて資料をサーバーへアップロードし、
それらの資料をNamazuにて検索できるように環境を構築しました。
紙媒体を取り込んだものが多いので、pdfファイルが多いのですが
pdfファイルのタイトルでの検索を行おうとしていますが
どうすればいいかわからない状態です。
以下、環境です。
・サーバー
Red Hat Enterprise Linux ES release 4 (Nahant Update 4)
Kernel 2.6.9-42.0.3.ELsmp on an x86_64
・pdfinfo -v
pdfinfo version 3.00