内海です。

引き続き Wikipedia の日本のテレビアニメ一覧
(URL は忘れました)から
テレビアニメ辞書を作りました。
読み仮名は機械的に当てているので、
外れているものが多いです。

この分野のことは全く分からないので、
詳しいかたに校正していただけるとうれしいです。

ファイルはこちら。
(直クリックでは取れないと思いますので、
wget で取得してください)
$ wget
http://www.geocities.jp/ep3797/snapshot/tmp/tv_animation-20070817.t.zip

項目数は 1114 。
読みが 3 文字以下の作品は、
他の単語と読みが被って日常語の変換に支障をきたす可能性が高いので
除外しました。

作業手順は漫画家辞書の時とほぼ同じですが、
Wikipedia に掲載されているフォーマットが
若干漫画家の時とは違っていたので
(制作会社の名前がタイトルの後に入っている)、
それらを削るのにスクリプトを通しました。

続編のタイトルは項目に含めていません。
続編のタイトルは
・続 + 一作目のタイトル
・一作目のタイトル + 副題
のパターンが多いので、
一作目だけを入れました。
(必要なら適当に追加してください)

一応 日本の女性声優辞書 も作りかけているのですが、
私の知る少数の例を見る限りでは
女性声優を「姓名」のフルネームでブログに表記するファンは
あまりいないような気がするので、
不要かなあという気もしています。
「姓」+「たん」、「名」+「たん」のパターンが
多いような気がします。
チャットや実況や MMORPG なら尚のこと。
必要なかたは anthy-dev にご連絡ください。

2ちゃんねる用語辞書はほぼ完成しているのですが、
個人・団体・製品・地名 を揶揄する内容が多いので、
出したくないなあという気がしています。

単語は「2典Plus」から引いています。
http://www.media-k.co.jp/jiten/
個人・団体・製品・地名に関わるもの
(たとえそれが「埼玉県」のように正式名称であっても削除。
本当に必要な名称なら標準添付辞書に載っているはず)を削除すると、
項目数は 1800 くらいになりそうです。
強引な語呂合わせが多いので、チェック漏れが恐い。

--------------------------------------
Easy + Joy + Powerful = Yahoo! Bookmarks x Toolbar
http://pr.mail.yahoo.co.jp/toolbar/

_______________________________________________
Anthy-dev mailing list
Anthy-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev

メールによる返信