2010/5/29 NIIBE Yutaka: > [Anthy-dev 3470] の主張(繰り返すことで賢くなる)は、現在の実装においてホ > ントなんでしょうか?
(賢くなるかどうかは別として)情報が集積されるためには、 (0) 最初のコーパス関連が空の anthy.dic-0 があるとする (1) proccorpus が anthy.dic-0 を使って parsed_data-0 を生成 calctrans が parsed_data-0 を使って corpus_info,weak_words を生成 次の anthy.dic-1 を作る (2) proccorpus が anthy.dic-1 を使って parsed_data-1 を生成 calctrans が parsed_data-0 と parsed_data-1 を使って corpus_info,weak_words を生成 次の anthy.dic-2 を作る とここまでは 9100h の update_params2 はあっているとして、次からの段階は、 (3) proccorpus が anthy.dic-2 を使って parsed_data-2 を生成 calctrans が parsed_data-0 と parsed_data-1 および parsed_data-2 を使って ^^^^^^^^^^^^^ corpus_info,weak_words を生成 次の anthy.dic-3 を作る [...] (N) proccorpus が anthy.dic-{N-1} を使って parsed_data-{N-1} を生成し、 calctrans が parsed_data-0.. parsed_data-{N-1} の全部を使って ^^^^^^^^^^^ corpus_info,weak_words を生成 次の anthy-dic-{N} を作る じゃないでしょうか。 これを試してみるとして、正しいかどうかはおいておいて、「こっちの方が良い」か どうかを判断するのには、どうしたらいいでしょう。 -- _______________________________________________ Anthy-dev mailing list Anthy-dev@lists.sourceforge.jp http://lists.sourceforge.jp/mailman/listinfo/anthy-dev