On Mon, Oct 15, 2012 at 01:50:46PM +0900, Satoshi IIDA wrote: > > > とりあえず思いつくとしては、Wikipedia:jaのページから > > どうデータを拾うか、それを説明してもらうことでしょうか。 > そうですね。 > ・Githubとかにソースをアップロード > ・あるいは、Wikiページで説明 > > の、どちらかをお願いしてみましょうか。 > (文章で説明してくださっているのでだいたいイメージはわかりますが、 > 細かい部分、という意味ですよね?)
Wikipediaを見てみたのですが、必ずしも項目毎にXMLで構造化されている わけではないので、うまく拾えるか、という所が気になります。 また、ローマ字部分に付いては、きちんと正規化されていない(大文字小文字が 混じっていたり、大文字だけ)ように見えます。 本当は、Wikipediaのデータがきちんと整備(構造化)されて、そのまますっと 引っ張って来れればいいんでしょうけど。 というわけで、実際はどうなの、という所が見たいわけです。 oota _______________________________________________ Talk-ja mailing list [email protected] http://lists.openstreetmap.org/listinfo/talk-ja

