Schubi schrieb am 18.03.2011 um 07:57 Uhr: > Am 17.03.2011 23:54, schrieb Florian Janßen: >> Am 16.03.2011 15:32, schrieb Peter Fischer: >>> Am 14.03.2011 18:41, schrieb Karl Köckemann: >>>> >>>> Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr >>>> Aufwand beim Strippen der Quelltexte erfordert. >> >>> [Link zu Wikipedia-XML-Dump]- >> >> Hast du da mal reingeschaut? Das kann man noch nicht so verwenden, da es >> den Text im Wiki-Syntax enthält. > > Ist aber auch kein Problem, das raus zu pasen, oder?
Nach dem man die richigen Knoten aus dem XML geladen hat (das kann sogar ich ;) ) können Script-Junkies bestimmt ein paar schicke Regexen drauf loslassen (kann ich nicht). Aber das ist wahrscheinlich genau das was Karl mit „mehr Aufwand beim Strippen der Quelltexte“ meinte. Gruß Florian
signature.asc
Description: OpenPGP digital signature