Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą odbędzie się już pewnie na Wiki: http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_botem_artyku.C5.82.C3.B3w_o_stacjach_kolejowych_w_Wielkiej_Brytanii
Powerek38 W dniu 2011-10-24 16:50, masti pisze: > do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na > rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola > mają trafić. Z tego można bardzo szybko uruchowmić botowanie po > sprawdzeniu ewentualnych konfliktów, disambigów etc. > > masti > > On 10/24/2011 04:36 PM, Powerek38 wrote: >> Witam, >> >> Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal >> gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która >> jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze >> coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma >> być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w >> postaci linku do materiałów na podstronie w mojej osobistej >> przestrzeni), pozwolę sobie powiadomić też Ciebie. >> >> Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już >> bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej >> liczbie haseł, bo ta baza posiada dane o wszystkich katolickich >> diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, >> czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na >> podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z >> takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html >> >> Pozdrawiam! >> >> Powerek38 >> >> >> >> W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze: >>> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł >>> ze stroną do wrzucania różnych baz danych mi się podoba. >>> >>> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są >>> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. >>> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś >>> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, >>> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). >>> Reasumując, podrzucaj wszystko ;-) >>> >>> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję >>> gwarancji, ale zobaczę, co da się zrobić. >>> >>> 24.10.2011, Przykuta<[email protected]> napisał(a): >>>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów >>>> bez źródeł, teraz robi to wiki holenderska: >>>> >>>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011 >>>> >>>> W tej chwili botują takie hasła: >>>> >>>> http://nl.wikipedia.org/wiki/Ahnidzor >>>> >>>> Ale wczoraj ładowali takie: >>>> >>>> http://nl.wikipedia.org/wiki/Karaops_larryoo >>>> >>>> http://nl.wikipedia.org/wiki/Boliscus_duricorius >>>> >>>> http://nl.wikipedia.org/wiki/Zoramia_fragilis >>>> >>>> Ze źródłami - na dwa (w porywach do trzy) boty >>>> >>>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco >>>> ponad 760 000 haseł: >>>> >>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119 >>>> >>>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca: >>>> >>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142 >>>> >>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820 >>>> >>>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę >>>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać >>>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl >>>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi >>>> wersjami językowymi. >>>> >>>> Przykuta >>>> >>>> _______________________________________________ >>>> Lista dyskusyjna WikiPL-l >>>> [email protected] >>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >>>> >> >> _______________________________________________ >> Lista dyskusyjna WikiPL-l >> [email protected] >> https://lists.wikimedia.org/mailman/listinfo/wikipl-l > > _______________________________________________ > Lista dyskusyjna WikiPL-l > [email protected] > https://lists.wikimedia.org/mailman/listinfo/wikipl-l > _______________________________________________ Lista dyskusyjna WikiPL-l [email protected] https://lists.wikimedia.org/mailman/listinfo/wikipl-l
