już się tym zająłem. Jak przygotuję botowalną tabelkę to dam znać masti
On 10/24/2011 05:33 PM, Powerek38 wrote: > Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą > odbędzie się już pewnie na Wiki: > http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_botem_artyku.C5.82.C3.B3w_o_stacjach_kolejowych_w_Wielkiej_Brytanii > > > Powerek38 > > > W dniu 2011-10-24 16:50, masti pisze: >> do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na >> rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola >> mają trafić. Z tego można bardzo szybko uruchowmić botowanie po >> sprawdzeniu ewentualnych konfliktów, disambigów etc. >> >> masti >> >> On 10/24/2011 04:36 PM, Powerek38 wrote: >>> Witam, >>> >>> Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal >>> gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która >>> jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze >>> coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma >>> być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w >>> postaci linku do materiałów na podstronie w mojej osobistej >>> przestrzeni), pozwolę sobie powiadomić też Ciebie. >>> >>> Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już >>> bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej >>> liczbie haseł, bo ta baza posiada dane o wszystkich katolickich >>> diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, >>> czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na >>> podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z >>> takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html >>> >>> Pozdrawiam! >>> >>> Powerek38 >>> >>> >>> >>> W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze: >>>> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł >>>> ze stroną do wrzucania różnych baz danych mi się podoba. >>>> >>>> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są >>>> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. >>>> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś >>>> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, >>>> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). >>>> Reasumując, podrzucaj wszystko ;-) >>>> >>>> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję >>>> gwarancji, ale zobaczę, co da się zrobić. >>>> >>>> 24.10.2011, Przykuta<[email protected]> napisał(a): >>>>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych >>>>> stubów >>>>> bez źródeł, teraz robi to wiki holenderska: >>>>> >>>>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011 >>>>> >>>>> W tej chwili botują takie hasła: >>>>> >>>>> http://nl.wikipedia.org/wiki/Ahnidzor >>>>> >>>>> Ale wczoraj ładowali takie: >>>>> >>>>> http://nl.wikipedia.org/wiki/Karaops_larryoo >>>>> >>>>> http://nl.wikipedia.org/wiki/Boliscus_duricorius >>>>> >>>>> http://nl.wikipedia.org/wiki/Zoramia_fragilis >>>>> >>>>> Ze źródłami - na dwa (w porywach do trzy) boty >>>>> >>>>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco >>>>> ponad 760 000 haseł: >>>>> >>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119 >>>>> >>>>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca: >>>>> >>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142 >>>>> >>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820 >>>>> >>>>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę >>>>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać >>>>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl >>>>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za >>>>> innymi >>>>> wersjami językowymi. >>>>> >>>>> Przykuta >>>>> >>>>> _______________________________________________ >>>>> Lista dyskusyjna WikiPL-l >>>>> [email protected] >>>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >>>>> >>> >>> _______________________________________________ >>> Lista dyskusyjna WikiPL-l >>> [email protected] >>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >> >> _______________________________________________ >> Lista dyskusyjna WikiPL-l >> [email protected] >> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >> > > > _______________________________________________ > Lista dyskusyjna WikiPL-l > [email protected] > https://lists.wikimedia.org/mailman/listinfo/wikipl-l _______________________________________________ Lista dyskusyjna WikiPL-l [email protected] https://lists.wikimedia.org/mailman/listinfo/wikipl-l
