Witam, Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w postaci linku do materiałów na podstronie w mojej osobistej przestrzeni), pozwolę sobie powiadomić też Ciebie.
Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej liczbie haseł, bo ta baza posiada dane o wszystkich katolickich diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html Pozdrawiam! Powerek38 W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze: > To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł > ze stroną do wrzucania różnych baz danych mi się podoba. > > Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są > "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. > XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś > podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, > coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). > Reasumując, podrzucaj wszystko ;-) > > Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję > gwarancji, ale zobaczę, co da się zrobić. > > 24.10.2011, Przykuta<[email protected]> napisał(a): >> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów >> bez źródeł, teraz robi to wiki holenderska: >> >> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011 >> >> W tej chwili botują takie hasła: >> >> http://nl.wikipedia.org/wiki/Ahnidzor >> >> Ale wczoraj ładowali takie: >> >> http://nl.wikipedia.org/wiki/Karaops_larryoo >> >> http://nl.wikipedia.org/wiki/Boliscus_duricorius >> >> http://nl.wikipedia.org/wiki/Zoramia_fragilis >> >> Ze źródłami - na dwa (w porywach do trzy) boty >> >> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco >> ponad 760 000 haseł: >> >> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119 >> >> Hiszpanie też zrobili duży skok użyciem botów na początku lipca: >> >> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142 >> >> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820 >> >> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę >> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać >> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl >> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi >> wersjami językowymi. >> >> Przykuta >> >> _______________________________________________ >> Lista dyskusyjna WikiPL-l >> [email protected] >> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >> > _______________________________________________ Lista dyskusyjna WikiPL-l [email protected] https://lists.wikimedia.org/mailman/listinfo/wikipl-l
