do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola mają trafić. Z tego można bardzo szybko uruchowmić botowanie po sprawdzeniu ewentualnych konfliktów, disambigów etc.
masti On 10/24/2011 04:36 PM, Powerek38 wrote: > Witam, > > Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal > gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która > jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze > coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma > być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w > postaci linku do materiałów na podstronie w mojej osobistej > przestrzeni), pozwolę sobie powiadomić też Ciebie. > > Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już > bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej > liczbie haseł, bo ta baza posiada dane o wszystkich katolickich > diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko, > czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na > podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z > takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html > > Pozdrawiam! > > Powerek38 > > > > W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze: >> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł >> ze stroną do wrzucania różnych baz danych mi się podoba. >> >> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są >> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np. >> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś >> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach, >> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem). >> Reasumując, podrzucaj wszystko ;-) >> >> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję >> gwarancji, ale zobaczę, co da się zrobić. >> >> 24.10.2011, Przykuta<[email protected]> napisał(a): >>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów >>> bez źródeł, teraz robi to wiki holenderska: >>> >>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011 >>> >>> W tej chwili botują takie hasła: >>> >>> http://nl.wikipedia.org/wiki/Ahnidzor >>> >>> Ale wczoraj ładowali takie: >>> >>> http://nl.wikipedia.org/wiki/Karaops_larryoo >>> >>> http://nl.wikipedia.org/wiki/Boliscus_duricorius >>> >>> http://nl.wikipedia.org/wiki/Zoramia_fragilis >>> >>> Ze źródłami - na dwa (w porywach do trzy) boty >>> >>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco >>> ponad 760 000 haseł: >>> >>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119 >>> >>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca: >>> >>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142 >>> >>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820 >>> >>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę >>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać >>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl >>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi >>> wersjami językowymi. >>> >>> Przykuta >>> >>> _______________________________________________ >>> Lista dyskusyjna WikiPL-l >>> [email protected] >>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l >>> >> > > > _______________________________________________ > Lista dyskusyjna WikiPL-l > [email protected] > https://lists.wikimedia.org/mailman/listinfo/wikipl-l _______________________________________________ Lista dyskusyjna WikiPL-l [email protected] https://lists.wikimedia.org/mailman/listinfo/wikipl-l
