Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą 
odbędzie się już pewnie na Wiki: 
http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_botem_artyku.C5.82.C3.B3w_o_stacjach_kolejowych_w_Wielkiej_Brytanii
 


Powerek38


W dniu 2011-10-24 16:50, masti pisze:
> do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na
> rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola
> mają trafić. Z tego można bardzo szybko uruchowmić botowanie po
> sprawdzeniu ewentualnych konfliktów, disambigów etc.
>
> masti
>
> On 10/24/2011 04:36 PM, Powerek38 wrote:
>> Witam,
>>
>> Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal
>> gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która
>> jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze
>> coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma
>> być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w
>> postaci linku do materiałów na podstronie w mojej osobistej
>> przestrzeni), pozwolę sobie powiadomić też Ciebie.
>>
>> Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już
>> bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej
>> liczbie haseł, bo ta baza posiada dane o wszystkich katolickich
>> diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko,
>> czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na
>> podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z
>> takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
>>
>> Pozdrawiam!
>>
>> Powerek38
>>
>>
>>
>> W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
>>> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł
>>> ze stroną do wrzucania różnych baz danych mi się podoba.
>>>
>>> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są
>>> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np.
>>> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś
>>> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach,
>>> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem).
>>> Reasumując, podrzucaj wszystko ;-)
>>>
>>> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję
>>> gwarancji, ale zobaczę, co da się zrobić.
>>>
>>> 24.10.2011, Przykuta<[email protected]>    napisał(a):
>>>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów
>>>> bez źródeł, teraz robi to wiki holenderska:
>>>>
>>>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
>>>>
>>>> W tej chwili botują takie hasła:
>>>>
>>>> http://nl.wikipedia.org/wiki/Ahnidzor
>>>>
>>>> Ale wczoraj ładowali takie:
>>>>
>>>> http://nl.wikipedia.org/wiki/Karaops_larryoo
>>>>
>>>> http://nl.wikipedia.org/wiki/Boliscus_duricorius
>>>>
>>>> http://nl.wikipedia.org/wiki/Zoramia_fragilis
>>>>
>>>> Ze źródłami - na dwa (w porywach do trzy) boty
>>>>
>>>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco
>>>> ponad 760 000 haseł:
>>>>
>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119
>>>>
>>>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
>>>>
>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142
>>>>
>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820
>>>>
>>>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę
>>>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać
>>>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl
>>>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi
>>>> wersjami językowymi.
>>>>
>>>> Przykuta
>>>>
>>>> _______________________________________________
>>>> Lista dyskusyjna WikiPL-l
>>>> [email protected]
>>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>>>>
>>
>> _______________________________________________
>> Lista dyskusyjna WikiPL-l
>> [email protected]
>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>
> _______________________________________________
> Lista dyskusyjna WikiPL-l
> [email protected]
> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>


_______________________________________________
Lista dyskusyjna WikiPL-l
[email protected]
https://lists.wikimedia.org/mailman/listinfo/wikipl-l

Odpowiedź listem elektroniczym