do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na 
rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola 
mają trafić. Z tego można bardzo szybko uruchowmić botowanie po 
sprawdzeniu ewentualnych konfliktów, disambigów etc.

masti

On 10/24/2011 04:36 PM, Powerek38 wrote:
> Witam,
>
> Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal
> gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która
> jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze
> coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma
> być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w
> postaci linku do materiałów na podstronie w mojej osobistej
> przestrzeni), pozwolę sobie powiadomić też Ciebie.
>
> Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już
> bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej
> liczbie haseł, bo ta baza posiada dane o wszystkich katolickich
> diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko,
> czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na
> podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z
> takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
>
> Pozdrawiam!
>
> Powerek38
>
>
>
> W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
>> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł
>> ze stroną do wrzucania różnych baz danych mi się podoba.
>>
>> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są
>> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np.
>> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś
>> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach,
>> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem).
>> Reasumując, podrzucaj wszystko ;-)
>>
>> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję
>> gwarancji, ale zobaczę, co da się zrobić.
>>
>> 24.10.2011, Przykuta<[email protected]>   napisał(a):
>>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych stubów
>>> bez źródeł, teraz robi to wiki holenderska:
>>>
>>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
>>>
>>> W tej chwili botują takie hasła:
>>>
>>> http://nl.wikipedia.org/wiki/Ahnidzor
>>>
>>> Ale wczoraj ładowali takie:
>>>
>>> http://nl.wikipedia.org/wiki/Karaops_larryoo
>>>
>>> http://nl.wikipedia.org/wiki/Boliscus_duricorius
>>>
>>> http://nl.wikipedia.org/wiki/Zoramia_fragilis
>>>
>>> Ze źródłami - na dwa (w porywach do trzy) boty
>>>
>>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco
>>> ponad 760 000 haseł:
>>>
>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119
>>>
>>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
>>>
>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142
>>>
>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820
>>>
>>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę
>>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać
>>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl
>>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za innymi
>>> wersjami językowymi.
>>>
>>> Przykuta
>>>
>>> _______________________________________________
>>> Lista dyskusyjna WikiPL-l
>>> [email protected]
>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>>>
>>
>
>
> _______________________________________________
> Lista dyskusyjna WikiPL-l
> [email protected]
> https://lists.wikimedia.org/mailman/listinfo/wikipl-l


_______________________________________________
Lista dyskusyjna WikiPL-l
[email protected]
https://lists.wikimedia.org/mailman/listinfo/wikipl-l

Odpowiedź listem elektroniczym