już się tym zająłem.
Jak przygotuję botowalną tabelkę to dam znać

masti

On 10/24/2011 05:33 PM, Powerek38 wrote:
> Dla porządku podlinkowuję moje zgłoszenie, a dalsza dyskusja nad sprawą
> odbędzie się już pewnie na Wiki:
> http://pl.wikipedia.org/wiki/Wikipedia:Zadania_dla_bot%C3%B3w#Tworzenie_botem_artyku.C5.82.C3.B3w_o_stacjach_kolejowych_w_Wielkiej_Brytanii
>
>
> Powerek38
>
>
> W dniu 2011-10-24 16:50, masti pisze:
>> do botowania najwygodniejsza jest tabela gdzie mamy jeden wiersz na
>> rekord (artykuł) i wzór artykułu z zaznaczeniem gdzie poszczególne pola
>> mają trafić. Z tego można bardzo szybko uruchowmić botowanie po
>> sprawdzeniu ewentualnych konfliktów, disambigów etc.
>>
>> masti
>>
>> On 10/24/2011 04:36 PM, Powerek38 wrote:
>>> Witam,
>>>
>>> Bartoszu, bardzo mnie cieszy ta deklaracja. Mam już pierwszy niemal
>>> gotowy pomysł, oparty na ewidencji brytyjskich stacji kolejowych, która
>>> jest w Excelu. Szacuję, że byłoby to ok. 2 tysiące nowych haseł - zawsze
>>> coś. Rozpisuję w tej chwili, jak bot miałby przetworzyć te dane i jak ma
>>> być skonstruowany artykuł. Dam to dzisiaj w Zadaniach dla botów (w
>>> postaci linku do materiałów na podstronie w mojej osobistej
>>> przestrzeni), pozwolę sobie powiadomić też Ciebie.
>>>
>>> Mam też troszeczkę bardziej złożony pomysł dotyczący wspomnianej już
>>> bazy catholic-hierarchy.org - tu mówilibyśmy już o znacznie większej
>>> liczbie haseł, bo ta baza posiada dane o wszystkich katolickich
>>> diecezjach i wszystkich biskupach z ostatnich 300 lat. Pytanie tylko,
>>> czy Twój (lub inny) bot potrafiłby wyciągnąć sobie dane (oczywiście na
>>> podstawie szczegółowo rozpisanego algorytmu przetwarzania) na przykład z
>>> takiej strony jak ta: http://www.catholic-hierarchy.org/bishop/bgreger.html
>>>
>>> Pozdrawiam!
>>>
>>> Powerek38
>>>
>>>
>>>
>>> W dniu 2011-10-24 16:13, Bartosz Dziewoński pisze:
>>>> To ja tylko wspomnę, że MatmaBot dawno nie robił nic fajnego. Pomysł
>>>> ze stroną do wrzucania różnych baz danych mi się podoba.
>>>>
>>>> Powerek - jeśli dane są prosto na stronach HTML, to zazwyczaj są
>>>> "wyciągalne". Najłatwiej oczywiście ciągnąć z gotowej tabeli (np.
>>>> XLS), najtrudniej z PDF-ów (choć czasem się da, jakiś czas temu ktoś
>>>> podlinkował na Zadaniach dla botów PDF-y z bodajże danymi o gminach,
>>>> coś tam z nich uzyskałem, ale niewiele i w końcu nie botowałem).
>>>> Reasumując, podrzucaj wszystko ;-)
>>>>
>>>> Marek - a podlinkuj jakąś bazę. Cienko u mnie z czasem, więc nie daję
>>>> gwarancji, ale zobaczę, co da się zrobić.
>>>>
>>>> 24.10.2011, Przykuta<[email protected]>     napisał(a):
>>>>> W lipcu tego roku hiszpańska wiki jednego dnia puściła 14 000 małych 
>>>>> stubów
>>>>> bez źródeł, teraz robi to wiki holenderska:
>>>>>
>>>>> http://meta.wikimedia.org/wiki/Wikimedia_News#October_2011
>>>>>
>>>>> W tej chwili botują takie hasła:
>>>>>
>>>>> http://nl.wikipedia.org/wiki/Ahnidzor
>>>>>
>>>>> Ale wczoraj ładowali takie:
>>>>>
>>>>> http://nl.wikipedia.org/wiki/Karaops_larryoo
>>>>>
>>>>> http://nl.wikipedia.org/wiki/Boliscus_duricorius
>>>>>
>>>>> http://nl.wikipedia.org/wiki/Zoramia_fragilis
>>>>>
>>>>> Ze źródłami - na dwa (w porywach do trzy) boty
>>>>>
>>>>> W tej chwili nl wiki dobija do 820 000 haseł. Kilka dni temu miała nieco
>>>>> ponad 760 000 haseł:
>>>>>
>>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2997119
>>>>>
>>>>> Hiszpanie też zrobili duży skok użyciem botów na początku lipca:
>>>>>
>>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2655142
>>>>>
>>>>> http://meta.wikimedia.org/w/index.php?title=List_of_Wikipedias/Table&oldid=2729820
>>>>>
>>>>> Oczywiście, ze względu na wymuszony podgląd (i tym samym mniejszą liczbę
>>>>> edycji - nie wykonujemy 20 edycji na minutę, by za każdym razem poprawiać
>>>>> jeszcze jedną literówkę) oraz kasowanie zbędnych stron dyskusji jakość pl
>>>>> wiki, jaką wyznacza oficjalnie parametr depth, jest daleko w tyle za 
>>>>> innymi
>>>>> wersjami językowymi.
>>>>>
>>>>> Przykuta
>>>>>
>>>>> _______________________________________________
>>>>> Lista dyskusyjna WikiPL-l
>>>>> [email protected]
>>>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>>>>>
>>>
>>> _______________________________________________
>>> Lista dyskusyjna WikiPL-l
>>> [email protected]
>>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>>
>> _______________________________________________
>> Lista dyskusyjna WikiPL-l
>> [email protected]
>> https://lists.wikimedia.org/mailman/listinfo/wikipl-l
>>
>
>
> _______________________________________________
> Lista dyskusyjna WikiPL-l
> [email protected]
> https://lists.wikimedia.org/mailman/listinfo/wikipl-l


_______________________________________________
Lista dyskusyjna WikiPL-l
[email protected]
https://lists.wikimedia.org/mailman/listinfo/wikipl-l

Odpowiedź listem elektroniczym