Dnia 02-07-2010 o 23:56:24 picus-viridis napisał:
> Poza tym wywiadowana bibliotekarka mówiąc "kanon literatury w wielu  
> placówkach się dubluje" lekko mija się z rzeczywistością, bo w PBI mamy  
> niezczytane OCR-y. a w "Polonie" skany pojedynczych stron. Ba przykład  
> "Cyrano de Bergerac" - zob.  
> http://www.pbi.edu.pl/book_reader.php?p=54766&s=1 - zeskanowali i  
> zOCRowali identyfikatory arkuszy drukarskich (czy jak to się nazywa, ta  
> metka na początku zszywki).
>
> Picus viridis

Tu [ http://fbc.pionier.net.pl/owoc/duplicates-matrix-report ] jest garść  
statystyk na ten temat. Osobiście nie mam nic przeciwko duplikatom, gdyż w  
książkach w poszczególnych bibliotekach cyfrowych często brakuje po kilka  
stron, a niezależnie skanowana publikacja daje szansę na złożenie danej  
książki w całość.

O jakości OCR-ów w PBI lepiej się nie wypowiadać… Niestety, wyraźnie widać  
brak ręcznej weryfikacji albo – w najlepszym wypadku – bardzo pobieżne  
przeglądnięcie otrzymanego poprzez OCR tekstu.

PS Jakiś kącik biblioteczny nam się zrobił :)
-- 
[[Wikipedysta:EMeczKa]]

_______________________________________________
WikiPL-l mailing list
[email protected]
https://lists.wikimedia.org/mailman/listinfo/wikipl-l

Odpowiedź listem elektroniczym