On Fri, 2006-12-15 at 08:31 +0100, Pawel Kraszewski wrote:
> Dnia piątek, 15 grudnia 2006 06:44, acze napisał:
> > obawiam sie, ze sa jezyki, przy ktorych mozemy miec problem z
> > przelozeniem akapitu na akapit, ale juz np. dzialu na dzial owszem; od
> > reki strzelam jakis chinski :)
> 
> Akapit jest jednostką podziału logicznego, nie gramatycznego. Takowoż i 
> akapity raczej występują w chińskim. Poza tym jak kartkowałem (właściwie to 
> jak nazwać przeglądanie "klikanego" dokumentu?) nasz obiekt, to tam na ogół 
> akapit==dział. Chiński jest silnie kontekstowy, więc zejście na poziom zdania 
> (to już jednostka podziału gramatycznego) faktycznie może być bez sensu - 
> chińskiej gramatyki akurat nie znam. Z kolei zdanie japońskiego dużo bardziej 
> przypomina nasze (wbrew pozorom) i tłumaczenia na poziomie zdania ma sens - 
> to akurat wiem.
> 
> Zresztą w mojej propozycji XMLa cała treść jednego (pod)*rozdziału jest 
> tłumaczona jako jedna jednostka tekstowa (chapter<contents<language*).
> 
> 宜しく

Jestem zaskoczony faktem, że projekt wzbudza tak ożywioną i merytoryczną
dyskusję. :)

Ja się z kolei obawiam innej rzeczy. Do reprezentacji XML w paradygmacie
obiektowym używa się modelu DOM, czyli struktury drzewa. Niestety taka
hierarchiczna struktura nie nadaje się do pełnego oznaczania tekstów
zapisanych "językiem naturalnym" (np. zazębiające się metafory w
poezji). Oto fragment z mojej pracy magisterskiej:

<quote>
Niestety, proponowany zarówno w XML jak i w SGML sposób kodowania danych
nie nadaje się do opisania struktury znaczeniowej wszystkich możliwych
dokumentów. Za przykład niech posłuży tutaj problem wzajemnego
"nachodzenia" tych samych elementów leksykalnych dla różnych sensów,
jaki spotkać możemy w poezji. Nawet jeśli jesteśmy w stanie określić, co
jest ekstensją dwóch metafor, to druga metafora może wykorzystywać część
słów pierwszej.

<metafora1 ekstensja="moment">mgnienie
<metafora2 ekstensja="enklawa spokoju w centrum chaosu">oka</metafora1>
cyklonu</metafora2>

Powyższy fragment XML jest niepoprawny, analogicznie jak niepoprawna
byłaby konstrukcja złożona z cudzysłowów o postaci: "mgnienie 'oka"
cyklonu'.

Założenie Fregego, że funkcja sensu zdania określona jest na funkcjach
sensu elementów składowych okazuje się w przypadku tego typu zdań języka
naturalnego bardzo problematyczne. Rzeczą ciekawą jest, że propozycja
nowych języków znaczników dla złożonych dokumentów - Markup Languages
for Complex Documents (MLCD) - usuwających niektóre wady XML związane z
wymogami co do hierarchicznej struktury treści, powstaje w związku z
elektronicznym opracowywaniem archiwów Wittgensteina na uniwersytecie w
Bergen (Norwegia).
</quote>

http://teksttek.aksis.uib.no/projects/mlcd


Mam wrażenie, że do naszych minimalnych celów XML będzie wystarczający.
Przed przygotowaniem stosownego formatu opisu tych danych, chciałbym
jednak przedyskutować parę kwestii (np. słowa kluczowe, konteksty, etc.)
z "zawodowymi" filozofami.

Mój cel jest taki - nauczyć "humanistów" (cokolwiek to oznacza :) )
używania narzędzia jakim jest XML, ale nie na poziomie "edytorskim",
tylko na "meta-poziomie", czyli na poziomie definiowania meta-składni
(niby tym się zajmują "zawodowo", a my tylko pokazujemy środki formalne
do wyrażenia tego co mają na myśli :) ).

Następny etap - mam nadzieję, że taka grupa potrafiła by też dodać
stosowne znaczniki do pierwotnego tekstu.

Potem z kolei można mnożyć dowolne narzędzia programistyczne (XML,
grafy, analiza, etc.) do przetwarzania takiego contentu.

Wynika z tego, że teraz muszę rozpropagować ideę wśród filozofów, co
spróbuję zrobić jak najszybciej. :)

-- 
"Meaning is differential not referential"

Kazimierz Pogoda
Nordic Consulting & Development Company         http://www.ncdc.pl/

Odpowiedź listem elektroniczym