[ideoL] Entrop=?ISO-8859-1?B?7WEgZGlncuFmaWNhIHZzIEVudHJvcO0=?=a porpalabras separadas

Luis Vï¿½lez Tue, 08 Oct 2002 04:26:12 -0700

David,

He comenzado a traducir el artï¿½culo sobre la entropï¿½a digrï¿½fica vs la
entropï¿½a de palabras para proponer su debate abierto, si no les importa.
Aqui va la primera parte del 'abstract' o resumen.
Entiendo la duda sobre la posiciï¿½n de W. Friedman acerca del lenguaje de
Dalgarno - en mi prï¿½ximo email resumirï¿½ sus argumentos al respecto, para
agregar al debate.


> [David] Asï¿½ por lo que explicas del Voynich cada palabra es mï¿½s corta
> en promedio que en inglï¿½s [menor nï¿½ de signos por palabra] y
> simultï¿½neamente la predictividad de cada caracter es mayor [menor entropï¿½a por
> signo] eso  se traduce naturalmente en que existe menor entropï¿½a por palabra.
> Asï¿½ que la conclusiï¿½n que uno saca es que lo que en inglï¿½s es una palabra en
> Voynich deben ser dos o tres palabras [ya que en el fondo la informaciï¿½n
> expresada en dos frases A y B tal que una se la traducciï¿½n de la otra en
> diferentes idiomas viene a ser la misma] En ese sentido podrï¿½amos encontrarnos
> que el Voynich es una especie de lengua como el thai o el chino (entropï¿½a por
> palabra baja y menor numero de fonemas por palabra, y de hecho en chino al
> igual que Voynich se necesitan varias palabras para expresar lo que en
> inglï¿½s se dice con una).
> Este ï¿½ltimo argumento muestra que el Voynich puede ser mï¿½s parecido al
> Chino que no a la lengua de Dalgarno! Asï¿½ que Friedman creo que estarï¿½a
> confundiendo los dos tipos de analiticidad la que presenta el chino y  la que
> presenta la lenga de Dalgarno.


Tambiï¿½n agregarï¿½ lo mï¿½s reciente acerca de la discusiï¿½n Voynich/Chino, cuyas
raices recientemente salieron a relucir, e invito a Jorge Stolfi a que
comente (portugues) esta conclusiï¿½n sobre multiplicidad de palabras para
explicar un solo tï¿½rmino.
Envï¿½o copia de este a nuestra lista dedicada al debate del tema del Voynich
en espaï¿½ol y portuguï¿½s.
Saludos,

Luis
+++++++++++++++++

"De la entropï¿½a digrï¿½fica a la entropï¿½a de palabras en el MS de Voynich "

Resï¿½men

Este trabajo investiga la cantidad de informaciï¿½n contenida en cada palabra
tipo ï¿½Voynichï¿½, y la compara con la de textos en otros lenguajes
(conocidos). A pesar del hecho de que la palabra ï¿½Voynichï¿½ promedio es mï¿½s
corta que la palabra latina o inglesa media, y que la previsibilidad de
caracteres solos en las palabras de Voynich es mï¿½s alta que en los lenguajes
normales (puesto que el ' Voynichï¿½' tiene una entropï¿½a incondicional y
condicional mï¿½s baja del carï¿½cter solo), pareciera que el vocabulario de
Voynich es tan diverso como el de los textos investigados de la comparaciï¿½n.
Esto significa que el Voynichï¿½s es mucho mï¿½s econï¿½mico en su uso de
caracteres, o que de hecho el latï¿½n (la lengua principalmente usada en las
comparaciones) es mï¿½s ' derrochador '.

No pueden extraerse conclusiones sï¿½lidas sobre la naturaleza de la lengua
del MS de Voynich en base a la estadï¿½stica presentada en este artï¿½culo
solamente, pero la evidencia que sirve de apoyo o de oposiciï¿½n para muchas
de las hipï¿½tesis frecuentes sobre la naturaleza del  ï¿½Voynichï¿½s ' puede ser
encontrada. Por ejemplo, queda demostrado que no hay razï¿½n particular para
asumir que los espacios en el texto del MS de Voynich sean cosa que espacios
normales entre palabras, y que las palabras Voynich parecen ser palabras
normales, no sï¿½labas. La comparaciï¿½n con un texto chino en el sistema de la
transcripciï¿½n de Pinyin muestra una amplia diferencia, mucho mayor que con
el latï¿½n normal, mientras que una comparaciï¿½n con una muestra
desafortunadamente corta del texto en la lengua articifical de Dalgarno
(diseï¿½ada en 1640, TBC) demuestra un ï¿½matchï¿½  asombrosamente bueno.

Introducciï¿½n 

Las entropï¿½as de un solo caracter y las entropï¿½as digrï¿½ficas o las entropï¿½as
condicionadas de un solo caracter del Voynichï¿½s son mï¿½s bajas que, por
ejemplo, en el caso del Latï¿½n o del Inglï¿½s (vï¿½ase e.g. >> artï¿½culo de Dennis
Stallings ). Tambiï¿½n, las palabras en Voynichï¿½s tienden para ser
relativamente cortas (vï¿½ase >> artï¿½culo de Gabriel Landini acerca del uso de
los leyes de Zipf en el ms ). Asï¿½, uno esperarï¿½a que las palabras en
Voynichï¿½s fueran mï¿½s restringidas o menos diversas que las palabras en
latï¿½n. Esta diversidad de palabras puede ser medida contando el nï¿½mero de
palabras diferentes (tokens) para los textos de varias longitudes, o
computando la entropï¿½a por palabra separada frente a la distribuciï¿½n de
frecuencia de palabras. Ambas estadï¿½sticas tienen algunos inconvenientes: el
nï¿½mero de tokens se ve afectadon por errores de transripciï¿½n o de deletreo y
la entropï¿½a por palabra separada se puede estimar solamente en los textos
muy largos. Ambas estadï¿½sticas serï¿½n computadas para los textos en Voynichï¿½s
y en otros lenguajes, usando muestras de la misma longitud (contada en el
nï¿½mero de palabras) para reducir al mï¿½nimo estos problemas.
Ha sido reportado ya en el pasado que una secciï¿½n grande transcrita de
Voynichï¿½s tenï¿½a una entropï¿½a por palabra separada de 10 bits, igual que el
lenguaje normal. Aquï¿½ aparece  una contradicciï¿½n evidente. Si el Voynichï¿½s
utiliza pocos caracteres con variabilidad restringida para formar un
suficiente nï¿½mero de palabras, entonces los otros lenguajes han de ser
derrochadores.

(el resto del texto puedo enviarlo a quien lo solicite en privado para no
colapsar los correos de quienes no lo encuentren de interï¿½s)


--------------------------------------------------------------------
IdeoLengua - Lista de Lingï¿½istica e Idiomas Artificiales
Suscrï¿½base en [EMAIL PROTECTED]
Informacion en http://ideolengua.cjb.net
Desglose temï¿½tico 
http://groups.yahoo.com/group/ideolengua/files/Administracion/top-ideol.htm


 

Su uso de Yahoo! Grupos estï¿½ sujeto a las http://e1.docs.yahoo.com/info/utos.html

[ideoL] Entrop=?ISO-8859-1?B?7WEgZGlncuFmaWNhIHZzIEVudHJvcO0=?=a porpalabras separadas

Responder a