On 21/04/10 05:42, Juan Camilo Hernandez D wrote:

En mi trabajo de grado contemplo hacer un análisis de agrupamiento
(Cluster Analysis) para esto he contemplado utilizar el modulo de python
pycluster y para graficar los resultados utilizar la herramienta matplotlib.

El problema consiste en cambiar el formato de mis datos a un formato
donde las columnas representen las variables y las filas los datos,
agregando tres columnas adicionales para identificar cada conjunto de
datos. Un ejemplo de lo que deseo conseguir es el siguiente:
http://pastebin.com/ja86AJWP

Una pregunta: si dices que todo el proceso vas a hacerlo en Python (parser + pycluster + matplotlib), ¿por qué generas un fichero de texto intermedio? (con todo el trabajo que ello acarrea)

Le escribo por que si bien tengo un  poco de experiencia programando con
python, mis habilidades en el manejo de archivos es muy poca.
Adicionalmente no he podido encontrar ejemplos donde se muestre algo
similar a lo que deseo conseguir.

La CPP (copy&paste programming) no suele dar buenos resultados. Incluso usando soluciones buenas que te den en la lista, si no dominas el lenguaje un día vas a querer hacer una modificación y te verás varado nuevamente.

Mi recomendación: aprender lo suficiente de Python para programar un parseado relativamente simple como el que describes son unas pocas tardes de estudio, te va a salir a cuenta "gastarlas". Cuando tengas una solución más o menos funcional puedes mandarla a la lista y te podremos recomendar mejoras (si ha lugar).
_______________________________________________
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/

Responder a