Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-19 Por tema d1d4c
On 19/10/13 18:43, azalai wrote:
> no he entendido muy bien lo que quereis hacer pero soy una de las admin
> de la lista

Bueno, creo que hay varias motivaciones. Por un lado está el disponer de
datos libres (el archivo de esta lista, en este caso) para experimentar
con R (un lenguaje y entorno de programación para análisis estadístico y
gráfico), y por otro lado, las conclusiones que de tal análisis pudieran
extraerse, así como la posibilidad de crear una herramienta (un script)
que dé visibilidad (una visualización) de algún factor que pudiera ser
interesante tener en cuenta referente al tráfico (actividad) de esta lista.

> Es EVIDENTE que no he guardado todas las notificaciones que me han
> llehado a lo largo de estos años,

Sí, es evidente, claro, es lo que decía.

> pero seguro que si hablais con algún
> root de SD, que los hay en esta lista, probablemente os lo aclare sin 
> problema:-)

Sí, seguramente, pero no hace falta que sea un admin de Sindominio, es
decir, con saber como funciona Mailman en este sentido (si se guardan
las fechas de las suscripciones en la base de datos), basta (es que no
me gusta pedir cosas a las admins de Sindominio, aunque lo haga
igualmente... es que nunca he entendido porqué una ha de ser de
Sindominio para pode tener permisos como Hackmeeting en Sindominio, por
eso mi empeño en tirar para adelante la iniciativa de la Servidora
Nómada, pero este es otro tema).

Por otro lado, no necesitamos esos datos, podemos experimentar con R con
los datos que están publicados vía web por el pipermail de Mailman (el
archivo web); un poco de wget, un poco de awk y R que erre.

Lo de las fechas de las suscripciones era por empezar por algo. Podemos
empezar por otros datos igualmente públicos, pero más accesibles.

> my two cents,

Gracias :)


___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-19 Por tema azalai
no he entendido muy bien lo que quereis hacer pero soy una de las admin 
de la lista
Es EVIDENTE que no he guardado todas las notificaciones que me han 
llehado a lo largo de estos años, pero seguro que si hablais con algún 
root de SD, que los hay en esta lista, probablemente os lo aclare sin  
problema:-)


my two cents,

azalai/marais/marga

On 19/10/13 14:18, d1d4c wrote:

On 19/10/13 12:43, Hackelarre wrote:


Si enviais un tabla que tenga el historial de las suscripciones a la
lista podemos empezar experimentando. Con que tenga solo una columna,
fecha/hora de inscripcion seria suficiente, aunque no da mucho juego
pero como prueba puede estar bien.

He estado un rato investigando sobre esto, y no he podido constatar que
la fecha de suscripción quede en la db de Mailman. Ojalá sí. Lo único
que he visto que comentaba un suscriptor de la lista
[Mailman-Developers], es que esa información se graba en el log de
Mailman. Pero eso no nos sirve, ya que me imagino que el log debe tener
un tamaño máximo y debe reescribirse, por lo que no creo que tenga esa
información durante tanto tiempo. Otra manera sería las notificaciones
por email a las admin de nuevas suscripciones, pero a ver quién ha
guardado eso durante tanto tiempo. He preguntado en el IRC #mailman, a
ver si me responde alguien...

Quizás sería más rápido si alguien pudiera entrar en la base de datos de
un Mailman y comprobar las tablas, a ver si aparece la fecha de suscripción.


Yo simplemente voy soltando ideas... y no podré asistir al nodo
presencialmente, o sea que no me hagáis mucho caso XD

No no no eso no vale! El que lo propone se lo ... jajaja. Es broma ;-).
Suelta esas ideas, haber lo que sale. Y si no sale nada no pasa nada,
que el nodo original esta preparado.


Vamos viendo a dónde nos lleva ésto, si hace falta abrimos un hilo nuevo
o pasamos a la interfaz wiki.

Si vamos a experimentar, igual no estaría mal abrir otro hilo, si no la
gente se va a hartar antes del nodo.

Cierto.


___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-19 Por tema d1d4c
On 19/10/13 12:43, Hackelarre wrote:

> Si enviais un tabla que tenga el historial de las suscripciones a la
> lista podemos empezar experimentando. Con que tenga solo una columna,
> fecha/hora de inscripcion seria suficiente, aunque no da mucho juego
> pero como prueba puede estar bien.

He estado un rato investigando sobre esto, y no he podido constatar que
la fecha de suscripción quede en la db de Mailman. Ojalá sí. Lo único
que he visto que comentaba un suscriptor de la lista
[Mailman-Developers], es que esa información se graba en el log de
Mailman. Pero eso no nos sirve, ya que me imagino que el log debe tener
un tamaño máximo y debe reescribirse, por lo que no creo que tenga esa
información durante tanto tiempo. Otra manera sería las notificaciones
por email a las admin de nuevas suscripciones, pero a ver quién ha
guardado eso durante tanto tiempo. He preguntado en el IRC #mailman, a
ver si me responde alguien...

Quizás sería más rápido si alguien pudiera entrar en la base de datos de
un Mailman y comprobar las tablas, a ver si aparece la fecha de suscripción.

>> Yo simplemente voy soltando ideas... y no podré asistir al nodo
>> presencialmente, o sea que no me hagáis mucho caso XD
>
> No no no eso no vale! El que lo propone se lo ... jajaja. Es broma ;-).
> Suelta esas ideas, haber lo que sale. Y si no sale nada no pasa nada,
> que el nodo original esta preparado.
>
>> Vamos viendo a dónde nos lleva ésto, si hace falta abrimos un hilo nuevo
>> o pasamos a la interfaz wiki.
>
> Si vamos a experimentar, igual no estaría mal abrir otro hilo, si no la
> gente se va a hartar antes del nodo.

Cierto.


___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-19 Por tema Hackelarre
> Perfecto, emma está en python y tiene interfaz Mediawiki; y eso unido a
> la Extension:R y a SMW (Semantic Mediawiki), puede dar mucho juego.
>
> Supongo que lo mejor es empezar por algo sencillo, que ilustre a efectos
> didácticos, pero al mismo tiempo, que el script generado sea también una
> pequeña herramienta (juguete) a nuestra disposición. Aprender y crear,
> van de la mano, no? ;)
Si enviais un tabla que tenga el historial de las suscripciones a la
lista podemos empezar experimentando. Con que tenga solo una columna,
fecha/hora de inscripcion seria suficiente, aunque no da mucho juego
pero como prueba puede estar bien. Puede ser un archivo csv (o el
formato que mas facil os venga) o sino crear un usuario de la base de
datos que tenga solo permisos para esa tabla, y asi le damos un poco de
dinamismo a la pagina.
> Yo simplemente voy soltando ideas... y no podré asistir al nodo
> presencialmente, o sea que no me hagáis mucho caso XD
No no no eso no vale! El que lo propone se lo ... jajaja. Es broma ;-).
Suelta esas ideas, haber lo que sale. Y si no sale nada no pasa nada,
que el nodo original esta preparado.
> Vamos viendo a dónde nos lleva ésto, si hace falta abrimos un hilo nuevo
> o pasamos a la interfaz wiki.
Si vamos a experimentar, igual no estaría mal abrir otro hilo, si no la
gente se va a hartar antes del nodo.

kobe
___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema d1d4c
On 17/10/13 18:01, Gorka Kobeaga wrote:
> El 17/10/13 13:59, d1d4c escribió:
>> On 17/10/13 13:32, shokah wrote:
>>
 Con metadatos, en este caso, os referís a las cabeceras, no?
>>>
>>> Sí, me refiero a las cabeceras.
>>
>>> Además, si añadimos nosotros metadatos
>>
>> Sería interesante algún tipo de visualización en línea con un sistema en
>> tiempo real. Quizás se podría incluir el script como plugin de emma en
>> la servidora nómada.
> 
> +1 visualizción en linea
> 
> Otra opción seria utilizar knit, para generar documento html que tiene
> código de R. Os mando un ejemplo.

Muy interesante. Esto me ha hecho buscar si había alguna extensión de R
para Mediawiki, y sí, existe Extension:R. Podríamos jugar en la wiki del
Hackmeeting con eso, y así documentamos el experimento.

> pregunta 1, como guarda o gestiona procmail los mails? En texto o en una
> base de datos?

Si usásemos a emma, ella los guarda en mongodb. No estoy proponiendo
usar todo el archivo de la lista, digo que el archivo es una buena
fuente de datos para experimentar con R y otras cosas.

> pregunta 2,
> un script Rhtml + una función de actualización en php|python =
> visualización en linea? Por cierto existe una librería en python para R,
> Rpy.

Perfecto, emma está en python y tiene interfaz Mediawiki; y eso unido a
la Extension:R y a SMW (Semantic Mediawiki), puede dar mucho juego.

Supongo que lo mejor es empezar por algo sencillo, que ilustre a efectos
didácticos, pero al mismo tiempo, que el script generado sea también una
pequeña herramienta (juguete) a nuestra disposición. Aprender y crear,
van de la mano, no? ;)

> No he subido de momento el nodo a la wiki. Voy a esperar a como
> evoluciona la propuesta de nodo, pues el objetivo era ver algo mas
> avanzado de R, pero mucho mejor si sirve para crear una herramienta.

Yo simplemente voy soltando ideas... y no podré asistir al nodo
presencialmente, o sea que no me hagáis mucho caso XD

> Lo de los procesos estaría a mano en todo caso, nos servirá como ejemplo
> para algunas cosas. También si hace falta explicar, no tengo problemas.

Vamos viendo a dónde nos lleva ésto, si hace falta abrimos un hilo nuevo
o pasamos a la interfaz wiki.


___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema Gorka Kobeaga
El 17/10/13 13:59, d1d4c escribió:
> On 17/10/13 13:32, shokah wrote:
> 
>>> Con metadatos, en este caso, os referís a las cabeceras, no?
>>
>> Sí, me refiero a las cabeceras.
> 
>> Además, si añadimos nosotros metadatos
> 
> Sería interesante algún tipo de visualización en línea con un sistema en
> tiempo real. Quizás se podría incluir el script como plugin de emma en
> la servidora nómada.

+1 visualizción en linea

Otra opción seria utilizar knit, para generar documento html que tiene
código de R. Os mando un ejemplo.

pregunta 1, como guarda o gestiona procmail los mails? En texto o en una
base de datos?

pregunta 2,
un script Rhtml + una función de actualización en php|python =
visualización en linea? Por cierto existe una librería en python para R,
Rpy.

No he subido de momento el nodo a la wiki. Voy a esperar a como
evoluciona la propuesta de nodo, pues el objetivo era ver algo mas
avanzado de R, pero mucho mejor si sirve para crear una herramienta.

Lo de los procesos estaría a mano en todo caso, nos servirá como ejemplo
para algunas cosas. También si hace falta explicar, no tengo problemas.

> 
> 
> 
> ___
> HackMeeting mailing list
> HackMeeting@listas.sindominio.net
> https://listas.sindominio.net/mailman/listinfo/hackmeeting
> 
Title: Title






This is an R HTML document. When you click the Knit HTML button a web page will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)

##  speed   dist
##  Min.   : 4.0   Min.   :  2  
##  1st Qu.:12.0   1st Qu.: 26  
##  Median :15.0   Median : 36  
##  Mean   :15.4   Mean   : 43  
##  3rd Qu.:19.0   3rd Qu.: 56  
##  Max.   :25.0   Max.   :120




You can also embed plots, for example:

plot(cars)









Title




This is an R HTML document. When you click the Knit HTML button a web page will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:



You can also embed plots, for example:





<>___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting

Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema d1d4c
On 17/10/13 13:32, shokah wrote:

>> Con metadatos, en este caso, os referís a las cabeceras, no?
> 
> Sí, me refiero a las cabeceras.

> Además, si añadimos nosotros metadatos

Sería interesante algún tipo de visualización en línea con un sistema en
tiempo real. Quizás se podría incluir el script como plugin de emma en
la servidora nómada.



___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema d1d4c
On 17/10/13 12:50, Hackelarre wrote:
> El 17/10/13 12:39, d1d4c escribió:
>> On 17/10/13 12:19, Gorka Kobeaga wrote:
>>
>>> No se que información podríamos sacar de los metadatos
>> Con metadatos, en este caso, os referís a las cabeceras, no?
>>
> Creo que yo me he liado.
> Si con metadato se refiere Autor/Tema/Fecha es lo que interesaría analizar.

Cuando yo decía que el archivo tiene un montón de datos interesantes, me
refería a los mensajes (incluidas las cabeceras), a los mensajes
íntegros, en bruto; por lo que consideré las cabeceras como datos en sí
y no como metadatos de los textos que los mensajes incluyen en sus cuerpos.



___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema shokah
Kaixo!

> > No se que información podríamos sacar de los metadatos
> 
> Con metadatos, en este caso, os referís a las cabeceras, no?

Sí, me refiero a las cabeceras. Se pueden utilizar para crear estadísticas como:

- participación en la lista por usuario
- participación en la lista por fechas/horas
- participación de un usuario por hilos
- duración de los hilos
- conversaciones con solamente dos 

Además, si añadimos nosotros metadatos como pueden ser los temas y la
resolución positiva de los hilos etc. se pueden sacar unas cuantas
estadísticas más.

Agur!


signature.asc
Description: PGP signature
___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting

Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema Hackelarre
El 17/10/13 12:39, d1d4c escribió:
> On 17/10/13 12:19, Gorka Kobeaga wrote:
>
>> No se que información podríamos sacar de los metadatos
> Con metadatos, en este caso, os referís a las cabeceras, no?
>
Creo que yo me he liado.
Si con metadato se refiere Autor/Tema/Fecha es lo que interesaría analizar.
> ___
> HackMeeting mailing list
> HackMeeting@listas.sindominio.net
> https://listas.sindominio.net/mailman/listinfo/hackmeeting

___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema d1d4c
On 17/10/13 12:19, Gorka Kobeaga wrote:

> No se que información podríamos sacar de los metadatos

Con metadatos, en este caso, os referís a las cabeceras, no?

___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-17 Por tema Gorka Kobeaga
El 17/10/13 07:42, shokah escribió:
> Kaixo!
> 
>> A mí, lo primero que me ha venido a la mente es el propio archivo de
>> esta lista: es público, indexado, nos concierne y dispone de un montón
>> de datos que filtrados y visualizados convenientemente pueden aportar
>> información interesante y plantear nuevos debates.
> 
No se me había ocurrido! Se puede utilizar para analizar la
participación en la lista, muy interesante. Y si ademas tenemos datos
como edad, años de experiencia en el hackmeeting, genero, área(s) de
conocimiento, idioma...  de los usuarixs (aportados por propia voluntad)
puede ser muy útil para el debate de donde venimos a donde vamos, no creéis?

> +1 los metadatos de correos e hilos pueden ser interesantes. 
> 


> Aún así, estos requieren de un procesamiento previo, no sé si existe
> alguna librería de R que nos pueda servir (dejando de lado las
> expresiones regulares). 
> 
> Si no la hay, me animo a llevar los datos preprocesados. Para ello,
> tendríamos que detallar un poco qué es lo que vamos a intentar analizar.
>

No se que información podríamos sacar de los metadatos, pero puede ser
muy interesante para ir desarrollando librerías para trabajar con metadatos.

En la documentación, que mas o menos ya esta listo, hay
comandos/funciones/algoritmos que abarcan las necesidades mas comunes.
Seria cambiar el fichero de lectura, acomodarlo, si hace falta programar
y ejecutarlo. Si quieres te la mando para hacerte una idea.

> Agur!
> 

Ondo segi!

kobe
> 
> 
> ___
> HackMeeting mailing list
> HackMeeting@listas.sindominio.net
> https://listas.sindominio.net/mailman/listinfo/hackmeeting
> 



0x08941635.asc
Description: application/pgp-keys
___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting

Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-16 Por tema shokah
Kaixo!

> A mí, lo primero que me ha venido a la mente es el propio archivo de
> esta lista: es público, indexado, nos concierne y dispone de un montón
> de datos que filtrados y visualizados convenientemente pueden aportar
> información interesante y plantear nuevos debates.

+1 los metadatos de correos e hilos pueden ser interesantes. 

Aún así, estos requieren de un procesamiento previo, no sé si existe
alguna librería de R que nos pueda servir (dejando de lado las
expresiones regulares). 

Si no la hay, me animo a llevar los datos preprocesados. Para ello,
tendríamos que detallar un poco qué es lo que vamos a intentar analizar.

Agur!


signature.asc
Description: PGP signature
___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting

Re: [hm] [nodo] Análisis de los procesos de Linux con R

2013-10-16 Por tema d1d4c
On 16/10/13 20:00, Gorka Kobeaga wrote:

> (En un principio tenia la idea de analizar datos que podrían ser útiles
> para el movimiento, pero no encontré nada (ni he pedido la verdad, me
> daba mal rollo andar pidiendo datos). Si algun colectivo tiene algo que
> quiere estudiar, que comparta en el hm y a ver que sacamos entre todxs.)
A mí, lo primero que me ha venido a la mente es el propio archivo de
esta lista: es público, indexado, nos concierne y dispone de un montón
de datos que filtrados y visualizados convenientemente pueden aportar
información interesante y plantear nuevos debates.



___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting


[hm] [nodo] Análisis de los procesos de Linux con R

2013-10-16 Por tema Gorka Kobeaga
[nodo] Análisis de los procesos de Linux con R

Descripción:
Este nodo va a ser la continuación del nodo anterior, nos servirá para
hacernos una idea del potencial que puede tener R. También para el que
quiera tener una idea básica de los procesos que se ejecutan en linux, a
mi me ha servido muchísimo. El nodo se basara en exprimir la información
del comando ps.

En concreto, el comando de Linux en que nos basaremos va a ser ps -Alf.
Pero la verdad es que hasta ahora solo he utilizado ps para ver el pid
cuando he necesitado matar algún proceso. Si alguien cree que otras
opciones pueden estar mejor, puede proponerlo.

(En un principio tenia la idea de analizar datos que podrían ser útiles
para el movimiento, pero no encontré nada (ni he pedido la verdad, me
daba mal rollo andar pidiendo datos). Si algun colectivo tiene algo que
quiere estudiar, que comparta en el hm y a ver que sacamos entre todxs.)


Metodología(charla+lab):
Importaremos el output de ps desde R y manipularemos la tabla hasta
ponerlo a nuestro gusto.
Nos haremos una idea de las variables que estamos trabajando.
Aprenderemos a hacer gráficos un poco mas avanzados y gráficos 3D.
Cluster de los procesos en base a diferentes intereses y políticas de
agrupamiento.
Utilizando la regresión lineal veremos que influye (UID? PID? CMD?...)
en el tiempo que esta un proceso en la CPU.
Para que no quede sin ver: terminaremos viendo como importar tablas y
hacer queries en R de MySQL.

Idioma: Castellano, material también en castellano.
Conocimientos previos: mejor si te suene algo de estadística( variables
cuanti/cuali, media, regresión lineal) y nociones básicas de
programación. Lo teórico no tiene peso en el nodo, lo que haga falta ya
explicare.
duración: miedo me da. 90 min en principio.
tag: R

Creo que con este nodo se podría abarcar una parte del nodo deseado de
maquetación en Latex, pues se utiliza Sweave para la documentación. Pero
no quiero liarme con tres nodos y me gustaría ir a otros. Tampoco creo
que soy el apropiado para dar nodos que tengan que ver con diseño, lxs
que me conocen ya saben porque lo digo... pero si se desea fuertemente y
si no hay otra...


kobe


0x08941635.asc
Description: application/pgp-keys
___
HackMeeting mailing list
HackMeeting@listas.sindominio.net
https://listas.sindominio.net/mailman/listinfo/hackmeeting