Programar en Linux

Horst H. von Brand Mon Oct 23 17:25:36 2006

GermÃ¡n PoÃ³ CaamaÃ±o <[EMAIL PROTECTED]> wrote:
> On Mon, 2006-10-23 at 14:00 -0300, Horst H. von Brand wrote:
> > Juan MartÃÂnez <[EMAIL PROTECTED]> wrote:
> > [...]
> > > Un lenguaje compilado, en general, siempre (o casi siempre) sera la
> > > mejor alternativa a usar.
> > [...]
> > >                           Sobre todo si es para un sistema complejo
> > > (un SIA por ejemplo), dado que serÃÂ¡ mas rapido que un lenguaje
> > > interpretado.
> > 
> > Lo cual es totalmente irrelevante. Que el SIA se demore 0,5s o 0,01s en
> > responder, si el perejil en la pagina web al otro lado de Chile luego pasa
> > 5s pensando que hacer a continuacion no hace particular diferencia. Si, si
> > tienes decenas de miles de usuarios simultaneos es vital, pero eso se da
> > solo cuando muestran los resultados de las elecciones ;-)


> > [Si, /hay/ casos en los cuales el rendimiento realmente es crucial, pero
> >  son muchisisimos menos de lo que uno cree. Ve y mira la carga en tu
> >  "servidor" vecino, rara vez pasa del 40% en mi experiencia, tipicamente
> >  mucho menos...]

> Esa postura, que si bien comparto en parte, es peligrosa.  Sobre todo en
> manos inexpertas que pueden creerte a ojos cerrado todo lo que dices.

Tienes razon con eso tambien...

> Bajo esa lÃ³gica, hay muchos /ingenieros de software/ que los problemas
> de rendimiento se lo achacan a la mÃ¡quina, al sistema operativo, al
> motor de base de datos o a lo "complejo del sistema".  JamÃ¡s al mal
> diseÃ±o de sus algoritmos o de la lÃ³gica retorcida de sus propios
> programas.

Si, /vivamente/ recuerdo un caso de una generacion de listados que se
demoraba horas (literalmente!), y eso /despues/ de multiplicar por 4 la
maquina seguia en las mismas; una reestructuracion de las consultas a la BD
bajo eso a cosa de un minuto. Tiempo invertido: Una media tarde...

[...]

> Eso escapa al lenguaje, escapa incluso si es compilado o interpretado.
> Y aunque las HH sean mÃ¡s caras, cuando esas HH te exigen aumentar el
> HW una vez al aÃ±o a una potencia 4 veces mayor... 

Lamentablemente no hay ley de Moore para las HH... mas bien parece que lo
contrario :-(


El punto final de "mejorar rendimiento" es:

- Es suficiente? Si es asi, OK. Salir a carretear... [Mejorar rendimiento
  si ya es suficiente no tiene particular chiste...]
- No es suficiente? Estudiar el problema, /a todo lo ancho/: Considerar mas
  maquina, cambio de lenguaje, distribuir datos entre varios discos, ... La
  experiencia muestra que /lejos/ lo que mas influye es eleccion cuidadosa
  de los algoritmos y estructuras de datos (representaciones). Lo que se
  puede ganar por otras vias suele ser mas bien menor (aunque un factor de
  2 tampoco es despreciable, pero no es trivial de conseguir en ninguna de
  las areas...). Ver donde se obtiene el maximo aumento con minimo costo
  [Si, hay que sentarse a /medir/ donde se va el tiempo/memoria/lo que
  falte!], mejorar eso.
- Enjuagar, repetir.

Ojo, las mediciones hay que hacerlas con "datos reales", los "casos de
prueba" /no/ sirven, porque precisamente estan cocinados para revisar
detalladamente (incluso) lo que pasa en situaciones anomalas e
infrecuentes, mientras nos interesa un rabano el funcionamiento en casos
extraordinarios, aca nos interesan las situaciones tipicas.

[Se ve que en ninguna parte dice "la solucion es un lenguaje compilado"? Se
 ve que no hay una unica solucion al problema, cierto?]
[[Si, toda esa challa que les ensen~an /es/ importante. Desde la
  organizacion general del sistema (via monitos varios) hasta llegar a su
  implementacion en programas.]]
-- 
Dr. Horst H. von Brand                   User #22616 counter.li.org
Departamento de Informatica                    Fono: +56 32 2654431
Universidad Tecnica Federico Santa Maria             +56 32 2654239
Casilla 110-V, Valparaiso, Chile               Fax:  +56 32 2797513
From [EMAIL PROTECTED]  Mon Oct 23 20:36:20 2006
From: [EMAIL PROTECTED] (Miguel Oyarzo O.)
Date: Mon Oct 23 17:43:22 2006
Subject: =?iso-8859-1?q?Re=3A_b=FAsqueda_de_texto?=
In-Reply-To: <[EMAIL PROTECTED]>
References: <[EMAIL PROTECTED]>
 <[EMAIL PROTECTED]>
Message-ID: <[EMAIL PROTECTED]>

At 06:34 23-10-2006, Daniel Serpell wrote:
>Hola!
>
>El Thu, Oct 19, 2006 at 12:10:54PM -0300, Julio Pacheco escribio:
> >
> > Tengo un directorio con 1000000+ archivos de diversos tipos.
> > Necesito identificar sólo aquellos que contienen un patrón de la siguiente
> > forma:
> >
> > texto_a_buscar[nul][nul](otro texto)
> >
> > en que texto_a_buscar puede aparecer en otros archivos (texto, código,etc).
>
>[...]
> >
> > Ideas?
>
>Yo utilizaría awk:
>
>  awk '/texto_a_buscar\000\000/ { print FILENAME; nextfile } ' [mis archivos]
>
>donde [mis archivos] es la lista de archivos a buscar.
>
>Si son realmente muchos, puedes agregar find/xargs:
>
>  find /mi/directorio -type f -print0 |
>     xargs -0 awk '/texto_a_buscar\000\000/ { print FILENAME; nextfile } '
>
>
>     Daniel.



Tambien puedes usar:

  find . -type f | xargs grep -e "expresion_regular"


Saludos,

Miguel Oyarzo O.
Austro Internet S.A.
Punra Arenas

Programar en Linux

Responder a