No creo que se justifique el uso de expresiones regulares si el ancho es
fijo.
El tema de performance lo decía porque parece que el parser de expresiones
regulares que usar el intérprete de Ruby no es muy rápido en varios casos,
no por el costo de crear objetos y manipularlos (si eso te preocupa no
elijas RoR!).

On 6/12/07, Fernando Castañeda <[EMAIL PROTECTED]> wrote:

 Gracias Nacho.
Efectivamente el tamaño es fijo teniendo el archivo entre 4000 a 100000
lineas.
Es una migracion de un sistema Visual Fox donde lo resolvia utilizando el
substr() con la longitud de donde empeza cada campo y la cantidad de
caractes a tomar.
Aca vi que el tratamiento de strings era algo mas poderoso conjugado con
las expresiones regulares.
Esto lo pensaba implementar en ROR, y ya que hablas de perfomance, cada
una de esas lineas se transforman en instancias de objetos para luego
volcarla en BD, crees que el proceso demorará demasiado en procesar la
cantidad de lineas mencionadas.
El objeto a creer no tiene asociaciones con otros objetos.

Otra consulta ya que estamos. Como se formatea la linea cuando las
columnas vienen de ancho fijo ?

Bueno, no abuso mas de su confianza, y nuevamente gracias



----- Original Message -----

*From:* NachoKB <[EMAIL PROTECTED]>
*To:* Grupo Ruby Argentina <[email protected]>
*Sent:* Tuesday, June 12, 2007 11:46 AM
*Subject:* Re: [Ruby Arg] Consulta sobre chomp y split

por lo que veo, las columnas son de tamaño fijo... eso te puede ayudar
para parsearlo. La alternativa obviamente son las expresiones regulares.

La pregunta es qué podés asumir de los datos. Si el tamaño fijo se
mantiene a rajatabla, quizá sea lo más viable. Para las expresiones
regulares habría que determinar un patrón que distinga a cada campo (o al
menos al primero, parece). El tema es que ese patrón también se debe
respetar a rajatabla, salvo que te alcance con cubrir el 99% de los casos y
tener algunos para corregir (como en una migración puntual, pero decís
"diariamente", por lo que no).

Si el archivo puede llegar a ser grande (y la performance una
consideración), yo intentaría resolverlo con lo de los tamaños fijos...

Saludos,

Nacho

On 6/12/07, Fernando Castañeda <[EMAIL PROTECTED]> wrote:
>
>  Hola grupo :
> Soy nuevo en ruby y aca va mi primer pregunta.
> Tengo el sig. archivo de txt que se deben procesar dariamente con el
> sig. formato.
> Ej : de un par de lineas que vienen:
>
> MAREJADA                       0001107 051215 4151.440S 06150.960W 224
> 09.0 0000 005 G 470115510 08466 029 701006062
> CENTAURO 2000                  0000482 051215 4215.640S 06133.160W 096
> 04.0 0000 005 G 470111210 08466 067 701019000
> ELSA LIBERTAD                  0001499 051215 4320.320S 06503.640W 327
> 00.0 0000 005 G 470181191 08473 213 000000000
> QUE LE IMPORTA                 0001355 051215 4320.440S 06503.440W 343
> 00.1 0000 005 G 470181217 08473 227 701000705
> ATREVIDO                       0000145 051215 4217.080S 06136.400W 080
> 04.0 0000 005 G 470111910 08466 014 701006040
>
> El problema me surge con la que es mi primer atributo de la clase, el
> nombre del barco.
> Con la instruccion  line.chomp.split(" ") separo por especios en blanco,
> pero no me sirve para los buques cuyos  nombres a su vez están separados por
> espacios como "QUE LE IMPORTA" o "ELSA LIBERTAD" ya que pasan a ser otro
> atributo en esos casos particulares.
> Hay alguna manera de hacerlo con expresiones regulares.
>  Muchas gracias por su ayuda.
> Ej. del codigo que implemento.
>
> def procesar
>
> File.open("c:/vts/txt/d.txt") *do* |file|
> *
>
> while
> *line = file.gets
>
> barco, matricula, latitud,  longitud, ems,  rmsi, etc= line.chomp.split(
> " ")
>
> # codigo que crea el objeto movimientobuque para cada linea procesada
> *
>
> end
>
> end
>
> Saludos desde Mar del Plata
>
> Fernando Castañeda.-
>
>
> *
>
> _______________________________________________
> ruby mailing list
> [email protected]
> http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar
>
>
 ------------------------------

_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar


_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar


_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar

Responder a