Gracias Nacho.
Efectivamente el tamaño es fijo teniendo el archivo entre 4000 a 100000 lineas.
Es una migracion de un sistema Visual Fox donde lo resolvia utilizando el
substr() con la longitud de donde empeza cada campo y la cantidad de caractes a
tomar.
Aca vi que el tratamiento de strings era algo mas poderoso conjugado con las
expresiones regulares.
Esto lo pensaba implementar en ROR, y ya que hablas de perfomance, cada una de
esas lineas se transforman en instancias de objetos para luego volcarla en BD,
crees que el proceso demorará demasiado en procesar la cantidad de lineas
mencionadas.
El objeto a creer no tiene asociaciones con otros objetos.
Otra consulta ya que estamos. Como se formatea la linea cuando las columnas
vienen de ancho fijo ?
Bueno, no abuso mas de su confianza, y nuevamente gracias
----- Original Message -----
From: NachoKB
To: Grupo Ruby Argentina
Sent: Tuesday, June 12, 2007 11:46 AM
Subject: Re: [Ruby Arg] Consulta sobre chomp y split
por lo que veo, las columnas son de tamaño fijo... eso te puede ayudar para
parsearlo. La alternativa obviamente son las expresiones regulares.
La pregunta es qué podés asumir de los datos. Si el tamaño fijo se mantiene a
rajatabla, quizá sea lo más viable. Para las expresiones regulares habría que
determinar un patrón que distinga a cada campo (o al menos al primero, parece).
El tema es que ese patrón también se debe respetar a rajatabla, salvo que te
alcance con cubrir el 99% de los casos y tener algunos para corregir (como en
una migración puntual, pero decís "diariamente", por lo que no).
Si el archivo puede llegar a ser grande (y la performance una consideración),
yo intentaría resolverlo con lo de los tamaños fijos...
Saludos,
Nacho
On 6/12/07, Fernando Castañeda <[EMAIL PROTECTED]> wrote:
Hola grupo :
Soy nuevo en ruby y aca va mi primer pregunta.
Tengo el sig. archivo de txt que se deben procesar dariamente con el sig.
formato.
Ej : de un par de lineas que vienen:
MAREJADA 0001107 051215 4151.440S 06150.960W 224 09.0
0000 005 G 470115510 08466 029 701006062
CENTAURO 2000 0000482 051215 4215.640S 06133.160W 096 04.0
0000 005 G 470111210 08466 067 701019000
ELSA LIBERTAD 0001499 051215 4320.320S 06503.640W 327 00.0
0000 005 G 470181191 08473 213 000000000
QUE LE IMPORTA 0001355 051215 4320.440S 06503.440W 343 00.1
0000 005 G 470181217 08473 227 701000705
ATREVIDO 0000145 051215 4217.080S 06136.400W 080 04.0
0000 005 G 470111910 08466 014 701006040
El problema me surge con la que es mi primer atributo de la clase, el
nombre del barco.
Con la instruccion line.chomp.split(" ") separo por especios en blanco,
pero no me sirve para los buques cuyos nombres a su vez están separados por
espacios como "QUE LE IMPORTA" o "ELSA LIBERTAD" ya que pasan a ser otro
atributo en esos casos particulares.
Hay alguna manera de hacerlo con expresiones regulares.
Muchas gracias por su ayuda.
Ej. del codigo que implemento.
def procesar
File.open("c:/vts/txt/d.txt") do |file|
while
line = file.gets
barco, matricula, latitud, longitud, ems, rmsi, etc= line.chomp.split(
" ")
# codigo que crea el objeto movimientobuque para cada linea procesada
end
end
Saludos desde Mar del Plata
Fernando Castañeda.-
_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar
------------------------------------------------------------------------------
_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar
_______________________________________________
ruby mailing list
[email protected]
http://lista.rubyargentina.com.ar/listinfo.cgi/ruby-rubyargentina.com.ar