Hola.

os comento algo que me pasa casi siempre que uso ficheros. :-(

Tengo un archivo CSV donde hay muchas lineas repetidas. He preparado el siguiente programa que busca los registros repetidos. La idea es que se crea un nuevo archivo "bb.css" donde van todos los registros menos los repetidos.

El problema es que se agrega un salto de linea que no debería ("\n") de forma que el resultado es algo as:
---------
linea ok

linea ok
---------
Entre cada linea ok hay una linea en blanco.

Este es el programa:
-----------------------------------------
import csv

cn=0 # para contar reptediso
farchi="aa.csv"  # archivo con todos los registros
cm=[]  # Para poder conocer los repetidos.

f=open("bb.csv","w")  # Archivo destino con los registros sin repetir.
swriter = csv.writer(f, delimiter=',')

with open(farchi, 'rb') as csvfile:
    spamreader = csv.reader(csvfile, delimiter=',')
    for row in spamreader:
        if len(row)>5:
            s = row[2]+" "+row[5]
            s = s.lower()
            if s in cm:
                cn += 1
            else:
                cm.append(s)
                swriter.writerow(row)

f.close()

print "Registros duplicados ",cn
_______________________________________________
Python-es mailing list
Python-es@python.org
http://mail.python.org/mailman/listinfo/python-es
FAQ: http://python-es-faq.wikidot.com/

Responder a