Veja os argumentos "encoding" é "fileEncoding" da função.
Num momento livre, dê uma passadinha nas recomendações p a lista e evite enviar arquivos anexados às suas mensagens. b -- Sent from a mobile device. Please apologise for brevity, spelling and punctuation. On 31 Oct 2012 13:22, "Roberto de Pinho" <[email protected]> wrote: > Caros, > > Estou tentando ler o arquivo de servidores disponível no portal da > transparência. > > ( > > http://arquivos.portaldatransparencia.gov.br/PortalTransparenciaEscolheTipoDePlanilha.asp?origem=Servidores&Planilha=0 > - mais de 200MB) > > É um CSV codificado em UTF-16. > > No entanto, ele reconhece prematuramente fins de linhas em algumas linhas > quando encontra campos com nulo [00 00]. Há valores não nulos não sendo > lidos após campos nulos que provocam o reconhecimento de fim de linha. > > Alguém saberia como poderia fazer com que o R possa ler este arquivo? > > Estou lendo o arquivo com: > > servidores = read.table("teste.csv", header = T, > sep="\t",quote="",stringsAsFactors=T,fileEncoding="UTF-16", fill=T) > > o fill=T estou sando para evitar que dê erro de diferente numero de > campos. > > Envio, em anexo, um extrato das primeiras linhas do arquivo. > > > Obrigado pela atenção. > > ==== > Sequencia de bytes que provocam o reconhecimento de nova linha: > > 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 > 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 00 00 09 00 > > > > > > > -- > Roberto de Pinho > [email protected] > http://www.ascoisas.com > http://lattes.cnpq.br/4816166073408660 > > > _______________________________________________ > R-br mailing list > [email protected] > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. >
_______________________________________________ R-br mailing list [email protected] https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código mínimo reproduzível.
