Re: [R-es] Problema con la lectura de datos
Completando lo que ya te han dicho, si grabas un CSV desde Excel, 3 cosas más: - Selecciona todas las columnas vacías a la derecha de tus datos y elimínalas (no vale con borrar el contenido, usa el botón derecho y "Eliminar...") - Selecciona todas las filas vacías abajo de tus datos y elimínalas (tampoco vale con borrar el contenido, usa el botón derecho y "Eliminar...") - cuidado con el formato de los datos en Excel. Los decimales que veas son los que te llevarás al fichero CSV, perdiendo el resto... En general, si puedes evitar usar Excel para manipular datos posteriormente en R (o en otro sitio), MEJOR. Si no tienes más remedio, comprueba exhaustivamente los datos que tienes en R, asegurándote de que son correctos. Uso Excel para muchas cosas y me encanta, es probablemente el mejor software de Office, pero tiene su PARTICULAR forma de guardar la información, y hay que conocerla. Suerte Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo Consejería de Economía, Empresas y Empleo http://www.castillalamancha.es/ > -Mensaje original- > De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de > Antonio Punzon > Enviado el: miércoles, 11 de noviembre de 2015 16:35 > Para: r-help-es@r-project.org > Asunto: Re: [R-es] Problema con la lectura de datos > > Si lo has guardado como csv separado por comas: > Abre con cualquier editor el fichero: mira separador de listas y separador > de > decimal, supongamos que sea "; " para las listas (esto depende de tu > configuración regional) y "." para los decimales (es como lo tienes en tu > fichero) entonces > > dat<-read.csv("Variables.csv", header=T, sep=";", dec=".") > > cor(dat[, 2:ncol(dat)]) > > # no tienes en cuenta la primera columna porque es de texto #Ten cuidado > porque en ocasiones cuando salvas un fichero excel como csv te guarda > columnas extras, así que asegurate que las últimas columnas corresponden > con columnas con datos, igual para filas > > La verdad es que todo esto ya casi te lo han dicho todo. es un poco raro que > no te fuuncione alguna de las soluciones que te han dado > > Un saludo > Antonio > > __ > Antonio Punzón Merino > Instituto Español de Oceanografía > CO Santander > Promontorio de San Martín s/n > PO BOX 240 > 39080-Santander (Spain) > Tel: +34 942 29 17 16 (Direct: 55) > Fax: +34 942 275 072 > Email: antonio.pun...@st.ieo.es > Web: www.ieo.es > __ > > El 11/11/2015 a las 16:22, Valentina Aguilera escribió: > > Lo acabo de intentar y sigue apareciendo: 'x' must be numeric > > > > > > From: j.para.fernan...@hotmail.com > > To: valea...@outlook.es; c...@qualityexcellence.es; > > r-help-es@r-project.org > > Subject: RE: [R-es] Problema con la lectura de datos > > Date: Wed, 11 Nov 2015 16:17:58 +0100 > > > > > > > > > > Has probado con > > > > cor(datos,use="pairwise.complete.obs") > > > > > > ??? > > > >> From: valea...@outlook.es > >> To: c...@qualityexcellence.es; r-help-es@r-project.org > >> Date: Wed, 11 Nov 2015 15:13:55 + > >> Subject: Re: [R-es] Problema con la lectura de datos > >> > >> Hola Carlos, muchas gracias....pero hago exactamente lo mismo que tu..y > al intentar de hacer la matriz de correlaciones sigue generando error: > >> 'x' must be numeric > >> se podrá deber a algo relacionado con la configuración de mi equipo, o > qué más podría hacer para que funcione! > >> Muchas gracias! > >> > >> Date: Wed, 11 Nov 2015 15:53:44 +0100 > >> Subject: Re: [R-es] Problema con la lectura de datos > >> From: c...@qualityexcellence.es > >> To: valea...@outlook.es > >> CC: r-help-es@r-project.org > >> > >> ?Hola, > >> > >> A mí me funciona la importación directa. Previamente he guardado la hoja > de Excel en .csv (separado por ";"). > >> Y hago sin problemas la correlación entre dos variables (las dos > >> primeras). > >> > >> > >>> datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", > >>> dec=",") > >>> head(datIn) > >> EMPRESAS AA AB AC AD AE AF AG AH AI AJ > >> BA BB > BCDA DB DCDD DE EA EB EE > >> 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 > 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 > 62.51638 > >> 2 A.JUR\xcdDICAS 0 499 120 82
Re: [R-es] Problema con la lectura de datos
Otra opción es importar directamente los datos que necesites usando XLConnect (sin llevarlos a CSV). Ese paquete permite hacer cosas muy potentes desde el propio fichero de Excel. https://cran.r-project.org/web/packages/XLConnect/index.html Recomiendo, encarecidamente, la lectura de sus dos vignettes. Un Saludo, -- Miguel Ángel Rodríguez Muíños Dirección Xeral de Saúde Pública Consellería de Sanidade Xunta de Galicia http://dxsp.sergas.es El 12/11/2015 a las 9:14, Isidro Hidalgo escribió: > Completando lo que ya te han dicho, si grabas un CSV desde Excel, 3 cosas más: > - Selecciona todas las columnas vacías a la derecha de tus datos y elimínalas > (no vale con borrar el contenido, usa el botón derecho y "Eliminar...") > - Selecciona todas las filas vacías abajo de tus datos y elimínalas (tampoco > vale con borrar el contenido, usa el botón derecho y "Eliminar...") > - cuidado con el formato de los datos en Excel. Los decimales que veas son los > que te llevarás al fichero CSV, perdiendo el resto... > En general, si puedes evitar usar Excel para manipular datos posteriormente en > R (o en otro sitio), MEJOR. Si no tienes más remedio, comprueba > exhaustivamente los datos que tienes en R, asegurándote de que son correctos. > Uso Excel para muchas cosas y me encanta, es probablemente el mejor software > de Office, pero tiene su PARTICULAR forma de guardar la información, y hay que > conocerla. > Suerte > > Isidro Hidalgo Arellano > Observatorio del Mercado de Trabajo > Consejería de Economía, Empresas y Empleo > http://www.castillalamancha.es/ > > Nota: A información contida nesta mensaxe e os seus posibles documentos adxuntos é privada e confidencial e está dirixida únicamente ó seu destinatario/a. Se vostede non é o/a destinatario/a orixinal desta mensaxe, por favor elimínea. A distribución ou copia desta mensaxe non está autorizada. Nota: La información contenida en este mensaje y sus posibles documentos adjuntos es privada y confidencial y está dirigida únicamente a su destinatario/a. Si usted no es el/la destinatario/a original de este mensaje, por favor elimínelo. La distribución o copia de este mensaje no está autorizada. See more languages: http://www.sergas.es/aviso-confidencialidad ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Yo también uso XLConnect y me va muy bien. Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo Consejería de Economía, Empresas y Empleo http://www.castillalamancha.es/ > -Mensaje original- > De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de > Francisco Rodríguez > Enviado el: jueves, 12 de noviembre de 2015 11:35 > Para: r-help-es@r-project.org > Asunto: Re: [R-es] Problema con la lectura de datos > > Yo uso habitualmente XLConnect y est muy bien, permite un control total al > poder atacar directamente a la terna hoja, celda y columna. Aqu un trozo de > c digo de muestra: > library(XLConnect) > a <- readWorksheetFromFile(" n>", sheet = ...,startRow = ..., startCol = ..., endCol = ..., endRow = ..., > header > = FALSE) Como se observa se puede escoger desde un nico n mero situado > en una (Hoja; Celda; Columna) hasta una matriz Ojo, que el objeto a ser de > tipo lista, despu s se tendr que pasar al tipo de dato que se necesite > > XLConnect es compatible con ficheros xls y xlsx Un saludo > > > From: miguel.angel.rodriguez.mui...@sergas.es > > To: r-help-es@r-project.org > > Date: Thu, 12 Nov 2015 09:58:06 + > > Subject: Re: [R-es] Problema con la lectura de datos > > > > Otra opci n es importar directamente los datos que necesites usando > > XLConnect (sin llevarlos a CSV). > > Ese paquete permite hacer cosas muy potentes desde el propio fichero > > de Excel. > > https://cran.r-project.org/web/packages/XLConnect/index.html > > > > Recomiendo, encarecidamente, la lectura de sus dos vignettes. > > > > > > Un Saludo, > > > > -- > > Miguel ngel Rodr guez Mu os > > Direcci n Xeral de Sa de P blica > > Conseller a de Sanidade > > Xunta de Galicia > > http://dxsp.sergas.es > > > > > > > > > > El 12/11/2015 a las 9:14, Isidro Hidalgo escribi : > > > Completando lo que ya te han dicho, si grabas un CSV desde Excel, 3 > cosas m s: > > > - Selecciona todas las columnas vac as a la derecha de tus datos y > > > elim nalas (no vale con borrar el contenido, usa el bot n derecho y > > > "Eliminar...") > > > - Selecciona todas las filas vac as abajo de tus datos y elim nalas > > > (tampoco vale con borrar el contenido, usa el bot n derecho y > > > "Eliminar...") > > > - cuidado con el formato de los datos en Excel. Los decimales que > > > veas son los que te llevar s al fichero CSV, perdiendo el resto... > > > En general, si puedes evitar usar Excel para manipular datos > > > posteriormente en R (o en otro sitio), MEJOR. Si no tienes m s > > > remedio, comprueba exhaustivamente los datos que tienes en R, asegur > ndote de que son correctos. > > > Uso Excel para muchas cosas y me encanta, es probablemente el mejor > > > software de Office, pero tiene su PARTICULAR forma de guardar la > > > informaci n, y hay que conocerla. > > > Suerte > > > > > > Isidro Hidalgo Arellano > > > Observatorio del Mercado de Trabajo > > > Consejer a de Econom a, Empresas y Empleo > > > http://www.castillalamancha.es/ > > > > > > > > > > > > > > > > > > > > > > Nota: A informaci n contida nesta mensaxe e os seus posibles documentos > adxuntos privada e confidencial e est dirixida nicamente seu > destinatario/a. Se vostede non o/a destinatario/a orixinal desta mensaxe, > por favor elim nea. A distribuci n ou copia desta mensaxe non est > autorizada. > > > > Nota: La informaci n contenida en este mensaje y sus posibles documentos > adjuntos es privada y confidencial y est dirigida nicamente a su > destinatario/a. Si usted no es el/la destinatario/a original de este > mensaje, > por favor elim nelo. La distribuci n o copia de este mensaje no est > autorizada. > > > > See more languages: http://www.sergas.es/aviso-confidencialidad > > > > ___ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
El problema de XLConnect es que necesita java para funcionar y en equipos con poca memoria puede dar problemas. Por eso, yo aconsejo openxlsx (para Excel 2007 o superior) que no necesita de ningún programa externo. -Mensaje original- De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de Isidro Hidalgo Enviado el: Thursday, November 12, 2015 11:50 AM Para: r-help-es@r-project.org Asunto: Re: [R-es] Problema con la lectura de datos Yo también uso XLConnect y me va muy bien. Isidro Hidalgo Arellano Observatorio del Mercado de Trabajo Consejería de Economía, Empresas y Empleo http://www.castillalamancha.es/ > -Mensaje original- > De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de > Francisco Rodríguez Enviado el: jueves, 12 de noviembre de 2015 11:35 > Para: r-help-es@r-project.org > Asunto: Re: [R-es] Problema con la lectura de datos > > Yo uso habitualmente XLConnect y est muy bien, permite un control > total al poder atacar directamente a la terna hoja, celda y columna. > Aqu un trozo de c digo de muestra: > library(XLConnect) > a <- readWorksheetFromFile(" n>", sheet = ...,startRow = ..., startCol = ..., endCol = ..., endRow > n>= ..., > header > = FALSE) Como se observa se puede escoger desde un nico n mero > situado en una (Hoja; Celda; Columna) hasta una matriz Ojo, que el > objeto a ser de tipo lista, despu s se tendr que pasar al tipo de > dato que se necesite > > XLConnect es compatible con ficheros xls y xlsx Un saludo > > > From: miguel.angel.rodriguez.mui...@sergas.es > > To: r-help-es@r-project.org > > Date: Thu, 12 Nov 2015 09:58:06 + > > Subject: Re: [R-es] Problema con la lectura de datos > > > > Otra opci n es importar directamente los datos que necesites usando > > XLConnect (sin llevarlos a CSV). > > Ese paquete permite hacer cosas muy potentes desde el propio fichero > > de Excel. > > https://cran.r-project.org/web/packages/XLConnect/index.html > > > > Recomiendo, encarecidamente, la lectura de sus dos vignettes. > > > > > > Un Saludo, > > > > -- > > Miguel ngel Rodr guez Mu os > > Direcci n Xeral de Sa de P blica > > Conseller a de Sanidade > > Xunta de Galicia > > http://dxsp.sergas.es > > > > > > > > > > El 12/11/2015 a las 9:14, Isidro Hidalgo escribi : > > > Completando lo que ya te han dicho, si grabas un CSV desde Excel, > > > 3 > cosas m s: > > > - Selecciona todas las columnas vac as a la derecha de tus datos y > > > elim nalas (no vale con borrar el contenido, usa el bot n derecho > > > y > > > "Eliminar...") > > > - Selecciona todas las filas vac as abajo de tus datos y elim > > > nalas (tampoco vale con borrar el contenido, usa el bot n derecho > > > y > > > "Eliminar...") > > > - cuidado con el formato de los datos en Excel. Los decimales que > > > veas son los que te llevar s al fichero CSV, perdiendo el resto... > > > En general, si puedes evitar usar Excel para manipular datos > > > posteriormente en R (o en otro sitio), MEJOR. Si no tienes m s > > > remedio, comprueba exhaustivamente los datos que tienes en R, > > > asegur > ndote de que son correctos. > > > Uso Excel para muchas cosas y me encanta, es probablemente el > > > mejor software de Office, pero tiene su PARTICULAR forma de > > > guardar la informaci n, y hay que conocerla. > > > Suerte > > > > > > Isidro Hidalgo Arellano > > > Observatorio del Mercado de Trabajo Consejer a de Econom a, > > > Empresas y Empleo http://www.castillalamancha.es/ > > > > > > > > > > > > > > > > > > > > > > Nota: A informaci n contida nesta mensaxe e os seus posibles > > documentos > adxuntos privada e confidencial e est dirixida nicamente seu > destinatario/a. Se vostede non o/a destinatario/a orixinal desta mensaxe, > por favor elim nea. A distribuci n ou copia desta mensaxe non est > autorizada. > > > > Nota: La informaci n contenida en este mensaje y sus posibles > > documentos > adjuntos es privada y confidencial y est dirigida nicamente a su > destinatario/a. Si usted no es el/la destinatario/a original de este > mensaje, por favor elim nelo. La distribuci n o copia de este mensaje > no est autorizada. > > > > See more languages: http://www.sergas.es/aviso-confidencialidad > > > > ___ > > R-help-es mailing list > > R-help-es@r-project.org > > https://stat.ethz.ch/mailman/listinfo/r-help-es > > [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
.12114443 0.35222168 0.38719393 0.2371530 0.17607827 AB 0.20970834 0.36444390 0.43514558 0.20217623 0.33495945 0.39430527 0.2161053 0.17063869 AC 0.22737429 0.27426997 0.37088630 0.26083592 0.33954991 0.31652223 0.2874953 0.24584980 AD 0.25860803 0.29150116 0.28790356 0.19055307 0.35201029 0.44472536 0.2931956 0.20102429 AE 0.04903814 0.37237335 0.27894283 0.22097695 0.38773536 0.49626537 0.1621768 0.08499049 AF 0.13376042 0.44248035 0.39100256 0.56250225 0.43832051 0.56036142 0.2491931 0.18421108 AG 0.04770505 0.26910692 0.35626679 0.50523504 0.31627815 0.34303174 0.2861347 0.23259246 AH -0.02820084 0.18049995 0.25150771 0.31467457 0.32071392 0.38201422 0.2433062 0.17859229 AI -0.08026755 0.07458397 0.04803632 0.39783383 0.36785525 0.36379446 0.3193718 0.24737884 AJ -0.06905460 0.17200898 0.19647923 0.25954659 0.25218588 0.34402252 0.1708668 0.10697637 BA 0.10452352 0.25373766 0.21908448 0.53118085 0.48523738 0.44728760 0.6889676 0.63462949 BB 0.24565007 0.28387172 0.34487115 0.22896314 0.83006391 0.84778301 0.2480708 0.18977246 BC 0.26634388 0.36869915 0.37156494 0.13015707 0.95135143 0.99172045 0.3048419 0.23327107 DA 1. 0.34271551 0.46962484 0.21028693 0.22537099 0.24605036 0.1880578 0.23275533 DB 0.34271551 1. 0.82643586 0.37753408 0.31011191 0.38632011 0.1775467 0.12354507 DC 0.46962484 0.82643586 1. 0.48052101 0.29376338 0.37927205 0.1063780 0.07589745 DD 0.21028693 0.37753408 0.48052101 1. 0.07915853 0.09352177 0.3750688 0.38475445 DE 0.22537099 0.31011191 0.29376338 0.07915853 1. 0.93416336 0.4125650 0.34015216 EA 0.24605036 0.38632011 0.37927205 0.09352177 0.93416336 1. 0.2546461 0.16211743 EB 0.18805779 0.17754666 0.10637802 0.37506880 0.41256496 0.25464611 1.000 0.97266157 EE 0.23275533 0.12354507 0.07589745 0.38475445 0.34015216 0.16211743 0.9726616 1. Espero haberte ayudado. Un cordial saludo. De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de Valentina Aguilera Enviado el: Wednesday, November 11, 2015 2:31 PM Para: daniel; r help Asunto: Re: [R-es] Problema con la lectura de datos Holaa...yo estoy utilizando el siguiente código, pero no me va...y lo que quiero es que R lea la base de datos, donde la primera columna es el nombre de la empresa y las otras variables, para luego calcular una matriz de correlaciones: library(xtable) Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",21)), strip.white=FALSE, dec = ",") pero con esto genera el sgte error, como ya he mencionado antes: Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Luego, si sólo escribo el siguiente código: library(xtable) Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";") R los lee, pero cuando quiero generar la matriz de correlaciones, genera el siguiente error: Error in cor(Variables) : 'x' must be numeric Realmente no sé que se deba hacer, por lo que agradecería si me pueden ayudar, aquí adjunto la base de datos en formato excel. Gracias mil!!! Date: Tue, 10 Nov 2015 17:11:33 -0300 Subject: Re: [R-es] Problema con la lectura de datos From: daniel...@gmail.com<mailto:daniel...@gmail.com> To: javier.ruben.marcu...@gmail.com<mailto:javier.ruben.marcu...@gmail.com> CC: valea...@outlook.es<mailto:valea...@outlook.es>; r-help-es@r-project.org<mailto:r-help-es@r-project.org> Valentina, Si entiendo bien la primer columna de Variables es el nombre de Empresas (un character), no uses esta columna en la función cor, sólo las columnas numéricas. cor(Variables[ , -which( names(Variables) == "Empresas")]) Si no es ese el problema envía str(Variables) para entender mejor la estructura de los datos, y si puedes dput(Variables). Suerte, Daniel Merino El 10 de noviembre de 2015, 17:02, Javier Rubén Marcuzzi <javier.ruben.marcu...@gmail.com<mailto:javier.ruben.marcu...@gmail.com>> escribió: Estimado Valentina Aguilera Prueba algo como: b$Edad <- as.vector(b$Edad) o b$Edad <- as.numeric(b$Edad) Claro, por cada variable que debas convertir. Yo para saber cuales escribo str(mi data frame). Uno de los dos tendría que funcionar Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:56 Para: Javier Rubén Marcuzzi;r help Asunto: RE: [R-es] Problema con la lectura de datos con as.numeric tampoco me van los cálculos y no conozco otra manera, pues son alrededor de 40 variables las que tiene la tabla. To: valea...@outlook.es<mailto:valea...@outlook.es>; c...@qualityexcellence.es<mailto:c...@qualityexcellence.es&
Re: [R-es] Problema con la lectura de datos
Prueba con esta otra función de lectura... que está en la librería "data.table"... *library(data.table)* datNew <- *fread*("Variables.csv", sep=";", header=TRUE, dec=",") > head(datNew) EMPRESAS AA AB AC AD AE AF AG AH AI AJ BA BB BCDA DB DCDD DE EA EB EE 1: A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 62.51638 2: A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 52.71429 3:A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 63.20583 4:B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 66.20648 5: B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 56.99615 6: CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 46.88458 El 11 de noviembre de 2015, 16:28, Carlos Ortega <c...@qualityexcellence.es> escribió: > > No tienes NA..: > > > sum(mapply(is.na, datIn)) > [1] 0 > > > > El 11 de noviembre de 2015, 16:22, Valentina Aguilera <valea...@outlook.es > > escribió: > >> Lo acabo de intentar y sigue apareciendo: 'x' must be numeric >> >> >> From: j.para.fernan...@hotmail.com >> To: valea...@outlook.es; c...@qualityexcellence.es; >> r-help-es@r-project.org >> Subject: RE: [R-es] Problema con la lectura de datos >> Date: Wed, 11 Nov 2015 16:17:58 +0100 >> >> >> >> >> Has probado con >> >> cor(datos,use="pairwise.complete.obs") >> >> >> ??? >> >> > From: valea...@outlook.es >> > To: c...@qualityexcellence.es; r-help-es@r-project.org >> > Date: Wed, 11 Nov 2015 15:13:55 + >> > Subject: Re: [R-es] Problema con la lectura de datos >> > >> > Hola Carlos, muchas graciaspero hago exactamente lo mismo que tu..y >> al intentar de hacer la matriz de correlaciones sigue generando error: >> > 'x' must be numeric >> > se podrá deber a algo relacionado con la configuración de mi equipo, o >> qué más podría hacer para que funcione! >> > Muchas gracias! >> > >> > Date: Wed, 11 Nov 2015 15:53:44 +0100 >> > Subject: Re: [R-es] Problema con la lectura de datos >> > From: c...@qualityexcellence.es >> > To: valea...@outlook.es >> > CC: r-help-es@r-project.org >> > >> > Hola, >> > >> > A mí me funciona la importación directa. Previamente he guardado la >> hoja de Excel en .csv (separado por ";"). >> > Y hago sin problemas la correlación entre dos variables (las dos >> primeras). >> > >> > >> > > datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", >> dec=",") >> > > head(datIn) >> > EMPRESAS AA AB AC AD AE AF AG AH AI AJ >> BA BB BCDA DB DCDD DE EA EB >> EE >> > 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 >> 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 >> 62.51638 >> > 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 >> 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 >> 52.71429 >> > 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 >> 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 >> 63.20583 >> > 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 >> 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 >> 66.20648 >> > 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 >> 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 >> 56.99615 >> > 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 >> 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 >> 46.88458 >> > > cor(datIn$AA, datIn$BB) >> > [1] 0.2626692 >> > >> > >> > También puedo hacer sin problemas la correlación entre todas las >> variables salvo obviamente la primera. >> > >> > cor(datIn[,c(2:ncol(datIn))]) >> >
Re: [R-es] Problema con la lectura de datos
No tienes NA..: > sum(mapply(is.na, datIn)) [1] 0 El 11 de noviembre de 2015, 16:22, Valentina Aguilera <valea...@outlook.es> escribió: > Lo acabo de intentar y sigue apareciendo: 'x' must be numeric > > > From: j.para.fernan...@hotmail.com > To: valea...@outlook.es; c...@qualityexcellence.es; r-help-es@r-project.org > Subject: RE: [R-es] Problema con la lectura de datos > Date: Wed, 11 Nov 2015 16:17:58 +0100 > > > > > Has probado con > > cor(datos,use="pairwise.complete.obs") > > > ??? > > > From: valea...@outlook.es > > To: c...@qualityexcellence.es; r-help-es@r-project.org > > Date: Wed, 11 Nov 2015 15:13:55 + > > Subject: Re: [R-es] Problema con la lectura de datos > > > > Hola Carlos, muchas graciaspero hago exactamente lo mismo que tu..y > al intentar de hacer la matriz de correlaciones sigue generando error: > > 'x' must be numeric > > se podrá deber a algo relacionado con la configuración de mi equipo, o > qué más podría hacer para que funcione! > > Muchas gracias! > > > > Date: Wed, 11 Nov 2015 15:53:44 +0100 > > Subject: Re: [R-es] Problema con la lectura de datos > > From: c...@qualityexcellence.es > > To: valea...@outlook.es > > CC: r-help-es@r-project.org > > > > Hola, > > > > A mí me funciona la importación directa. Previamente he guardado la hoja > de Excel en .csv (separado por ";"). > > Y hago sin problemas la correlación entre dos variables (las dos > primeras). > > > > > > > datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", > dec=",") > > > head(datIn) > > EMPRESAS AA AB AC AD AE AF AG AH AI AJ >BA BB BCDA DB DCDD DE EA EB EE > > 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 > 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 > 62.51638 > > 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 > 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 > 52.71429 > > 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 > 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 > 63.20583 > > 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 > 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 > 66.20648 > > 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 > 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 > 56.99615 > > 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 > 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 > 46.88458 > > > cor(datIn$AA, datIn$BB) > > [1] 0.2626692 > > > > > > También puedo hacer sin problemas la correlación entre todas las > variables salvo obviamente la primera. > > > > cor(datIn[,c(2:ncol(datIn))]) > >AAABACAD AEAF > AG AH AI AJ BABBBC > > AA 1. 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002 > 0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924 > > AB 0.84869774 1.000 0.7727162 0.6800804 0.60239429 0.4549922 > 0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968 > > AC 0.82659015 0.7727162 1.000 0.4311124 0.54400731 0.4709625 > 0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135 > > AD 0.65962689 0.6800804 0.4311124 1.000 0.57683448 0.4778828 > 0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627 > > AE 0.68866326 0.6023943 0.5440073 0.5768345 1. 0.7380745 > 0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056 > > AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.000 > 0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965 > > AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588 > 1. 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773 > > AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377 > 0.71671688 1. 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097 > > > > > > Saludos, > > Carlos Ortega > > www.qualityexcellence.es > > > > El 11 de noviembre de 2015, 15:32, Jesús Para Fernández < > j.para.fernan...@hotmail.com> escribió: > > Si es un excel, yo siempre los paso a R de la misma manera: > > > > > > > > Lo
Re: [R-es] Problema con la lectura de datos
Hola, A mí me funciona la importación directa. Previamente he guardado la hoja de Excel en .csv (separado por ";"). Y hago sin problemas la correlación entre dos variables (las dos primeras). > datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", dec=",") > head(datIn) EMPRESAS AA AB AC AD AE AF AG AH AI AJ BA BB BCDA DB DCDD DE EA EB EE 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 62.51638 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 52.71429 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 63.20583 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 66.20648 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 56.99615 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 46.88458 > cor(datIn$AA, datIn$BB) [1] 0.2626692 También puedo hacer sin problemas la correlación entre todas las variables salvo obviamente la primera. cor(datIn[,c(2:ncol(datIn))]) AAABACAD AEAF AG AH AI AJ BABBBC AA 1. 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002 0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924 AB 0.84869774 1.000 0.7727162 0.6800804 0.60239429 0.4549922 0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968 AC 0.82659015 0.7727162 1.000 0.4311124 0.54400731 0.4709625 0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135 AD 0.65962689 0.6800804 0.4311124 1.000 0.57683448 0.4778828 0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627 AE 0.68866326 0.6023943 0.5440073 0.5768345 1. 0.7380745 0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056 AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.000 0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965 AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588 1. 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773 AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377 0.71671688 1. 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097 Saludos, Carlos Ortega www.qualityexcellence.es El 11 de noviembre de 2015, 15:32, Jesús Para Fernández < j.para.fernan...@hotmail.com> escribió: > Si es un excel, yo siempre los paso a R de la misma manera: > > Los copio del excel y los pego en R usando el comando: > > datos<-read.table("clipboard",header=T,dec=",",sep="\t") > > siendo dec="," si el separador decimal es l acoma, header=T si lo sdatos > tienen título. > > Y te quitas de usar pqeutees y de líos. > > Un saludo > Jesús > > > From: josea.bartol...@mineco.es > > To: valea...@outlook.es; r-help-es@r-project.org > > Date: Wed, 11 Nov 2015 14:22:23 + > > Subject: Re: [R-es] Problema con la lectura de datos > > > > Hola. > > > > He estado viendo los datos que adjuntas en el correo. Al ser un fichero > Excel xlsx ¿por qué no lo abres directamente? > > Te aconsejaría la librería openxlsx (si no la has usado nunca , > instálala con install.packages(“openxlsx”)) > > > > Este es el código que he ejecutado y los resultados que obtengo: > > > > library(openxlsx) > > > > dat <- read.xlsx("Variables.xlsx") > > str(dat) > > > > Que produce: > > > > 'data.frame': 42 obs. of 22 variables: > > $ EMPRESAS: chr "A.AUDITORÍA" "A.JURÍDICAS" "A.SERVICIOS" "B.MÁLAGA" ... > > $ AA : num 200 0 219 776 143 481 380 205 806 0 ... > > $ AB : num 350 499 0 1796 394 ... > > $ AC : num 90 120 62 1590 0 ... > > $ AD : num 2000 825 1411 1888 502 ... > > $ AE : num 500 358 743 2381 0 ... > > $ AF : num 30 81 112 392 30 46 140 46 283 214 ... > > $ AG : num 59 82 71 168 30 125 69 27 132 268 ... > > $ AH : num 24 27 45 107 18 0 50 17 85 148 ... > > $ AI : num 5937586 5012257 11461538 21441999 2966295 ... > > $ AJ : num 2644207 2666411 5190688 0 1173798 ... > > $ BA : num 13.5 15.7 21.1 12.5 15.9 ...
Re: [R-es] Problema con la lectura de datos
Hola Carlos, muchas graciaspero hago exactamente lo mismo que tu..y al intentar de hacer la matriz de correlaciones sigue generando error: 'x' must be numeric se podrá deber a algo relacionado con la configuración de mi equipo, o qué más podría hacer para que funcione! Muchas gracias! Date: Wed, 11 Nov 2015 15:53:44 +0100 Subject: Re: [R-es] Problema con la lectura de datos From: c...@qualityexcellence.es To: valea...@outlook.es CC: r-help-es@r-project.org Hola, A mí me funciona la importación directa. Previamente he guardado la hoja de Excel en .csv (separado por ";"). Y hago sin problemas la correlación entre dos variables (las dos primeras). > datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", dec=",") > head(datIn) EMPRESAS AA AB AC AD AE AF AG AH AI AJ BA BB BCDA DB DCDD DE EA EB EE 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 62.51638 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 52.71429 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 63.20583 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 66.20648 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 56.99615 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 46.88458 > cor(datIn$AA, datIn$BB) [1] 0.2626692 También puedo hacer sin problemas la correlación entre todas las variables salvo obviamente la primera. cor(datIn[,c(2:ncol(datIn))]) AAABACAD AEAF AG AH AI AJ BABBBC AA 1. 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002 0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924 AB 0.84869774 1.000 0.7727162 0.6800804 0.60239429 0.4549922 0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968 AC 0.82659015 0.7727162 1.000 0.4311124 0.54400731 0.4709625 0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135 AD 0.65962689 0.6800804 0.4311124 1.000 0.57683448 0.4778828 0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627 AE 0.68866326 0.6023943 0.5440073 0.5768345 1. 0.7380745 0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056 AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.000 0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965 AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588 1. 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773 AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377 0.71671688 1. 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097 Saludos, Carlos Ortega www.qualityexcellence.es El 11 de noviembre de 2015, 15:32, Jesús Para Fernández <j.para.fernan...@hotmail.com> escribió: Si es un excel, yo siempre los paso a R de la misma manera: Los copio del excel y los pego en R usando el comando: datos<-read.table("clipboard",header=T,dec=",",sep="\t") siendo dec="," si el separador decimal es l acoma, header=T si lo sdatos tienen título. Y te quitas de usar pqeutees y de líos. Un saludo Jesús > From: josea.bartol...@mineco.es > To: valea...@outlook.es; r-help-es@r-project.org > Date: Wed, 11 Nov 2015 14:22:23 + > Subject: Re: [R-es] Problema con la lectura de datos > > Hola. > > He estado viendo los datos que adjuntas en el correo. Al ser un fichero Excel > xlsx ¿por qué no lo abres directamente? > Te aconsejaría la librería openxlsx (si no la has usado nunca , instálala con > install.packages(“openxlsx”)) > > Este es el código que he ejecutado y los resultados que obtengo: > > library(openxlsx) > > dat <- read.xlsx("Variables.xlsx") > str(dat) > > Que produce: > > 'data.frame': 42 obs. of 22 variables: > $ EMPRESAS: chr "A.AUDITORÍA" "A.JURÍDICAS" "A.SERVICIOS" "B.MÁLAGA" ... > $ AA : num 200 0 219 776 143 481 380 205 806 0 ... > $ AB : num 350 499 0 1796 394 ... > $ AC : num 90 120 62 1590 0 ... > $ AD : num 2000 825 1411 1888 502 ... > $ AE : num 500 358 743 2381 0 ... > $ AF : num 30 81 112 392 30 46
Re: [R-es] Problema con la lectura de datos
Si lo has guardado como csv separado por comas: Abre con cualquier editor el fichero: mira separador de listas y separador de decimal, supongamos que sea "; " para las listas (esto depende de tu configuración regional) y "." para los decimales (es como lo tienes en tu fichero) entonces dat<-read.csv("Variables.csv", header=T, sep=";", dec=".") cor(dat[, 2:ncol(dat)]) # no tienes en cuenta la primera columna porque es de texto #Ten cuidado porque en ocasiones cuando salvas un fichero excel como csv te guarda columnas extras, así que asegurate que las últimas columnas corresponden con columnas con datos, igual para filas La verdad es que todo esto ya casi te lo han dicho todo. es un poco raro que no te fuuncione alguna de las soluciones que te han dado Un saludo Antonio __ Antonio Punzón Merino Instituto Español de Oceanografía CO Santander Promontorio de San Martín s/n PO BOX 240 39080-Santander (Spain) Tel: +34 942 29 17 16 (Direct: 55) Fax: +34 942 275 072 Email: antonio.pun...@st.ieo.es Web: www.ieo.es __ El 11/11/2015 a las 16:22, Valentina Aguilera escribió: Lo acabo de intentar y sigue apareciendo: 'x' must be numeric From: j.para.fernan...@hotmail.com To: valea...@outlook.es; c...@qualityexcellence.es; r-help-es@r-project.org Subject: RE: [R-es] Problema con la lectura de datos Date: Wed, 11 Nov 2015 16:17:58 +0100 Has probado con cor(datos,use="pairwise.complete.obs") ??? From: valea...@outlook.es To: c...@qualityexcellence.es; r-help-es@r-project.org Date: Wed, 11 Nov 2015 15:13:55 + Subject: Re: [R-es] Problema con la lectura de datos Hola Carlos, muchas graciaspero hago exactamente lo mismo que tu..y al intentar de hacer la matriz de correlaciones sigue generando error: 'x' must be numeric se podrá deber a algo relacionado con la configuración de mi equipo, o qué más podría hacer para que funcione! Muchas gracias! Date: Wed, 11 Nov 2015 15:53:44 +0100 Subject: Re: [R-es] Problema con la lectura de datos From: c...@qualityexcellence.es To: valea...@outlook.es CC: r-help-es@r-project.org Hola, A mí me funciona la importación directa. Previamente he guardado la hoja de Excel en .csv (separado por ";"). Y hago sin problemas la correlación entre dos variables (las dos primeras). datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", dec=",") head(datIn) EMPRESAS AA AB AC AD AE AF AG AH AI AJ BA BB BCDA DB DCDD DE EA EB EE 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 62.51638 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 52.71429 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 63.20583 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 66.20648 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 56.99615 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 46.88458 cor(datIn$AA, datIn$BB) [1] 0.2626692 También puedo hacer sin problemas la correlación entre todas las variables salvo obviamente la primera. cor(datIn[,c(2:ncol(datIn))]) AAABACAD AEAF AG AH AI AJ BABBBC AA 1. 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002 0.20140216 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924 AB 0.84869774 1.000 0.7727162 0.6800804 0.60239429 0.4549922 0.20038993 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968 AC 0.82659015 0.7727162 1.000 0.4311124 0.54400731 0.4709625 0.28513806 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135 AD 0.65962689 0.6800804 0.4311124 1.000 0.57683448 0.4778828 0.21678760 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627 AE 0.68866326 0.6023943 0.5440073 0.5768345 1. 0.7380745 0.31759392 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056 AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.000 0.61495885 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965 AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588 1. 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773 AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377 0.71671688 1. 0.56
Re: [R-es] Problema con la lectura de datos
Has probado con cor(datos,use="pairwise.complete.obs") ??? > From: valea...@outlook.es > To: c...@qualityexcellence.es; r-help-es@r-project.org > Date: Wed, 11 Nov 2015 15:13:55 +0000 > Subject: Re: [R-es] Problema con la lectura de datos > > Hola Carlos, muchas graciaspero hago exactamente lo mismo que tu..y al > intentar de hacer la matriz de correlaciones sigue generando error: > 'x' must be numeric > se podrá deber a algo relacionado con la configuración de mi equipo, o qué > más podría hacer para que funcione! > Muchas gracias! > > Date: Wed, 11 Nov 2015 15:53:44 +0100 > Subject: Re: [R-es] Problema con la lectura de datos > From: c...@qualityexcellence.es > To: valea...@outlook.es > CC: r-help-es@r-project.org > > Hola, > > A mí me funciona la importación directa. Previamente he guardado la hoja de > Excel en .csv (separado por ";"). > Y hago sin problemas la correlación entre dos variables (las dos primeras). > > > > datIn <- read.csv("Variables.csv", header=T, as.is=T, sep=";", dec=",") > > head(datIn) > EMPRESAS AA AB AC AD AE AF AG AH AI AJ > BA BB BCDA DB DCDD DE EA EB EE > 1 A.AUDITOR\xcdA 200 350 90 2000 500 30 59 24 5937586 2644207 > 13.47170 588.00 834 0.00 0.0 0. 0.00 477 763 57.19424 62.51638 > 2 A.JUR\xcdDICAS 0 499 120 825 358 81 82 27 5012257 2666411 > 15.69663 891.00 1655 29.00 0.0 0. 43.03 738 1400 44.59592 52.71429 > 3A.SERVICIOS 2190 62 1411 743 112 71 45 11461538 5190688 > 21.10714 855.04 1222 21.00 80.01000 65.5527 69.00 694 1098 56.79214 63.20583 > 4B.M\xc1LAGA 776 1796 1590 1888 2381 392 168 107 21441999 0 > 12.54286 2768.00 3677 58.00 82.0 68. 55.00 2206 3332 59.99456 66.20648 > 5 B.SEVILLA 143 3940 5020 30 30 18 2966295 1173798 > 15.85185 355.00 894 0.00 56.49913 0. 32.92 444 779 49.66443 56.99615 > 6 CONSULTORIAS 481 701 238 1259 713 46 125 0 12984728 4710599 > 9.0 696.00 1059 6.14 68.32000 48.5700 19.38 459 979 43.34278 46.88458 > > cor(datIn$AA, datIn$BB) > [1] 0.2626692 > > > También puedo hacer sin problemas la correlación entre todas las variables > salvo obviamente la primera. > > cor(datIn[,c(2:ncol(datIn))]) >AAABACAD AEAF AG >AH AI AJ BABBBC > AA 1. 0.8486977 0.8265902 0.6596269 0.68866326 0.4743002 0.20140216 > 0.36692385 0.15680060 0.1815578 0.04421944 0.2626692 0.3700924 > AB 0.84869774 1.000 0.7727162 0.6800804 0.60239429 0.4549922 0.20038993 > 0.32051030 0.07611170 0.1867806 0.14900189 0.2935827 0.3828968 > AC 0.82659015 0.7727162 1.000 0.4311124 0.54400731 0.4709625 0.28513806 > 0.44539063 0.20701477 0.1489140 0.11556071 0.2635190 0.3144135 > AD 0.65962689 0.6800804 0.4311124 1.000 0.57683448 0.4778828 0.21678760 > 0.12908808 0.23096319 0.1605449 0.23394432 0.2778728 0.4127627 > AE 0.68866326 0.6023943 0.5440073 0.5768345 1. 0.7380745 0.31759392 > 0.55843107 0.35888923 0.4279849 0.23914953 0.3466021 0.4665056 > AF 0.47430018 0.4549922 0.4709625 0.4778828 0.73807450 1.000 0.61495885 > 0.61403766 0.56650392 0.4192717 0.52201711 0.5480744 0.5570965 > AG 0.20140216 0.2003899 0.2851381 0.2167876 0.31759392 0.6149588 1. > 0.71671688 0.75102728 0.5815705 0.35942749 0.3458967 0.3521773 > AH 0.36692385 0.3205103 0.4453906 0.1290881 0.55843107 0.6140377 0.71671688 > 1. 0.56378874 0.7522773 0.33759298 0.3339301 0.3772097 > > > Saludos, > Carlos Ortega > www.qualityexcellence.es > > El 11 de noviembre de 2015, 15:32, Jesús Para Fernández > <j.para.fernan...@hotmail.com> escribió: > Si es un excel, yo siempre los paso a R de la misma manera: > > > > Los copio del excel y los pego en R usando el comando: > > > > datos<-read.table("clipboard",header=T,dec=",",sep="\t") > > > > siendo dec="," si el separador decimal es l acoma, header=T si lo sdatos > tienen título. > > > > Y te quitas de usar pqeutees y de líos. > > > > Un saludo > > Jesús > > > > > From: josea.bartol...@mineco.es > > > To: valea...@outlook.es; r-help-es@r-project.org > > > Date: Wed, 11 Nov 2015 14:22:23 + > > > Subject: Re: [R-es] Problema con la lectura de datos > > > > > > Hola. > > > > > > He estado viendo los datos que adjuntas en el correo. Al ser un fichero > &
Re: [R-es] Problema con la lectura de datos
Estimada Valentina Aguilera Intenta lo siguiente: Rstudio, import data set, busca tu variables2.csv ¿funciona? Si esto funciona mira el código que Rstudio escribe por usted. Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:04 Para: r help Asunto: [R-es] Problema con la lectura de datos Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
[R-es] Problema con la lectura de datos
Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Hola, Prueba a seleccionar dos de las columnas y calcular la correlación. O incluso antes de esto, ver su clase: class(Variables[, numero_de_la_columna_1]) class(Variables[, numero_de_la_columna_2]) Si son numeric, entonces puedes calcular la correlación cor(Variables[, col1], Variables[, col2] ) Si obtienes un error, es que en alguna de las dos variables, hay algún "NA". (Ayuda si compartes el fichero de entrada) para avanzar más rápido...). Saludos, Carlos Ortega www.qualityexcellence.es El 10 de noviembre de 2015, 20:56, Valentina Aguilera <valea...@outlook.es> escribió: > con as.numeric tampoco me van los cálculos y no conozco otra manera, pues > son alrededor de 40 variables las que tiene la tabla. > > To: valea...@outlook.es; c...@qualityexcellence.es; r-help-es@r-project.org > From: javier.ruben.marcu...@gmail.com > Subject: RE: [R-es] Problema con la lectura de datos > Date: Tue, 10 Nov 2015 16:43:05 -0300 > > Estimada Valentina > > as.numeric(...) > > Mira mi correo (de hace minutos) donde pregunto justo por eso, pero sobre > un error. > > > Javier Rubén Marcuzzi > Técnico en Industrias Lácteas > Veterinario > > > > De: Valentina Aguilera > Enviado: martes, 10 de noviembre de 2015 16:40 > Para: Carlos Ortega;r help > Asunto: Re: [R-es] Problema con la lectura de datos Hola, sin indicar los > tipos de variables si los lee, pero el problema est� en que necesito > calcular una matriz de correlaciones y genera el siguiente error:Error in > cor(Variables) : 'x' must be numeric Date: Tue, 10 Nov 2015 20:35:40 > +0100Subject: Re: [R-es] Problema con la lectura de datosFrom: > c...@qualityexcellence.esto: valea...@outlook.escc: r-help-es@r-project.org > Hola, Prueba a leer el fichero sin indicar los tipos de las variables. > Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", > header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") > Saludos,Carlos Ortegawww.qualityexcellence.es El 10 de noviembre de > 2015, 20:04, Valentina Aguilera <valea...@outlook.es> escribi�:Hola, > Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales > 38 son variables y una es el nombre de las empresas. Por lo que escribo el > siguiente codigo: Variables <- > read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", > comment.char="" , > colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, > dec = ",") Pero genera este error (y no se a que se deba, esto es, porque > necesito calcular la matriz de correlaciones y me dice que los valores no > son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, > nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. > [[alternative HTML version deleted]] > ___ R-help-es mailing list > R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos,Carlos Ortegawww.qualityexcellence.es > > [[alternative HTML version deleted]] > [[alternative HTML version deleted]] > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Estimado Valentina Aguilera Prueba algo como: b$Edad <- as.vector(b$Edad) o b$Edad <- as.numeric(b$Edad) Claro, por cada variable que debas convertir. Yo para saber cuales escribo str(mi data frame). Uno de los dos tendría que funcionar Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:56 Para: Javier Rubén Marcuzzi;r help Asunto: RE: [R-es] Problema con la lectura de datos con as.numeric tampoco me van los cálculos y no conozco otra manera, pues son alrededor de 40 variables las que tiene la tabla. To: valea...@outlook.es; c...@qualityexcellence.es; r-help-es@r-project.org From: javier.ruben.marcu...@gmail.com Subject: RE: [R-es] Problema con la lectura de datos Date: Tue, 10 Nov 2015 16:43:05 -0300 Estimada Valentina as.numeric(...) Mira mi correo (de hace minutos) donde pregunto justo por eso, pero sobre un error. Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:40 Para: Carlos Ortega;r help Asunto: Re: [R-es] Problema con la lectura de datos Hola, sin indicar los tipos de variables si los lee, pero el problema est� en que necesito calcular una matriz de correlaciones y genera el siguiente error: Error in cor(Variables) : 'x' must be numeric Date: Tue, 10 Nov 2015 20:35:40 +0100 Subject: Re: [R-es] Problema con la lectura de datos From: c...@qualityexcellence.es To: valea...@outlook.es CC: r-help-es@r-project.org Hola, Prueba a leer el fichero sin indicar los tipos de las variables. Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") Saludos, Carlos Ortega www.qualityexcellence.es El 10 de noviembre de 2015, 20:04, Valentina Aguilera <valea...@outlook.es> escribi�: Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Hola, sin indicar los tipos de variables si los lee, pero el problema est� en que necesito calcular una matriz de correlaciones y genera el siguiente error: Error in cor(Variables) : 'x' must be numeric Date: Tue, 10 Nov 2015 20:35:40 +0100 Subject: Re: [R-es] Problema con la lectura de datos From: c...@qualityexcellence.es To: valea...@outlook.es CC: r-help-es@r-project.org Hola, Prueba a leer el fichero sin indicar los tipos de las variables. Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") Saludos, Carlos Ortega www.qualityexcellence.es El 10 de noviembre de 2015, 20:04, Valentina Aguilera <valea...@outlook.es> escribi�: Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
con as.numeric tampoco me van los cálculos y no conozco otra manera, pues son alrededor de 40 variables las que tiene la tabla. To: valea...@outlook.es; c...@qualityexcellence.es; r-help-es@r-project.org From: javier.ruben.marcu...@gmail.com Subject: RE: [R-es] Problema con la lectura de datos Date: Tue, 10 Nov 2015 16:43:05 -0300 Estimada Valentina as.numeric(...) Mira mi correo (de hace minutos) donde pregunto justo por eso, pero sobre un error. Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:40 Para: Carlos Ortega;r help Asunto: Re: [R-es] Problema con la lectura de datos Hola, sin indicar los tipos de variables si los lee, pero el problema est� en que necesito calcular una matriz de correlaciones y genera el siguiente error:Error in cor(Variables) : 'x' must be numeric Date: Tue, 10 Nov 2015 20:35:40 +0100Subject: Re: [R-es] Problema con la lectura de datosFrom: c...@qualityexcellence.esto: valea...@outlook.escc: r-help-es@r-project.org Hola, Prueba a leer el fichero sin indicar los tipos de las variables. Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") Saludos,Carlos Ortegawww.qualityexcellence.es El 10 de noviembre de 2015, 20:04, Valentina Aguilera <valea...@outlook.es> escribi�:Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos,Carlos Ortegawww.qualityexcellence.es [[alternative HTML version deleted]] [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Estimada Valentina as.numeric(...) Mira mi correo (de hace minutos) donde pregunto justo por eso, pero sobre un error. Javier Rubén Marcuzzi Técnico en Industrias Lácteas Veterinario De: Valentina Aguilera Enviado: martes, 10 de noviembre de 2015 16:40 Para: Carlos Ortega;r help Asunto: Re: [R-es] Problema con la lectura de datos Hola, sin indicar los tipos de variables si los lee, pero el problema est� en que necesito calcular una matriz de correlaciones y genera el siguiente error: Error in cor(Variables) : 'x' must be numeric Date: Tue, 10 Nov 2015 20:35:40 +0100 Subject: Re: [R-es] Problema con la lectura de datos From: c...@qualityexcellence.es To: valea...@outlook.es CC: r-help-es@r-project.org Hola, Prueba a leer el fichero sin indicar los tipos de las variables. Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") Saludos, Carlos Ortega www.qualityexcellence.es El 10 de noviembre de 2015, 20:04, Valentina Aguilera <valea...@outlook.es> escribi�: Hola, Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales 38 son variables y una es el nombre de las empresas. Por lo que escribo el siguiente codigo: Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, dec = ",") Pero genera este error (y no se a que se deba, esto es, porque necesito calcular la matriz de correlaciones y me dice que los valores no son numericos): Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, : scan() expected 'a real', got 'ND' Gracias mil. [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es
Re: [R-es] Problema con la lectura de datos
Hola, Prueba a leer el fichero sin indicar los tipos de las variables. Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", header=TRUE, sep=";", comment.char="" , strip.white=FALSE, dec = ",") Saludos, Carlos Ortega www.qualityexcellence.es El 10 de noviembre de 2015, 20:04, Valentina Aguileraescribió: > Hola, > Estoy tratando de leer una base de datos: tengo 39 columnas, de las cuales > 38 son variables y una es el nombre de las empresas. Por lo que escribo el > siguiente codigo: > Variables <- read.csv("C:/Users/usuario/Documents/variables2.csv", > header=TRUE, sep=";", comment.char="" , > colClasses=c(Empresas="character", rep("numeric",38)), strip.white=FALSE, > dec = ",") > Pero genera este error (y no se a que se deba, esto es, porque necesito > calcular la matriz de correlaciones y me dice que los valores no son > numericos): > Error in scan(file, what, nmax, sep, dec, quote, skip, nlines, > na.strings, : scan() expected 'a real', got 'ND' > Gracias mil. > [[alternative HTML version deleted]] > > ___ > R-help-es mailing list > R-help-es@r-project.org > https://stat.ethz.ch/mailman/listinfo/r-help-es > -- Saludos, Carlos Ortega www.qualityexcellence.es [[alternative HTML version deleted]] ___ R-help-es mailing list R-help-es@r-project.org https://stat.ethz.ch/mailman/listinfo/r-help-es