Re: [R-es] Extraer texto de una columna en Excel

2023-03-31 Por tema Carlos Ortega
OK.
Si ya lo tienes resuelto...

Gracias,
Carlos.

El vie, 31 mar 2023 a las 19:23, David Camilo Gomez Medina (<
dcgome...@unal.edu.co>) escribió:

> Muchas gracias por la alternativa de utilizar la librería stringi, Carlos,
> no la conocía.
>
> On Fri, 31 Mar 2023 at 12:11, David Camilo Gomez Medina <
> dcgome...@unal.edu.co> wrote:
>
>> Muchas gracias Carlos, lo que quiero hacer es lo siguiente: extraer el
>> texto que hay entre textura/s hasta el punto final.
>> Ejemplo:
>> *Moderadamente profundos, bien drenados, de textura franco arenosa a
>> franco arcillo arenosa. Fertilidad natural media*
>> Lo que quiero extraer sería:  *franco arenosa a franco arcillo arenosa *
>>
>> Al final lo pude realizar de la siguiente manera:
>>
>> df <- read_excel("Agrologia.xlsx")
>>
>> df$Extracted_Text <- trimws(str_extract(df$CARACTERIS,
>> "(?<=textura?(?:[^a-zA-Z]|s)).*?(?=\\.)"))
>>
>> Estoy abierto a cualquier sugerencia o comentario.
>>
>> Muchas gracias.
>>
>> On Fri, 31 Mar 2023 at 12:03, Carlos Ortega 
>> wrote:
>>
>>> Hola,
>>>
>>> Como no sé lo que querías, veo dos alternativas...
>>> Yo suelo usar "stringi" en vez de "stringr"
>>>
>>> #-
>>> library(readxl)
>>> library(stringi)
>>> datos <- read_excel("Agrologia.xlsx")
>>> toextract <- unlist(stri_extract_all_fixed(datos$CARACTERIS, "textura"))
>>>
>>> #--- Si quiero un dataframe completo donde CARACTERIS tenga "textura" o
>>> "texturas"
>>> lineas_textura <- datos[ !is.na(toextract), ]
>>> #--- Si quiero los elementos de CARACTERIS que tiene "textura" o
>>> "texturas"
>>> campo_textura <- datos$CARACTERIS[ !is.na((toextract))]
>>> #---
>>>
>>> Gracias,
>>>
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El vie, 31 mar 2023 a las 17:20, David Camilo Gomez Medina (<
>>> dcgome...@unal.edu.co>) escribió:
>>>
 Buen día,

 Estoy extrayendo solo una parte de texto de una celda en Excel, pero
 tengo un inconveniente. Quiero extraer el texto desde donde dice
 *textura* hasta el siguiente punto, pero hay unas celdas que dicen
 *texturas* y me está extrayendo también ésta *s*, cómo podría cambiar
 el siguiente código para que me extraiga tanto textura como texturas. Quedo
 muy atento, gracias.

 rm(list = ls())

 library(readxl)
 library(stringr)
 library(openxlsx)

 setwd("~/INFO_DIEGO/R")

 df <- read_excel("Agrologia.xlsx")

 df$Extracted_Text <- str_extract(df$CARACTERIS, "(<=?textura?).*?\\.")

 write.xlsx(df, "modified_file.xlsx")




 *Aviso legal:* El contenido de este mensaje y los archivos adjuntos
 son confidenciales y de uso exclusivo de la Universidad Nacional de
 Colombia. Se encuentran dirigidos sólo para el uso del destinatario al cual
 van enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
 cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
 recibido por error, infórmenos y elimínelo de su correo. Los Datos
 Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
 Política de Datos Personales que podrá consultar en la página web
 www.unal.edu.co. Las opiniones, informaciones, conclusiones y
 cualquier otro tipo de dato contenido en este correo electrónico, no
 relacionados con la actividad de la Universidad Nacional de Colombia, se
 entenderá como personales y de ninguna manera son avaladas por la
 Universidad.
 ___
 R-help-es mailing list
 R-help-es@r-project.org
 https://stat.ethz.ch/mailman/listinfo/r-help-es

>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
> *Aviso legal:* El contenido de este mensaje y los archivos adjuntos son
> confidenciales y de uso exclusivo de la Universidad Nacional de Colombia.
> Se encuentran dirigidos sólo para el uso del destinatario al cual van
> enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
> cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
> recibido por error, infórmenos y elimínelo de su correo. Los Datos
> Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
> Política de Datos Personales que podrá consultar en la página web
> www.unal.edu.co. Las opiniones, informaciones, conclusiones y cualquier
> otro tipo de dato contenido en este correo electrónico, no relacionados con
> la actividad de la Universidad Nacional de Colombia, se entenderá como
> personales y de ninguna manera son avaladas por la Universidad.
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Extraer texto de una columna en Excel

2023-03-31 Por tema David Camilo Gomez Medina
Muchas gracias por la alternativa de utilizar la librería stringi, Carlos,
no la conocía.

On Fri, 31 Mar 2023 at 12:11, David Camilo Gomez Medina <
dcgome...@unal.edu.co> wrote:

> Muchas gracias Carlos, lo que quiero hacer es lo siguiente: extraer el
> texto que hay entre textura/s hasta el punto final.
> Ejemplo:
> *Moderadamente profundos, bien drenados, de textura franco arenosa a
> franco arcillo arenosa. Fertilidad natural media*
> Lo que quiero extraer sería:  *franco arenosa a franco arcillo arenosa *
>
> Al final lo pude realizar de la siguiente manera:
>
> df <- read_excel("Agrologia.xlsx")
>
> df$Extracted_Text <- trimws(str_extract(df$CARACTERIS,
> "(?<=textura?(?:[^a-zA-Z]|s)).*?(?=\\.)"))
>
> Estoy abierto a cualquier sugerencia o comentario.
>
> Muchas gracias.
>
> On Fri, 31 Mar 2023 at 12:03, Carlos Ortega 
> wrote:
>
>> Hola,
>>
>> Como no sé lo que querías, veo dos alternativas...
>> Yo suelo usar "stringi" en vez de "stringr"
>>
>> #-
>> library(readxl)
>> library(stringi)
>> datos <- read_excel("Agrologia.xlsx")
>> toextract <- unlist(stri_extract_all_fixed(datos$CARACTERIS, "textura"))
>>
>> #--- Si quiero un dataframe completo donde CARACTERIS tenga "textura" o
>> "texturas"
>> lineas_textura <- datos[ !is.na(toextract), ]
>> #--- Si quiero los elementos de CARACTERIS que tiene "textura" o
>> "texturas"
>> campo_textura <- datos$CARACTERIS[ !is.na((toextract))]
>> #---
>>
>> Gracias,
>>
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El vie, 31 mar 2023 a las 17:20, David Camilo Gomez Medina (<
>> dcgome...@unal.edu.co>) escribió:
>>
>>> Buen día,
>>>
>>> Estoy extrayendo solo una parte de texto de una celda en Excel, pero
>>> tengo un inconveniente. Quiero extraer el texto desde donde dice
>>> *textura* hasta el siguiente punto, pero hay unas celdas que dicen
>>> *texturas* y me está extrayendo también ésta *s*, cómo podría cambiar
>>> el siguiente código para que me extraiga tanto textura como texturas. Quedo
>>> muy atento, gracias.
>>>
>>> rm(list = ls())
>>>
>>> library(readxl)
>>> library(stringr)
>>> library(openxlsx)
>>>
>>> setwd("~/INFO_DIEGO/R")
>>>
>>> df <- read_excel("Agrologia.xlsx")
>>>
>>> df$Extracted_Text <- str_extract(df$CARACTERIS, "(<=?textura?).*?\\.")
>>>
>>> write.xlsx(df, "modified_file.xlsx")
>>>
>>>
>>>
>>>
>>> *Aviso legal:* El contenido de este mensaje y los archivos adjuntos son
>>> confidenciales y de uso exclusivo de la Universidad Nacional de Colombia.
>>> Se encuentran dirigidos sólo para el uso del destinatario al cual van
>>> enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
>>> cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
>>> recibido por error, infórmenos y elimínelo de su correo. Los Datos
>>> Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
>>> Política de Datos Personales que podrá consultar en la página web
>>> www.unal.edu.co. Las opiniones, informaciones, conclusiones y cualquier
>>> otro tipo de dato contenido en este correo electrónico, no relacionados con
>>> la actividad de la Universidad Nacional de Colombia, se entenderá como
>>> personales y de ninguna manera son avaladas por la Universidad.
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>

-- 
*Aviso legal:* El contenido de este mensaje y los archivos adjuntos son 
confidenciales y de uso exclusivo de la Universidad Nacional de Colombia. 
Se encuentran dirigidos sólo para el uso del destinatario al cual van 
enviados. La reproducción, lectura y/o copia se encuentran prohibidas a 
cualquier persona diferente a este y puede ser ilegal. Si usted lo ha 
recibido por error, infórmenos y elimínelo de su correo. Los Datos 
Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra 
Política de Datos Personales que podrá consultar en la página web 
www.unal.edu.co .* *Las opiniones, informaciones, 
conclusiones y cualquier otro tipo de dato contenido en este correo 
electrónico, no relacionados con la actividad de la Universidad Nacional de 
Colombia, se entenderá como personales y de ninguna manera son avaladas por 
la Universidad.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Extraer texto de una columna en Excel

2023-03-31 Por tema David Camilo Gomez Medina
Muchas gracias Carlos, lo que quiero hacer es lo siguiente: extraer el
texto que hay entre textura/s hasta el punto final.
Ejemplo:
*Moderadamente profundos, bien drenados, de textura franco arenosa a franco
arcillo arenosa. Fertilidad natural media*
Lo que quiero extraer sería:  *franco arenosa a franco arcillo arenosa *

Al final lo pude realizar de la siguiente manera:

df <- read_excel("Agrologia.xlsx")

df$Extracted_Text <- trimws(str_extract(df$CARACTERIS,
"(?<=textura?(?:[^a-zA-Z]|s)).*?(?=\\.)"))

Estoy abierto a cualquier sugerencia o comentario.

Muchas gracias.

On Fri, 31 Mar 2023 at 12:03, Carlos Ortega 
wrote:

> Hola,
>
> Como no sé lo que querías, veo dos alternativas...
> Yo suelo usar "stringi" en vez de "stringr"
>
> #-
> library(readxl)
> library(stringi)
> datos <- read_excel("Agrologia.xlsx")
> toextract <- unlist(stri_extract_all_fixed(datos$CARACTERIS, "textura"))
>
> #--- Si quiero un dataframe completo donde CARACTERIS tenga "textura" o
> "texturas"
> lineas_textura <- datos[ !is.na(toextract), ]
> #--- Si quiero los elementos de CARACTERIS que tiene "textura" o "texturas"
> campo_textura <- datos$CARACTERIS[ !is.na((toextract))]
> #---
>
> Gracias,
>
> Carlos Ortega
> www.qualityexcellence.es
>
> El vie, 31 mar 2023 a las 17:20, David Camilo Gomez Medina (<
> dcgome...@unal.edu.co>) escribió:
>
>> Buen día,
>>
>> Estoy extrayendo solo una parte de texto de una celda en Excel, pero
>> tengo un inconveniente. Quiero extraer el texto desde donde dice
>> *textura* hasta el siguiente punto, pero hay unas celdas que dicen
>> *texturas* y me está extrayendo también ésta *s*, cómo podría cambiar el
>> siguiente código para que me extraiga tanto textura como texturas. Quedo
>> muy atento, gracias.
>>
>> rm(list = ls())
>>
>> library(readxl)
>> library(stringr)
>> library(openxlsx)
>>
>> setwd("~/INFO_DIEGO/R")
>>
>> df <- read_excel("Agrologia.xlsx")
>>
>> df$Extracted_Text <- str_extract(df$CARACTERIS, "(<=?textura?).*?\\.")
>>
>> write.xlsx(df, "modified_file.xlsx")
>>
>>
>>
>>
>> *Aviso legal:* El contenido de este mensaje y los archivos adjuntos son
>> confidenciales y de uso exclusivo de la Universidad Nacional de Colombia.
>> Se encuentran dirigidos sólo para el uso del destinatario al cual van
>> enviados. La reproducción, lectura y/o copia se encuentran prohibidas a
>> cualquier persona diferente a este y puede ser ilegal. Si usted lo ha
>> recibido por error, infórmenos y elimínelo de su correo. Los Datos
>> Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra
>> Política de Datos Personales que podrá consultar en la página web
>> www.unal.edu.co. Las opiniones, informaciones, conclusiones y cualquier
>> otro tipo de dato contenido en este correo electrónico, no relacionados con
>> la actividad de la Universidad Nacional de Colombia, se entenderá como
>> personales y de ninguna manera son avaladas por la Universidad.
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>

-- 
*Aviso legal:* El contenido de este mensaje y los archivos adjuntos son 
confidenciales y de uso exclusivo de la Universidad Nacional de Colombia. 
Se encuentran dirigidos sólo para el uso del destinatario al cual van 
enviados. La reproducción, lectura y/o copia se encuentran prohibidas a 
cualquier persona diferente a este y puede ser ilegal. Si usted lo ha 
recibido por error, infórmenos y elimínelo de su correo. Los Datos 
Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra 
Política de Datos Personales que podrá consultar en la página web 
www.unal.edu.co .* *Las opiniones, informaciones, 
conclusiones y cualquier otro tipo de dato contenido en este correo 
electrónico, no relacionados con la actividad de la Universidad Nacional de 
Colombia, se entenderá como personales y de ninguna manera son avaladas por 
la Universidad.

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Extraer texto de una columna en Excel

2023-03-31 Por tema David Camilo Gomez Medina
Buen día,

Estoy extrayendo solo una parte de texto de una celda en Excel, pero tengo
un inconveniente. Quiero extraer el texto desde donde dice *textura* hasta
el siguiente punto, pero hay unas celdas que dicen *texturas* y me está
extrayendo también ésta *s*, cómo podría cambiar el siguiente código para
que me extraiga tanto textura como texturas. Quedo muy atento, gracias.

rm(list = ls())

library(readxl)
library(stringr)
library(openxlsx)

setwd("~/INFO_DIEGO/R")

df <- read_excel("Agrologia.xlsx")

df$Extracted_Text <- str_extract(df$CARACTERIS, "(<=?textura?).*?\\.")

write.xlsx(df, "modified_file.xlsx")

-- 
*Aviso legal:* El contenido de este mensaje y los archivos adjuntos son 
confidenciales y de uso exclusivo de la Universidad Nacional de Colombia. 
Se encuentran dirigidos sólo para el uso del destinatario al cual van 
enviados. La reproducción, lectura y/o copia se encuentran prohibidas a 
cualquier persona diferente a este y puede ser ilegal. Si usted lo ha 
recibido por error, infórmenos y elimínelo de su correo. Los Datos 
Personales serán tratados conforme a la Ley 1581 de 2012 y a nuestra 
Política de Datos Personales que podrá consultar en la página web 
www.unal.edu.co .* *Las opiniones, informaciones, 
conclusiones y cualquier otro tipo de dato contenido en este correo 
electrónico, no relacionados con la actividad de la Universidad Nacional de 
Colombia, se entenderá como personales y de ninguna manera son avaladas por 
la Universidad.


Agrologia.xlsx
Description: MS-Excel 2007 spreadsheet
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es