numeros <- c("(595)107-3344",
"(890)-123-4465",
"999 107 5243",
"999_989-0756")
numeros <- str_remove_all(numeros, "[:punct:]")
numeros <- str_remove_all(numeros, " ")
print(numeros)
## [1] "5951073344" "8901234465" "9991075243" "9999890756"
bd <- read_csv("https://raw.githubusercontent.com/JuveCampos/miniProyectos/master/elJokerWordCloud/db.csv")
## Parsed with column specification:
## cols(
## value = col_character(),
## nombre = col_character(),
## usuario = col_character(),
## fecha = col_character(),
## retweets = col_double(),
## like = col_double(),
## replies = col_double(),
## texto = col_character(),
## hashtags = col_character(),
## ctasMencionadas = col_character(),
## nombres_propios = col_character(),
## fecha2 = col_date(format = "")
## )
value: en esta columna, está toda la información de cada tweet. Esta información luego es desglosada en las demás columnas.
nombre: en esta columna, se encuentra el nombre público de la persona que posteo.
usuario: contiene el nombre de usuario con el cual la persona decidió registrarse en Twitter.
fecha: es la fecha de la publicacion del tweet.
retweets: contiene el número de veces de el tweet se retuiteó.
like: contiene el número de likes que le dieron al tweet.
replies: contiene el número de respuestas que le dieron al tweet.
texto: contiene el texto del tweet.
hashtags: incluye todos los hashtags que incluía el tweet.
ctasMencionadas: incluye a todos los usuarios que el dueño de la cuenta incluyó en su tweet.
nombres_propios: parece que esta columna recoge todas las palabras que incluyen una mayúscula al comienzo.
bd$Prueba <- str_detect(bd$texto, "el bromas")
bromas <- bd %>% filter(Prueba=="TRUE")
head(bromas)
## # A tibble: 6 x 13
## value nombre usuario fecha retweets like replies texto hashtags
## <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <chr> <chr>
## 1 "Ald~ Aldo ~ @Aldoa~ 2019~ NA NA NA "El ~ #reflex~
## 2 "Jua~ Juan ~ @juane~ 2019~ NA NA NA "El ~ #joker,~
## 3 "Ped~ Pedro~ @ptrcar Oct 3 NA NA NA "Est~ #dc, #g~
## 4 "Mr ~ Mr ug~ @Mr_ug~ 2019~ NA 3 NA "#Jo~ #Joaqui~
## 5 "Fra~ Frase~ @Buena~ 2019~ 13 27 1 "Jok~ <NA>
## 6 "Faq~ Faq @FacuQ~ 2019~ 1 1 NA "<U+270C>Ah~ <NA>
## # ... with 4 more variables: ctasMencionadas <chr>, nombres_propios <chr>,
## # fecha2 <date>, Prueba <lgl>
groserias <- or1("tonto","chinga")
bromas$Prueba <- str_detect(bromas$value, groserias)
bd_censurada <- bromas %>% filter(bromas$Prueba=="FALSE")
bd_censurada$Prueba <- str_detect(bd_censurada$value, "Guaidó")
bd_censurada <- bd_censurada %>% filter(bd_censurada$Prueba=="FALSE")
bd_censurada$value <- str_replace_all(bd_censurada$value, "Guasón", "Joker")
bd_censurada$texto <- str_replace_all(bd_censurada$texto, "Guasón", "Joker")