Ponemos a consideracion una función para limpieza de texto, cuya entrada (x) es un vector de caracteres:
# funcion que corrije texto
clean.text = function(x) {
# tolower
x = toupper(x)
# remover signos de puntuacion
x = gsub("[[:punct:]]", "", x)
# remover numeros
x = gsub("[[:digit:]]", "", x)
# remover tabs
x = gsub("[ |\t]{2,}", "", x)
# remover espacios en blanco al comienzo
x = gsub("^ ", "", x)
# remover espacios vacios al final
x = gsub(" $", "", x)
return(x)
}
“BASES DE DATOS Y LA IMPORTANCIA DE SU USO”
De la base de datos: BASE DE DATOS.xlsx, que cuenta con dos hojas de excel: datos1 y datos2, donde:
Si desea hacer una tabla un poco más agradable, lo más sencillo es utilizar la función kable. No tiene muchas opciones, pero en muchos casos es suficiente. He aquí un ejemplo. Sea: \[y=f(x)=2x+rnorm(100), \forall x= rnorm(100)\]
donde \(rnom(100)\) produce 100 números con distribución normal.
| x | y | y.ajustado |
|---|---|---|
| -0.2523511 | -1.2051856 | -0.6084762 |
| -0.6389338 | -2.8835006 | -1.3547801 |
| -0.1815884 | -0.5392996 | -0.4718679 |
| 0.2614115 | 0.4142527 | 0.3833500 |
| -0.7452494 | -2.0247977 | -1.5600238 |
| -0.1918038 | -0.9838999 | -0.4915889 |
| 0.8773954 | 0.3502034 | 1.5725162 |
| -0.1064444 | -0.4850174 | -0.3268013 |
| -0.1736185 | -0.3788114 | -0.4564820 |
| -0.0987376 | -0.5320799 | -0.3119233 |
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| (Intercept) | -0.12 | 0.09 | -1.33 | 0.19 |
| x | 1.93 | 0.10 | 19.60 | 0.00 |
Por tanto, la ecuación que describe la tendencia es la siguiente: \[ y= 2.17x-0.04\]
Permite una mayor personalización, y si se le da la salida lm(), producirá automáticamente la tabla de coeficientes de regresión que nos interesan.
| Estimate | Std. Error | t value | Pr(>|t|) | |
|---|---|---|---|---|
| x | 1.8458 | 0.116164 | 15.8896 | 7.18348e-29 |
| (Intercept) | 0.0557986 | 0.115054 | 0.484977 | 0.628775 |
La siguiente tabla muestra el patrimonio acumulado por grupo:
| Grupo | Patrimonio |
|---|---|
| [$0-$5000] | 12145411 |
| ]$10000-$50000] | 46070202 |
| ]$5000-$10000] | 8786243 |
| ]$50000-$120000] | 37145040 |
| mas de $120000 | 349303947 |
| #### Usando pander: |
| Grupo | Patrimonio |
|---|---|
| [$0-$5000] | 12145411 |
| ]$10000-$50000] | 46070202 |
| ]$5000-$10000] | 8786243 |
| ]$50000-$120000] | 37145040 |
| mas de $120000 | 349303947 |
### Gráfico de burbujas: Grupo (Patrimonio)