Ponemos a consideracion una función para limpieza de texto, cuya entrada (x) es un vector de caracteres:

TIDY=TRUE para que salga bonito

# funcion que corrije texto
clean.text = function(x) {
    # tolower
    x = toupper(x)
    # remover signos de puntuacion
    x = gsub("[[:punct:]]", "", x)
    # remover numeros
    x = gsub("[[:digit:]]", "", x)
    # remover tabs
    x = gsub("[ |\t]{2,}", "", x)
    # remover espacios en blanco al comienzo
    x = gsub("^ ", "", x)
    # remover espacios vacios al final
    x = gsub(" $", "", x)
    return(x)
}
BASES DE DATOS Y LA IMPORTANCIA DE SU USO

“BASES DE DATOS Y LA IMPORTANCIA DE SU USO”

INFORME DE BASES DE DATOS

De la base de datos: doc2sandra.Rmd, que cuenta con dos hojas de excel: datos1 y datos2, donde:

ALGUNOS EJEMPLOS DE TABLAS

kable

Si desea hacer una tabla un poco más agradable, lo más sencillo es utilizar la función kable. No tiene muchas opciones, pero en muchos casos es suficiente. He aquí un ejemplo. Sea: \[y=f(x)=2x+rnorm(100), \forall x= rnorm(100)\] #para escribir formulas o lenguaje matematico en genral, usamos \(formula\): la formula se escribe en la misma linea del texto #\[formula\] se escribe en el centro de una nueva lines

donde \(rnom(100)\) produce 100 números con distribución normal.

TABLA DE VALORES
x y y.ajustado
1.5144481 2.2066347 2.7761912
-1.0181805 -2.9797650 -1.9300680
0.0224506 1.3897843 0.0036856
-0.2466115 -2.4686376 -0.4962993
0.5990809 -0.8408987 1.0752094
0.7150845 1.3501574 1.2907732
1.1779755 2.6360015 2.1509408
1.2189258 2.6731014 2.2270367
-0.3101992 -1.2484028 -0.6144611
-1.1483696 -1.7140013 -2.1719920
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.04 0.10 -0.39 0.7
x 1.86 0.09 20.67 0.0

Por tanto, la ecuación que describe la tendencia es la siguiente: \[ y= 2.17x-0.04\]

pander

Permite una mayor personalización, y si se le da la salida lm(), producirá automáticamente la tabla de coeficientes de regresión que nos interesan.

Coeficientes de Regresión Lineal
  Estimate Std. Error t value Pr(>|t|)
x 1.98381 0.0921716 21.523 6.42303e-39
(Intercept) -0.0110594 0.0948608 -0.116586 0.907427

TABLAS DE CONTINGENCIA

La siguiente tabla muestra el patrimonio acumulado por grupo:

Usando kable:

Tabla: Grupo en función del patrimonio
Grupo Patrimonio
[$0-$5000] 12145411
]$10000-$50000] 46070202
]$5000-$10000] 8786243
]$50000-$120000] 37145040
mas de $120000 349303947
#### Usando pander:
Tabla: Grupo en función del patrimonio ## Gráficos estadísticos para los grupos en función del patrimonio:
Grupo Patrimonio
[$0-$5000] 12145411
]$10000-$50000] 46070202
]$5000-$10000] 8786243
]$50000-$120000] 37145040
mas de $120000 349303947

#instalar paquete devtools #3rainbow(n, alpha = 1) colores aleatorios, con alpha se controla que tan transparentes #heat.colors(n, alpha= 1)

#que es packrat

##  [1] "#FF0000FF" "#FF4000FF" "#FF8000FF" "#FFBF00FF" "#FFFF00FF"
##  [6] "#BFFF00FF" "#80FF00FF" "#40FF00FF" "#00FF00FF" "#00FF40FF"
## [11] "#00FF80FF" "#00FFBFFF" "#00FFFFFF" "#00BFFFFF" "#0080FFFF"
## [16] "#0040FFFF" "#0000FFFF" "#4000FFFF" "#8000FFFF" "#BF00FFFF"
## [21] "#FF00FFFF" "#FF00BFFF" "#FF0080FF" "#FF0040FF"
##  [1] "#FF0000FF" "#FF0F00FF" "#FF1E00FF" "#FF2D00FF" "#FF3C00FF"
##  [6] "#FF4B00FF" "#FF5A00FF" "#FF6900FF" "#FF7800FF" "#FF8700FF"
## [11] "#FF9600FF" "#FFA500FF" "#FFB400FF" "#FFC300FF" "#FFD200FF"
## [16] "#FFE100FF" "#FFF000FF" "#FFFF00FF" "#FFFF15FF" "#FFFF40FF"
## [21] "#FFFF6AFF" "#FFFF95FF" "#FFFFBFFF" "#FFFFEAFF"