El objetivo de este markdown es conocer mas en profundidad el concepto de factores en R.
Los factores son la forma en la que R guarda toda la informacion categorica. Un ejemplo de factor puede ser el genero (masculino/femenino), tienen sus propios valores y orden.
Para tener un factor, tenemos que transformar nuestro vector atomico en la funcion factor. R transformara los datos en el vector como integers y guardarlos en el mismo. Ademas, añadira atributos de niveles o levels, que continuan un conjunto de etiquetas para mostrar los valores del factor.
gender <- factor(c("male","females","female","male"))
typeof(gender)
## [1] "integer"
attributes(gender)
## $levels
## [1] "female" "females" "male"
##
## $class
## [1] "factor"
Podemos ver exactamente como guarda R los niveles del factor.
unclass(gender)
## [1] 3 2 1 3
## attr(,"levels")
## [1] "female" "females" "male"
Los factores facilitan trabajar con variables categoricas en un modelo estadistico porque las variables se codifican como numeros. Sin embargo, pueden llevar a confusion porque parecen strings y se comportan como integers.
Generalmente R tratara de convertir los “Character string” en factores a la hora de cargar los datos.
Si guardamos diferentes tipos de datos en un vector, R homogeneizara todos ellos en un mismo tipo.
R siempre sigue las mismas reglas para forzar los datos a un mismmo tipo.
Si un “character string” esta presente en un vector atomico, R convertira el resto de elemento en ello.
En cambio, si un un vector contiene valores logicos o numericos, R convertira los logicos en numericos. Todos los TRUE se convierten en 1 y todos los FALSE en 2.
A caption