Objetivo


El objetivo de este markdown es conocer mas en profundidad el concepto de factores en R.


Introduccion


Los factores son la forma en la que R guarda toda la informacion categorica. Un ejemplo de factor puede ser el genero (masculino/femenino), tienen sus propios valores y orden.


Levels


Para tener un factor, tenemos que transformar nuestro vector atomico en la funcion factor. R transformara los datos en el vector como integers y guardarlos en el mismo. Ademas, añadira atributos de niveles o levels, que continuan un conjunto de etiquetas para mostrar los valores del factor.

gender <- factor(c("male","females","female","male"))

typeof(gender)
## [1] "integer"
attributes(gender)
## $levels
## [1] "female"  "females" "male"   
## 
## $class
## [1] "factor"

Podemos ver exactamente como guarda R los niveles del factor.

unclass(gender)
## [1] 3 2 1 3
## attr(,"levels")
## [1] "female"  "females" "male"

Los factores facilitan trabajar con variables categoricas en un modelo estadistico porque las variables se codifican como numeros. Sin embargo, pueden llevar a confusion porque parecen strings y se comportan como integers.

Generalmente R tratara de convertir los “Character string” en factores a la hora de cargar los datos.


Coercion


Si guardamos diferentes tipos de datos en un vector, R homogeneizara todos ellos en un mismo tipo.

R siempre sigue las mismas reglas para forzar los datos a un mismmo tipo.

Si un “character string” esta presente en un vector atomico, R convertira el resto de elemento en ello.

En cambio, si un un vector contiene valores logicos o numericos, R convertira los logicos en numericos. Todos los TRUE se convierten en 1 y todos los FALSE en 2.

A caption

A caption