Generalidades

Características Iniciales

rows 1535
columns 38
discrete_columns 37
continuous_columns 1
all_missing_columns 0
total_missing_values 7498
complete_rows 30
total_observations 58330
memory_usage 390648

Visualización de las Características Iniciales

Visualización de la distribución de las variables categóricas

Dejando fuera de la visualización la variable 19: ¿Qué tipo de vacunas contra COVID-19 co0ce?

Heatmap de Correlaciones

El correlograma anterior utiliza la correlación de Pearson, para que ésto sea viable utilizando variables categóricas crea variables “dummies” con cada uno de los valores disponibles en cada variable categórica convirtiendo los valores en dicotómicos (0 cuando esa específico valor de respuesta no se encuentra y 1 cuando ese específico valor si se encuentra en una celda determinada). Con éste ajuste es posible entonces calcular el coeficiente de correlación biserial puntual e interpretarlo como interpretamos la correlación de Pearson.

Para motivos de ésta visualización los valores de -1 y cercanos son representados por los azules y, aquellos iguales o cercanos a +1 son representados por los rojos. Los valores de 0 son representados por el blanco.

Exploración individual de variables categóricas