Modelos regresion y naive bayes 1600734568+09+2001-2dígitos

Importación de la data

library(readxl)
DATA_PARCIAL2 <- read_excel("DATA_PARCIAL2.xlsx")
View(DATA_PARCIAL2)

#Descripción de variables

colnames(DATA_PARCIAL2)
##  [1] "UBICACIÓN"                                                                                                                                                                                                   
##  [2] "¿En qué cantón de la provincia de Chimborazo vive?"                                                                                                                                                          
##  [3] "Edad del encuestado"                                                                                                                                                                                         
##  [4] "Sexo"                                                                                                                                                                                                        
##  [5] "Estado civil"                                                                                                                                                                                                
##  [6] "Cantidad de personas que conforman el hogar"                                                                                                                                                                 
##  [7] "¿Qué parentesco tiene con el representante del hogar?"                                                                                                                                                       
##  [8] "¿Cuál es el tipo de vivienda?"                                                                                                                                                                               
##  [9] "El material predominante de las paredes exteriores de la vivienda es de:"                                                                                                                                    
## [10] "EL material predominante del piso de la vivienda es de:"                                                                                                                                                     
## [11] "¿Cuántos cuartos de baño con ducha de uso exclusivo tiene este hogar?"                                                                                                                                       
## [12] "Tipo de servicio higiénico con que cuenta este hogar"                                                                                                                                                        
## [13] "¿Cuenta con servicio de internet?"                                                                                                                                                                           
## [14] "¿Cuenta con computadora de escritorio?"                                                                                                                                                                      
## [15] "¿Cuenta con computadora portátil?"                                                                                                                                                                           
## [16] "¿Cuántos celulares activados tiene en este hogar?"                                                                                                                                                           
## [17] "¿Tiene su hogar servicio de teléfono convencional?"                                                                                                                                                          
## [18] "¿Tiene en su hogar cocina con horno?"                                                                                                                                                                        
## [19] "¿Tiene refrigeradora?"                                                                                                                                                                                       
## [20] "¿Tiene lavadora?"                                                                                                                                                                                            
## [21] "¿Tiene equipo de sonido?"                                                                                                                                                                                    
## [22] "¿Cuántas TV a color tienen en este hogar?"                                                                                                                                                                   
## [23] "¿Cuántos vehículos de uso exclusivo tiene este hogar?"                                                                                                                                                       
## [24] "¿Alguien en el hogar compra vestimenta en centros comerciales?"                                                                                                                                              
## [25] "¿En el hogar alguien ha usado internet en los últimos 6 meses?"                                                                                                                                              
## [26] "¿En el hogar alguien utiliza correo electrónico que no es del trabajo?"                                                                                                                                      
## [27] "¿En el hogar alguien está registrado en una red social?"                                                                                                                                                     
## [28] "Exceptuando los libros de texto o manuales de estudio y lecturas de trabajo¿Alguien del hogar ha leído algún libro completo en los últimos 3 meses?"                                                         
## [29] "¿Cuál es el nivel de instrucción del Jefe del hogar?"                                                                                                                                                        
## [30] "¿Alguien en el hogar está afiliado o cubierto por el seguro del IESS (general, voluntario o campesino) y/o seguro del ISSFA o ISSPOL?"                                                                       
## [31] "¿Alguien en el hogar tiene seguro de salud privada con hospitalización, seguro de salud privada sin hospitalización, seguro internacional,seguros municipales y de Consejos Provinciales y/o seguro de vida?"
## [32] "¿Cuál es la ocupación del Representante del hogar?"                                                                                                                                                          
## [33] "NSE_2023_CUALI"                                                                                                                                                                                              
## [34] "¿Para qué sector trabaja?"                                                                                                                                                                                   
## [35] "¿Consume usted arroz?"                                                                                                                                                                                       
## [36] "¿Consume usted queso industrial (CON MARCA)"                                                                                                                                                                 
## [37] "¿Consume usted huevos?"                                                                                                                                                                                      
## [38] "¿Consume frutas?"

Se obtiene que se encuentran 38 variables, las cuales son: - Ubicación: Variable de tipo cualitativa nominal, con diferentes tipos de ubicación de la provincia de Chimborazo.

Variable cualitativa nominal. Cuenta con 2 niveles: sí y no

Transformar las variables character a variables factor

clases <- sapply(DATA_PARCIAL2, class)
head(clases)
##                                          UBICACIÓN 
##                                        "character" 
## ¿En qué cantón de la provincia de Chimborazo vive? 
##                                        "character" 
##                                Edad del encuestado 
##                                          "numeric" 
##                                               Sexo 
##                                        "character" 
##                                       Estado civil 
##                                        "character" 
##        Cantidad de personas que conforman el hogar 
##                                          "numeric"

#limpieza de la data

Detección de Na’s

which(is.na(DATA_PARCIAL2))
##   [1]  1182  1205  1207  1313  1319  1345  1410  1438  1450  1451  1482  1599
##  [13]  1653 20200 20201 20202 20208 20216 20217 20218 20220 20221 20228 20240
##  [25] 20261 20263 20269 20281 20282 20290 20297 20305 20310 20313 20317 20318
##  [37] 20323 20335 20341 20344 20345 20347 20348 20349 20350 20359 20366 20370
##  [49] 20372 20375 20376 20381 20383 20388 20394 20407 20417 20427 20437 20440
##  [61] 20444 20448 20451 20464 20465 20468 20470 20471 20474 20475 20476 20477
##  [73] 20479 20480 20493 20494 20495 20497 20498 20499 20500 20503 20506 20509
##  [85] 20511 20513 20514 20515 20516 20517 20518 20519 20521 20527 20528 20529
##  [97] 20530 20533 20545 20554 20555 20567 20568 20569 20575 20576 20577 20578
## [109] 20579 20580 20581 20582 20585 20589 20590 20591 20592 20593 20595 20600
## [121] 20602 20603 20606 20609 20611 20613 20617 20618 20623 20624 20625 20626
## [133] 20627 20629 20632 20635 20641 20645 20651 20652 20653 20659 20661 20667
## [145] 20672 20677 20679 20681 20682 20684 20686 20689 20690 20693 20694 20697
## [157] 20704 20706 20707 20713 20714 20716 20717 20719 20721 20723 20726 20728
## [169] 20729 20730 20733 20736 20738 20739 20742 20745 20746 20747 20748 20750
## [181] 20751 20753 20754 20756 20757 20758 20759 20760 20761 20762 20764 20765
## [193] 20766 20767 20769 20770 20772
sum(is.na(DATA_PARCIAL2))
## [1] 197

Interpretación Se verifica que la base de datos contiene 197 datos faltantes, por lo cual se debe hacer la debida imputación.

Omitir na’s

BASE <- na.omit(DATA_PARCIAL2)
View(BASE)

**Interpretación*

Se obtiene que al utilizar el na.omit permite ejecutar funciones numéricas sobre datos NA, algunos análisis devolverán un error ante la existencia de valores NA o vacíos (““). Por lo que, al correr nuevamente la data, ya no aparecen aquellos datos.

##Transformar a factor las variables

BASE$UBICACIÓN <- factor(BASE$UBICACIÓN)
levels(BASE$UBICACIÓN) = c("Alausí","Cacha","Calpi","Chambo","Chunchi","Colta","Cubijíes","Cumanda","Flores","Guamote","Guano","Licán","Licto","Lizarzaburu","Maldonado","Pallatanga","Penipe","Pungalá","Punín","Quimiag","San Juan","San Luis","Velasco","Veloz","Yaruquíes")
# Transformar la variable tipo de Cuenta con servicio de internet de caracter a factor
 
BASE$`¿Cuenta con servicio de internet?` <-   factor(BASE$`¿Cuenta con servicio de internet?`)
levels(BASE$`¿Cuenta con servicio de internet?`) <- c("Si","No")
  • Tranformar a factor la variable ¿Para qué sector trabaja?
BASE$`¿Para qué sector trabaja?`= factor(BASE$`¿Para qué sector trabaja?`)
levels(BASE$`¿Para qué sector trabaja?`) = c("Sector público", "Sector privado", "Ninguno")
class(BASE$`¿Para qué sector trabaja?`)
## [1] "factor"
  • Tranformar a factor la variable “Consume usted arroz”
BASE$`¿Consume usted arroz?`= factor(BASE$`¿Consume usted arroz?`)
levels(BASE$`¿Consume usted arroz?`)= c("Si", "No")
class(BASE$`¿Consume usted arroz?`)
## [1] "factor"
  • Tranformar a factor la variable “¿Consume usted queso industrial (CON MARCA)”
BASE$`¿Consume usted queso industrial (CON MARCA)`= factor(BASE$`¿Consume usted queso industrial (CON MARCA)`)
levels(BASE$`¿Consume usted queso industrial (CON MARCA)`)=c("Si", "No")
class(BASE$`¿Consume usted queso industrial (CON MARCA)`)
## [1] "factor"
  • Transformar a factor la variable “¿Consume usted huevos?”
BASE$`¿Consume usted huevos?`= factor(BASE$`¿Consume usted huevos?`)
levels(BASE$`¿Consume usted huevos?`)=c("Si", "No")
class(BASE$`¿Consume usted huevos?`)
## [1] "factor"
  • Transformar a factor la variable “¿Consume frutas?”
BASE$`¿Consume frutas?`= factor (BASE$`¿Consume frutas?`)
levels(BASE$`¿Consume frutas?`) =c("Si", "No")
class(BASE$`¿Consume frutas?`)
## [1] "factor"

Forma automática

BASE1 <- as.data.frame(lapply(DATA_PARCIAL2, function(x) if(is.character(x))
  as.factor(x) else x))
clases <- sapply(DATA_PARCIAL2,class);
head(clases)
##                                          UBICACIÓN 
##                                        "character" 
## ¿En qué cantón de la provincia de Chimborazo vive? 
##                                        "character" 
##                                Edad del encuestado 
##                                          "numeric" 
##                                               Sexo 
##                                        "character" 
##                                       Estado civil 
##                                        "character" 
##        Cantidad de personas que conforman el hogar 
##                                          "numeric"

#Unión de las variables ya transformadas

Classes <- sapply(BASE, class)
for (i in 1:ncol(BASE))
  if(Classes [i]== "numeric")
    BASE[[i]]= as.numeric(BASE[[i]])
Classes = sapply(BASE, class)
head(Classes)
##                                          UBICACIÓN 
##                                           "factor" 
## ¿En qué cantón de la provincia de Chimborazo vive? 
##                                           "factor" 
##                                Edad del encuestado 
##                                          "numeric" 
##                                               Sexo 
##                                           "factor" 
##                                       Estado civil 
##                                           "factor" 
##        Cantidad de personas que conforman el hogar 
##                                          "numeric"

ANALISIS DESCRIPTIVO

summary(BASE[, clases ==  "numeric"])
##  Edad del encuestado Cantidad de personas que conforman el hogar
##  Min.   :15.00       Min.   : 1.000                             
##  1st Qu.:26.00       1st Qu.: 3.000                             
##  Median :37.00       Median : 4.000                             
##  Mean   :38.16       Mean   : 4.319                             
##  3rd Qu.:47.00       3rd Qu.: 5.000                             
##  Max.   :81.00       Max.   :37.000
apply(BASE[,clases == "numeric"], 2, sd)
##                         Edad del encuestado 
##                                   13.983034 
## Cantidad de personas que conforman el hogar 
##                                    2.343052

Su mediana es de 37 años. Además, al considerar el 1er cuartil, se infiere que el 25% de la población en estudio constituye 26 años, mientras que, el 3er cuartil que representa el 75% es de 47 años, con una desviación estándar de 13.983034.

Entonces, se infiere que la mayoría de personas están dentro de la edad adulta, es decir, se encuentra en una edad promedio por lo que es buena edad para ser encuestado.

Su mediana es de 4 personass. Además, al considerar el 1er cuartil, se infiere que el 25% de la población en estudio constituye a 3 personas por familia, mientras que, el 3er cuartil que representa el 75% es de 45 personas por familia, con una desviación estándar de 2.343052.

Entonces, se infiere que la mayoria de personas no sobrepasa más del 5 personas por familias.

#Análisis visual de datos

#Diagrama de barras de las variables que influyen en la alimentación

library(ggplot2)
grafico_1 = ggplot(BASE,aes(x= `¿Consume usted arroz?`))+
  geom_bar(stat="count", width=0.7, fill="skyblue")+
  theme_minimal() +   geom_text(aes(label = ..count..), stat="count" )
print(grafico_1)
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

grafico_2 = ggplot(BASE,aes(x=`¿Consume usted queso industrial (CON MARCA)`))+
  geom_bar(stat="count", width=0.7, fill="orange")+
  theme_minimal() + geom_text(aes(label = ..count..), stat="count" )
print(grafico_2)

grafico_3 = ggplot(BASE,aes(x=`¿Consume usted huevos?`))+
  geom_bar(stat="count", width=0.7, fill="green")+
  theme_minimal() + geom_text(aes(label = ..count..), stat="count" )
print(grafico_3)

grafico_4 =ggplot(BASE,aes(x=`¿Consume frutas?`))+
  geom_bar(stat="count", width=0.7, fill="pink")+
  theme_minimal() + geom_text(aes(label = ..count..), stat="count" )
print(grafico_4)

#Gráficas de dispersión para las variables que posiblemente influyan en la alimentación

Comparación de variables a “¿Consume usted arroz?”

Variable Cantidad de personas que conforman el hogar y ¿Cuál es la ocupación del Representante del hogar?

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`¿Cuál es la ocupación del Representante del hogar?`, colour = `¿Consume usted arroz?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad personas que conforman el hogar - Ocupación", 
    x = "personas que conforman el hogar",
    y = "ocupación del Representante del hogar"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre ocupación y personas que conforman el hogar con respecto a la variable dicotómica ¿Consume usted arroz?“, se dicta que no existe relación, ya que a pesar de su cargo en el trabajo y la edad la mayoría de personas no consumen. Es decir, que las variables no son dependientes a consumo de arroz.

Variable Cantidad de personas que conforman el hogar y Edad del encuestado

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`Edad del encuestado`, colour = `¿Consume usted arroz?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - Edad del encuestado", 
    x = "Cantidad de personas que conforman el hogar",
    y = "Edad del encuestado"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre cantidad de personas que conforman el hogar y edad del encuestado con respecto a la variable dicotómica ¿Consume usted arroz?“, se dicta que no existe relación, ya que la cantidad de personas depende de la edad, por lo cual no tiene relación con Consumo de arroz.

Variable Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`¿En qué cantón de la provincia de Chimborazo vive?`, colour = `¿Consume usted arroz?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - ¿En qué cantón de la provincia de Chimborazo vive?", 
    x = "Cantidad de personas que conforman el hogar",
    y = "¿En qué cantón de la provincia de Chimborazo vive?"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre cantidad de personas que conforman el hogar y el cantón de que pertenece con respecto a la variable dicotómica “¿Consume usted arroz?”, se dicta que sí existe relación, ya que mientras el cantón es más grande (Desarrollado), y la cantidad de familias es más pequeña, la gente tiende a comer más arroz, mientras, que más personas se encuentra en la famila en cantones rurales, la gente tiende a comer menos arroz.

Variable Edad del encuestado y Sexo?

library(ggplot2)
ggplot(BASE, aes(`Edad del encuestado`,Sexo, colour = `¿Consume usted arroz?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Edad del encuestado - Sexo", 
    x = "Edad del encuestado",
    y = "Sexo"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre edad del encuestado y sexo con respecto a la variable dicotómica “¿Consume usted arroz?”, se dicta que no existe relación, ya que ser mujer u hombre y la edad no define el consumo de arroz.

Comparación de variables a “¿Consume usted queso industrial (CON MARCA)”

Variable Cantidad de personas que conforman el hogar y NSE_2023_CUALI

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,NSE_2023_CUALI, colour = `¿Consume usted queso industrial (CON MARCA)`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - NSE_2023_CUALI", 
    x = "personas que conforman el hogar",
    y = "NSE_2023_CUALIr"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y NSE_2023_CUALI con respecto a la variable dicotómica “¿Consume usted queso industrial (CON MARCA)”, se dicta que sí existe relación, ya que mientras más personas conforman el hogar y el nivel socioeconómico es más bajo, el consumo de queso industrial con marca es más alto.

Variable Cantidad de personas que conforman el hogar y Edad del encuestado

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`Edad del encuestado`, colour = `¿Consume usted queso industrial (CON MARCA)`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar- edad del encuestado", 
    x = "Cantidad de personas que conforman el hogar",
    y = "edad del encuestado"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y Edad del encuestado con respecto a la variable dicotómica “¿Consume usted queso industrial (CON MARCA)”, se dicta que sí existe relación, ya que mientras más personas conforman el hogar y más edad tenga, las personas tienden a consumir más arroz.

Variable Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`¿En qué cantón de la provincia de Chimborazo vive?`, colour = `¿Consume usted queso industrial (CON MARCA)`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - ¿En qué cantón de la provincia de Chimborazo vive?", 
    x = "Cantidad de personas que conforman el hogar",
    y = "¿En qué cantón de la provincia de Chimborazo vive?"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive? con respecto a la variable dicotómica “¿Consume usted queso industrial (CON MARCA)”, se dicta que sí existe relación, ya que mientras más personas conforman el hogar y más rural sea el cantón, las personas tienden a consumir más queso industrial.

Variable C¿Tiene refrigeradora? y ¿Tiene refrigeradora? Y NSE_2023_CUALI.

library(ggplot2)
ggplot(BASE, aes(`¿Tiene refrigeradora?`,NSE_2023_CUALI, colour = `¿Consume usted queso industrial (CON MARCA)`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "¿Tiene refrigeradora?- NSE_2023_CUALI", 
    x = "¿Tiene refrigeradora?",
    y = "NSE_2023_CUALI"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre ¿Tiene refrigeradora? y NSE_2023_CUALI” con respecto a la variable dicotómica “¿Consume usted queso industrial (CON MARCA)”, se dicta que no existe relación, ya que no depende el nivel socioeconómico del encuestado si tiene o no refrigeradora, por lo que no tiene relación que si consume o no el queso industrial.

Comparación de variables a “¿Consume usted huevos?”

Variable Cantidad de personas que conforman el hogar y NSE_2023_CUALI

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,NSE_2023_CUALI, colour = `¿Consume usted huevos?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - NSE_2023_CUALI", 
    x = "Cantidad de personas que conforman el hogar",
    y = "NSE_2023_CUALI"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y NSE_2023_CUALI con respecto a la variable dicotómica “¿Consume usted huevos?, se dicta que no existe relación, ya que no depende la cantidad de personas con el nivel socioeconómico del encuestado, por lo que no existe relación con el consumo de huevos.

Variable Cantidad de personas que conforman el hogar y Edad del encuestado

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`Edad del encuestado`, colour = `¿Consume usted huevos?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar- edad del encuestado", 
    x = "Cantidad de personas que conforman el hogar",
    y = "edad del encuestado"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y Edad del encuestado con respecto a la variable dicotómica “¿Consume usted huevos?, se dicta que no existe relación, ya que no depende la cantidad de personas con edad del encuestado, por lo que no existe relación con el consumo de huevos.

Variable Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`¿En qué cantón de la provincia de Chimborazo vive?`, colour = `¿Consume usted huevos?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - ¿En qué cantón de la provincia de Chimborazo vive?", 
    x = "Cantidad de personas que conforman el hogar",
    y = "¿En qué cantón de la provincia de Chimborazo vive?"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?, con respecto a la variable dicotómica “¿Consume usted huevos?, se dicta que no existe relación, ya que no depende la cantidad de personas con edad del encuestado, por lo que no existe relación con el consumo de huevos.

Variable Cantidad de personas que conforman el hogar y NSE_2023_CUALI

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`NSE_2023_CUALI`, colour = `¿Consume usted huevos?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar- NSE_2023_CUALI", 
    x = "Cantidad de personas que conforman el hogar",
    y = "NSE_2023_CUALI"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y NSE_2023_CUALI, con respecto a la variable dicotómica “¿Consume usted huevos?, se dicta que sí existe relación, ya que mientras menos personas en la familia, más alto el nivel socioeconómico, por lo que las personas con más nivel socioeconómico se observa que se consumen menos huevos.

Comparación de variables a “¿Consume usted frutas?”

Variable Cantidad de personas que conforman el hogar y NSE_2023_CUALI

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,NSE_2023_CUALI, colour = `¿Consume frutas?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - NSE_2023_CUALI", 
    x = "Cantidad de personas que conforman el hogar",
    y = "NSE_2023_CUALI"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y NSE_2023_CUALI, con respecto a la variable dicotómica “¿Consume frutas?, se dicta que no existe relación, ya que no hay dependencia entre variables, por lo que no se puede concluir que las variables tomadas influyen en el consumo de frutas.

Variable Cantidad de personas que conforman el hogar y Edad del encuestado

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`Edad del encuestado`, colour = `¿Consume frutas?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar- edad del encuestado", 
    x = "Cantidad de personas que conforman el hogar",
    y = "edad del encuestado"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y edad del encuestado, con respecto a la variable dicotómica “¿Consume frutas?, se dicta que no existe relación, ya que no hay dependencia entre variables, por lo que no se puede concluir que las variables tomadas influyen en el consumo de frutas.

Variable Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?

library(ggplot2)
ggplot(BASE, aes(`Cantidad de personas que conforman el hogar`,`¿En qué cantón de la provincia de Chimborazo vive?`, colour = `¿Consume frutas?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "Cantidad de personas que conforman el hogar - ¿En qué cantón de la provincia de Chimborazo vive?", 
    x = "Cantidad de personas que conforman el hogar",
    y = "¿En qué cantón de la provincia de Chimborazo vive?"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre Cantidad de personas que conforman el hogar y ¿En qué cantón de la provincia de Chimborazo vive?, con respecto a la variable dicotómica “¿Consume frutas?, se dicta que no existe relación, ya que no hay dependencia entre variables, por lo que no se puede concluir que las variables tomadas influyen en el consumo de frutas.

Variable ¿Tiene refrigeradora? y ¿Cuál es la ocupación del Representante del hogar?

library(ggplot2)
ggplot(BASE, aes(`¿Tiene refrigeradora?`,`¿Cuál es la ocupación del Representante del hogar?`, colour = `¿Consume frutas?`)) + 
  geom_point(size = 1.5, alpha = 0.7) + 
  labs(
    title = "¿Tiene refrigeradora? y ¿Cuál es la ocupación del Representante del hogar?", 
    x =  "¿Tiene refrigeradora?",
    y = "Cantidad de personas que conforman el hogar"
  ) +
  theme_classic() + 
  theme(
    plot.title = element_text(size = 12, face = "bold"),
    axis.text = element_text(size = 10),
    legend.title = element_text(size=10)
)

Interpretación

La relación entre ¿Tiene refrigeradora? y ¿Cuál es la ocupación del Representante del hogar?, con respecto a la variable dicotómica “¿Consume frutas?, se dicta que no existe relación, ya que no hay dependencia entre variables, por lo que no se puede concluir que las variables tomadas influyen en el consumo de frutas.

#Gráficas de cajas para las variables que posiblemente influyan en la alimentación

Comparación de variables a “¿Consume usted arroz?”

Variable Consume usted arroz y Edad del encuestado

ggplot(BASE, aes(`¿Consume usted arroz?`, `Edad del encuestado`, color = `¿Consume usted arroz?`)) +
  geom_boxplot()

Interpretación

La relación entre la variable dicotómica “¿Consume usted arroz? y edad del encuestado, se dicta que el nivel si el 25% de la población, es decir, el 1er cuartil es de 20 años, su mediana y media es aproximadamente de 22 años.

También el 3er cuartil se acerca a los 33 años, por lo que, el 75% de las personas en estudio se encuentran en la etapa de adultez, por lo que son personas con sufieciente criterio para responder las diferentes preguntas. Aunque con el máximo se verifica que efectivamente se trata de personas ya adultas, dónde la máxima edad de que consumen arroz es de 35 años aproximadamente.

Por último, existen 2 datos atípicos, dónde está cercano a los 60 años, por lo aquellas personas en su edad mayor(60 años o más) consumen arroz.

  • No Mientras, en el nivel no el 25% de la población, es decir, el 1er cuartil es de 28 años, su mediana y media es aproximadamente de 37 años.

También el 3er cuartil se acerca a los 48 años, por lo que, el 75% de las personas en estudio se encuentran en la etapa de adultez. Aunque con el máximo se verifica que efectivamente se trata de personas ya adultas, dónde la máxima edad de que consumen arroz es de 73 años aproximadamente.

Por último, existen 3 datos atípicos, dónde está cercano a los 80 años, por lo aquellas personas en su edad mayor(60 años o más) consumen arroz.

Por lo que, la población mayoritaria son los que no consumen arroz, verficando que mientras más edad, las personas dejan de consumir arroz.

Variable Consume usted arroz y Cantidad de personas que conforman el hogar

ggplot(BASE, aes(`¿Consume usted arroz?`, `Cantidad de personas que conforman el hogar` , color = `¿Consume usted arroz?`)) +
  geom_boxplot()

Interpretación

La relación entre la variable dicotómica “¿Consume usted arroz? y Cantidad de personas que conforman el hogar, se dicta que el nivel el 25% de la población, es decir, el 1er cuartil es de 3 personas, su mediana y media es aproximadamente de 4.

También el 3er cuartil se acerca a 6, por lo que, el 75% de las personas en estudio, consume arroz a pesar de ser grande la familia y su máximo es de 7.

  • No Mientras, en el nivel no el 25% de la población, es decir, el 1er cuartil es aproximadamente de 4, su mediana y media es aproximadamente 4, es decir, igual al nivel sí.

También el 3er cuartil es 5, por lo que, el 75% de las personas en estudio de los que no consumen arroz es menor que los qu eno consumen.

Por último, existen 2 datos atípicos, dónde está cercano a las 10 personas.

#ESCALAMIENTO

#BASE[, clases == "numeric"]= scale(BASE[, clases == "numeric"])
#head(BASE)