Esta Tab combina la frecuencia de compra de las personas en los supermercados de cualquier tipo en Guatemala, los clasifica como “Diariamente”, “Semanalmente”, “Quincenalmente”, “Mensualmente”, y “Otros”.
library(haven)
library(dplyr)
library(ggplot2)
library(corrplot)
library(tidyverse)
Alimentos <- read_sav("~/Data Science/Proyecto 2/Alimentos_supermercados.sav")
Alimentos <- select(Alimentos, DEPTO, AREA, POBREZA, P12A12)
names(Alimentos) <- c("Departamento", "Area", "Pobreza", "Frecuencia.de.consumo")
Alimentos <-Alimentos[complete.cases(Alimentos),]
Alimentos$Departamento <- as.factor(Alimentos$Departamento)
Alimentos$Area <- as.factor(Alimentos$Area)
Alimentos$Pobreza <- as.factor(Alimentos$Pobreza)
levels(Alimentos$Departamento)<- c("Guatemala", "El Progreso", "Sacatepequez", "Chimaltenango", "Escuintla", "Santa Rosa", "Solola", "Totonicapan", "Quetzaltenango", "Suchitepequez", "Retalhuleu", "San Marcos", "Huehuetenango", "Quiche", "Baja Verapaz", "Alta Verapaz", "Peten", "Izabal", "Zacapa", "Chiquimula", "Jalapa", "Jutiapa")
levels(Alimentos$Area)<- c("Urbana", "Rural")
levels(Alimentos$Pobreza) <- c ("Pobre extremo", "Pobre no extremo", "No pobre")
Alimentos$Frecuencia.de.consumo <- as.character(Alimentos$Frecuencia.de.consumo)
Alimentos$Frecuencia.de.consumo[Alimentos$Frecuencia.de.consumo == 1] <- "Diariamente"
Alimentos$Frecuencia.de.consumo[Alimentos$Frecuencia.de.consumo == 2] <- "Semanalmente"
Alimentos$Frecuencia.de.consumo[Alimentos$Frecuencia.de.consumo == 3] <- "Quincenalmente"
Alimentos$Frecuencia.de.consumo[Alimentos$Frecuencia.de.consumo == 4] <- "Mensual"
Alimentos$Frecuencia.de.consumo[Alimentos$Frecuencia.de.consumo == 98] <- "Otros"
Diariamente <- Alimentos %>%
group_by(Departamento, Frecuencia.de.consumo) %>%
summarise(cantidad= n()) %>%
mutate(Diariamente = cantidad/sum(cantidad)*100) %>%
filter(Frecuencia.de.consumo == "Diariamente") %>%
summarise(Diariamente)
Semanalmente <- Alimentos %>%
group_by(Departamento, Frecuencia.de.consumo) %>%
summarise(cantidad= n()) %>%
mutate(Semanalmente = cantidad/sum(cantidad)*100) %>%
filter(Frecuencia.de.consumo == "Semanalmente") %>%
summarise(Semanalmente)
Quincenalmente <- Alimentos %>%
group_by(Departamento, Frecuencia.de.consumo) %>%
summarise(cantidad= n()) %>%
mutate(Quincenalmente = cantidad/sum(cantidad)*100) %>%
filter(Frecuencia.de.consumo == "Quincenalmente") %>%
summarise(Quincenalmente)
Mensualmente <- Alimentos %>%
group_by(Departamento, Frecuencia.de.consumo) %>%
summarise(cantidad= n()) %>%
mutate(Mensualmente = cantidad/sum(cantidad)*100) %>%
filter(Frecuencia.de.consumo == "Mensualmente") %>%
summarise(Mensualmente)
Otros <- Alimentos %>%
group_by(Departamento, Frecuencia.de.consumo) %>%
summarise(cantidad= n()) %>%
mutate(Otros = cantidad/sum(cantidad)*100) %>%
filter(Frecuencia.de.consumo == "Otros") %>%
summarise(Otros)
Alimentos <- Reduce(function(x, y) merge(x, y, all=TRUE), list(Diariamente, Semanalmente, Quincenalmente, Mensualmente, Otros))
Alimentos[is.na(Alimentos)] <- 0
Alimentos
Esta parte me sirvio para ver la tabla y la estructura de todo para poder generar graficas y poder analizar todo lo que deseo ver
summary(Alimentos)
Departamento Diariamente Semanalmente Quincenalmente Mensualmente Otros
Guatemala : 1 Min. : 0.000 Min. : 0.00 Min. : 0.00 Min. :0 Min. :0
El Progreso : 1 1st Qu.: 0.000 1st Qu.:16.67 1st Qu.:20.00 1st Qu.:0 1st Qu.:0
Sacatepequez : 1 Median : 0.000 Median :20.00 Median :30.77 Median :0 Median :0
Chimaltenango: 1 Mean : 5.046 Mean :25.17 Mean :35.35 Mean :0 Mean :0
Escuintla : 1 3rd Qu.: 7.692 3rd Qu.:34.67 3rd Qu.:50.00 3rd Qu.:0 3rd Qu.:0
Santa Rosa : 1 Max. :25.000 Max. :50.00 Max. :75.00 Max. :0 Max. :0
(Other) :11
str(Alimentos)
'data.frame': 17 obs. of 6 variables:
$ Departamento : Factor w/ 22 levels "Guatemala","El Progreso",..: 1 2 3 4 5 6 8 9 10 11 ...
$ Diariamente : num 4 0 0 6.67 9.09 ...
$ Semanalmente : num 34.7 33.3 20 46.7 18.2 ...
$ Quincenalmente: num 42.7 33.3 20 20 45.5 ...
$ Mensualmente : num 0 0 0 0 0 0 0 0 0 0 ...
$ Otros : num 0 0 0 0 0 0 0 0 0 0 ...
str(Alimentos)
ggplot(Alimentos, aes(Departamento, Diariamente/100)) +
geom_point() +
labs(title = "La Frecuencia de consumo dia a dia") +
theme(axis.text.x = element_text(angle = 90))
ggplot(Alimentos, aes(Departamento, Semanalmente/100)) +
geom_point() +
labs(title = "La Frecuencia de consumo cada semana") +
theme(axis.text.x = element_text(angle = 90))
ggplot(Alimentos, aes(Departamento, Quincenalmente/100)) +
geom_point() +
labs(title = "La Frecuencia de consumo cada 3 semanas") +
theme(axis.text.x = element_text(angle = 90))
Después de observar cada una de las graficas anteriormente se puede denotar que muchas de las personas tienen una tendencia mayor a comprar todos los viveres que se den a basto para una semana, ya que realizan sus compras cada 3 semana. Esto se puede dar por muchas reazones como por ejemplo: toman en cuanta la frescura de los alimentos, se realiza un presupuesto semanal, etc.
Las personas no realizan las compras diariamente por la motivos como falta de tiempo, distancia de la casa al supermercado o el ahorro de gasolina, por ende selecciona una cantidad de productos necesaria para cierto tiempo.
Las personas encuestadas de Guatemala no tienden a comprar productos a más de tres semanas o más tiempo porque no se tiene registro de esas respuestas. Alguna de las razones por las cuales los guatemaltecos tienen este comportamiento puede ser por la precaución de la fecha de caducidad de los productos.