Este proyecto tiene como objetivo el lanzamiento de una nueva cerveza, para lo cual utilizaremos las bases de datos de VIII Encuesta de Presupuestos Familiares, 2016-2017. Se realizara un analisis para buscar un nuevo segmento objetivo donde exista una oportunidad de negocio.
#install.packages("data.table")
#install.packages("ggplot2")
library(data.table)
library(ggplot2)
gastos<-fread("Gastos_cervezas.csv")
personas<-fread("BASE_PERSONAS_VIII_EPF.CSV")
No seran consideradas las personas que consuman cerveza en restaurantes y otros.
GP<-merge(x=gastos,y=personas,by="FOLIO", all.x=TRUE)
GP<-GP[!duplicated(FOLIO), ]
ggplot(data = GP, aes(x=SEXO, y=GASTO)) + geom_bar(stat = "identity")
CON ESTE GRAFICO PODEMOS VER QUE LOS HOMBRES GASTAN MAS EN CERVEZA QUE LAS MUJERES MENSUALMENTE POR LO CUAL NUESTRO NUEVO PRODUCTO PUEDE ESTAR DIRGIDO A AUMENTAR LA PARTICIPACION DE MERCADO DE LAS MUJERES O CENTRARNOS DIRECTAMENTE EN EL GUSTO DE LOS HOMBRES
ggplot(data = GP, aes(x=EDAD, y=GASTO)) + geom_bar(stat = "identity")
A PESAR DE QUE LOS DATOS NO PRESNETA UNA GRAN VARIEDAD EN CAUNTO AL GASTO ENTRE SEGMENT SDE EDADES CON ESTE GRAFICO PODEMOS CONCLUIR QUE NUESTRO NUEVO PRODUCTO DEBE SER DIGIRIGIDA A UN PUBLICO MAYOR, YA QUE ELLOS DE UNA FORMA MAS LEVE SON LOS QUE GASTAN MAS EN CERVEZA, UN PUBLICO UBICADO ENTRE LOS 50 A 60 AÑOS DE EDAD.
GPEDU<-GP[GP$EDUNIVEL>0]
ggplot(data = GPEDU, aes(x=EDUNIVEL, y=GASTO)) + geom_bar(stat = "identity")
PODEMOS CONCLUIR QUE LA GENTE QUE MAS GASTA EN CERVEZA SON PROFESIONALES CON AÑOS DE UNIVERSIDAD, TAMBIEN LLAMA LA ATENCION EL NUMERO DE PERSONAS QUE GASTA EN CERVEZA PERO QUE NO TIENE NINGUN NIVEL EDUCACIONAL, PRINCIPALMENTE POR LOS BAJOS RECURSOS QUE ESTAS PERSONAS PUEDEN TENER Y ADEMAS CONSIDERAR EL TIEMPO LIBRE QUE ELLOS PUEDEN DEDICAR A ESTO.
ggplot(data = GP, aes(x=SEXO, y=ING_TOTAL_HOG_HD)) + geom_bar(stat = "identity")
TOMANDO ESTE GRAFICO PODEMOS VER QUE LOS HOMBRES TIENE UN MAYOR INGRESO QUE LAS MUJERES EN SUS HOGARES, LO CUAL PUEDE AYUDAR A EXPLICAR QUE SU CONSUMO SEA MAS ALTO QUE EL DE LAS MUJERES.
GP2<-GP[,.(GASTO,EDAD,ING_TOTAL_HOG_HD)]
GP2<-GP2[GP2$ING_TOTAL_HOG_HD>0]
GP2<-GP2[!(is.na(GP2$EDAD)) & !(is.na(GP2$ING_TOTAL_HOG_HD)) & !(is.na(GP2$GASTO)), ]
library("ggplot2")
library("factoextra")
#install.packages("factoextra")
#GP2<-na.omit(GP2)
#k1<-kmeans(GP2,centers=3)
#fviz_cluster(k1,data=GP2,geom = "point")
#install.packages("rpart")
#install.packages("rpart.plot")
library(rpart)
library(rpart.plot)
#GPC <- rpart(GASTO~., data = GP2,method="class")
TOMANDO EN CUENTA LOS GRAFICOS REALIZADOS PODEMOS CONCLUIR QUE NUESTRO NUEVO PRODUCTO PUEDE ESTAR ENFOCADO EN LA BUSQUEDA DE UNA MAYOR PARTICIPACION DE MERCADO, POR LO QUE ESTARA DIRIGIDO A MUJERES ENTRE LOS 40 Y 60 AÑOS DE EDAD, QUE HAYAN REALIZADO UNA CARRERA PROFESIONAL, A PESAR DE QUE LAS MUJERES TENGAN UN MENOR INGRESO HOGAR QUE LOS HOMBRES QUEREMOS APUNTAR A ELLAS CON UN PRODUCTO UN POCO MAS BARATO Y CON EL CUAL ELLAS SE PUEDAN SENTIR IDENTIFICADAS, UTILIZANDO MEDIOS DE MARKETING QUE APUNTEN A ELLAS Y SIENTAN QUE EL PRODUCTO ESTA HECHO PARA SU PRINCIPAL CONSUMO