title: “Tarea 3” author: “Valentina Keyer, Trinidad Castro, Andrea Fernandez” date: “29/4/2021” output: html_document —
rm(list=ls())
install.packages("ggplot2")
install.packages("plotly")
install.packages("RColorBrewer")
install.packages("janitor")
install.packages("tidyverse")
install.packages("contrib.url Execution halted")
library(data.table)
library(ggplot2)
library(janitor)
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
library(RColorBrewer)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.1 ──
## ✓ tibble 3.1.0 ✓ dplyr 1.0.5
## ✓ tidyr 1.1.3 ✓ stringr 1.4.0
## ✓ readr 1.4.0 ✓ forcats 0.5.1
## ✓ purrr 0.3.4
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## x dplyr::between() masks data.table::between()
## x dplyr::filter() masks plotly::filter(), stats::filter()
## x dplyr::first() masks data.table::first()
## x dplyr::lag() masks stats::lag()
## x dplyr::last() masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
Hogares<- fread('Base_Hogares.csv',encoding = 'Latin-1')
Hogares_ingreso_menor<- Hogares [IngresoHogar<2000000]
ggplot(data= Hogares_ingreso_menor,aes(x=IngresoHogar))+geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
ingprom<- Hogares[,mean(IngresoHogar), by='Macrozona']
ggplot(data=ingprom,aes(x=Macrozona, y=V1))+ geom_point()
ggplot(data=ingprom,aes(x=Macrozona, y=V1,text=paste('Macrozona:',Macrozona)))+ geom_point()+ labs(x='Ingreso promedio',y='Macrozona',title='Ingreso promedio de los hogares', subtitle='Por Macrozona', caption= 'Fuente: Encuesta origen y destino')
Hamburguesas<- fread('restaurantes.csv',encoding = 'Latin-1')
ggplot(data = Hamburguesas, aes(x=reviews,y=rating, color=COMUNA))+geom_point()
Hamburguesas[,identificador:=reviews*rating/1000]
tabla<- Hamburguesas[,mean(identificador,na.rm=T),by='MacrozonaOrigen1']
Hamburguesas2<-merge(x=Hamburguesas, y=tabla, by='MacrozonaOrigen1')
ggplot(data = Hamburguesas2, aes(x=MacrozonaOrigen1, y=Indicador, color=MacrozonaOrigen1))+ geom_bar(stat ='identity')
names(Hamburguesas2)[11]<-'Indicador'
Dado el primer análisis exploratorio, es más conveniente abrir el nuevo local en Marga Marga o en Playa Ancha puesto que, mientras menor sea el indicador menor debiese ser la competencia ya que, o es menor la competencia por sus bajos raitings o porque hay muy pocos reviews o ambos. A este análisis le agregaría los precios y la cantidad de restaurantes por zona puesto que, con estos datos podemos analizar otors factores que afectan la competencia y de esta manera el estudio de mercado sería más completo y haría que la decisión de donde abrir un nuevo local sea mucho más informada.