
1. Contexto:
Desde hace ya más de un siglo, la reconocida pizza ha marcado un antes y un después en el mundo gastronómico. Es una de las comidas más utilizadas a lo largo del mundo; ya sea para la comercialización de cadenas de comidas, como lo es Papa Johns, o para la eleboración de restaunrantes premium. Esta masa llena de ingredientes, fue originada en Nápoles, Italia, donde se conoció el término de pizza moderna como la que todos conocemos hoy en día.
Un negocio de pizza puede llegar a ser una opción muy rentable si se tienen encuenta los factores geográficos y económicos en donde se establezca este. Especialmente en un país como Estados Unidos, donde tienen la costumbre de consumir comida rápida con frecuencia. Es por esto que para poder responder con profundidad nuestra pregunta de investigación, nos enfocarémos en dichos factores y así lograremos obtener un análisis más profundo de cuáles items son relavantes al momento de fijar un precio máximo en un restaurant de pizza.
2. Elección de la pregunta:
En la pregunta que nos enfocaremos para anlizar y responder a lo largo del proyecto será: ¿existe una relación entre la locación/categoría del plato del restaurante con el precio máximo y calidad del producto?
3. Elección de la fuente de datos:
Para poder realizar nuestro estudio, utilizaremos una base de datos encontrados en la página web Kaggle, donde nos muestra todas los cuidades de Estados Unidos, junto a su respectiva información del consumo de pizza, actualizado hace 1 mes atrás.
- Datafiniti_Pizza_Restaurants_and_the_Pizza_They_Sell_May19
4. Estadística descriptiva de las variables de interés:
Gráfico de caja y bigotes de Monto máximo menú según Categorías Primarias

Acá se puede analizar que para accommodation y food services se visualiza mayores valores en comparación al resto de los grupos. En términos medios se destacada wholsesale trade, accommodation y food services por sobre el resto de los grupos.
Gráfico de caja y bigotes de Monto máximo menú según Provincia

En este gráfico se desprende que para CA, FL y NY se encuentran los máximos precios. En términos medios AK, MT y NJ se posicionan con precios medios sobre el resto de los grupos.
Gráfico de dipersión entre Monto máximo menú ~ Rango máximo menú

De este gráfico se desprende que existe una baja relación entre el precio máximo y el rango máximo del menú, pero que es positiva.
Gráfico de dipersión entre Monto máximo menú ~ Rango mínimo menú

De este gráfico se desprende que existe una baja relación entre el precio máximo y el rango ínimo del menú, pero que es positiva.
library(sf)
library(ggplot2)
5. Estrategia de resolución:

Lamentablemente no se ha podido crear un árbol de descisión debido a que no existen variables en la data que significativamente expliquen el precio máximo de la pizza, por lo que se procede a validar mediante una regresión multiple.
Tabla de regresión lineal mútiple
##
## Call:
## lm(formula = menus.amountMax ~ ., data = datos2)
##
## Residuals:
## Min 1Q Median 3Q Max
## -13.458 -4.968 -0.208 4.492 46.732
##
## Coefficients:
## Estimate
## (Intercept) 18.80191
## primaryCategoriesAccommodation & Food Services,Management of Companies & Enterprises 1.04894
## primaryCategoriesEducational Services,Accommodation & Food Services 1.04229
## primaryCategoriesManagement of Companies & Enterprises -1.82672
## primaryCategoriesRetail 1.68122
## primaryCategoriesRetail,Accommodation & Food Services -1.18544
## primaryCategoriesWholesale Trade,Accommodation & Food Services 5.43229
## primaryCategoriesWholesale Trade,Accommodation & Food Services,Manufacturing -4.45771
## priceRangeMin 0.12025
## priceRangeMax -0.21377
## Std. Error
## (Intercept) 1.99776
## primaryCategoriesAccommodation & Food Services,Management of Companies & Enterprises 1.40680
## primaryCategoriesEducational Services,Accommodation & Food Services 4.75784
## primaryCategoriesManagement of Companies & Enterprises 1.02834
## primaryCategoriesRetail 2.24362
## primaryCategoriesRetail,Accommodation & Food Services 2.04640
## primaryCategoriesWholesale Trade,Accommodation & Food Services 4.75784
## primaryCategoriesWholesale Trade,Accommodation & Food Services,Manufacturing 6.72818
## priceRangeMin 0.04901
## priceRangeMax 0.08003
## t value
## (Intercept) 9.411
## primaryCategoriesAccommodation & Food Services,Management of Companies & Enterprises 0.746
## primaryCategoriesEducational Services,Accommodation & Food Services 0.219
## primaryCategoriesManagement of Companies & Enterprises -1.776
## primaryCategoriesRetail 0.749
## primaryCategoriesRetail,Accommodation & Food Services -0.579
## primaryCategoriesWholesale Trade,Accommodation & Food Services 1.142
## primaryCategoriesWholesale Trade,Accommodation & Food Services,Manufacturing -0.663
## priceRangeMin 2.454
## priceRangeMax -2.671
## Pr(>|t|)
## (Intercept) < 2e-16
## primaryCategoriesAccommodation & Food Services,Management of Companies & Enterprises 0.45591
## primaryCategoriesEducational Services,Accommodation & Food Services 0.82660
## primaryCategoriesManagement of Companies & Enterprises 0.07570
## primaryCategoriesRetail 0.45367
## primaryCategoriesRetail,Accommodation & Food Services 0.56241
## primaryCategoriesWholesale Trade,Accommodation & Food Services 0.25358
## primaryCategoriesWholesale Trade,Accommodation & Food Services,Manufacturing 0.50764
## priceRangeMin 0.01416
## priceRangeMax 0.00757
##
## (Intercept) ***
## primaryCategoriesAccommodation & Food Services,Management of Companies & Enterprises
## primaryCategoriesEducational Services,Accommodation & Food Services
## primaryCategoriesManagement of Companies & Enterprises .
## primaryCategoriesRetail
## primaryCategoriesRetail,Accommodation & Food Services
## primaryCategoriesWholesale Trade,Accommodation & Food Services
## primaryCategoriesWholesale Trade,Accommodation & Food Services,Manufacturing
## priceRangeMin *
## priceRangeMax **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.728 on 9954 degrees of freedom
## Multiple R-squared: 0.001515, Adjusted R-squared: 0.0006125
## F-statistic: 1.678 on 9 and 9954 DF, p-value: 0.08823
De esta tabla se desprende que las variables explicativas explican menos del 1% de la variabilidad del precio máximo del menú, por lo que se comprueba lo entregado por el árbol de decisión, y que efectivamente no hay diferencias significativas.
6. Conclusión:
Luego de haber analizado los gráficos pensentados anteriormente al parecer existe alguna relación entre el precio que se les otorga a las pizzas en el restaurante según el estado, o según la categoría de servicio, pero al ser tan mínima la relación, no podríamos concluir una correlación clara. El árbol de decisión fue la representación más clara de que no existe un factor que defina como tal el monto máximo que cobraría un restaurant. No por el hecho de estar dentro de uno de los estados con mayores ingresos en Estados Unidos, se van a encontrar ahí los restaurantes más caros, sino que podemos concluir que estos existen en varias locaciones y categorías de servicio sin relación directa con la calidad y servicio del Estado.