Asignatura:
Estadística Aplicada a la Computación
Integrantes:
Yennifer Alyshender Ñañajuari Villalta
Asesor:
Victor Manuel Guevara Ponce
Periodo académico
Cuarto Periodo Académico
ICA – PERÚ
2024
# Asignacion de directorio
setwd("D:/Estadística Aplicada a la Computación/RStudio")
getwd()
## [1] "D:/Estadística Aplicada a la Computación/RStudio"
# Cargar el conjunto de datos CSV
StarbucksDatos<- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/starbucks_1.csv",
encoding = "latin1", sep = ";", stringsAsFactors = T)
# Mostrar datos
head(StarbucksDatos)
## Cantidad Ingresos
## 1 5 20
## 2 25 35
## 3 10 30
## 4 5 30
## 5 15 25
## 6 50 60
Pasos para construir un modelo de regresión
Determinar las variables X, Y
Variable independiente (X): Cantidad
Variable dependiente (Y): Ingresos
# Gráfico con plot
plot(x=StarbucksDatos$Cantidad, y=StarbucksDatos$Ingresos)
# Gráfico con pairs
pairs(StarbucksDatos)
Interpretación: Según los resultados se observa que hay correlación directa o positiva entre la cantidad y los ingresos.
# Mediante la función cor
cor(StarbucksDatos) # Matriz de correlaciones
## Cantidad Ingresos
## Cantidad 1.0000000 0.8500323
## Ingresos 0.8500323 1.0000000
Coeficiente de correlación:
r = 0.8500323
Interpretación: Existe correlación positiva muy alta entre la cantidad y los ingresos.
Modelo general
\(\hat{Y} = b_o + b_1X\)
Modelo para el caso:
\(\hat{Ingresos} = b_0 + b_1 Cantidad\)
# lm, notacion: Y ~ X, data=
modelo <- lm(Ingresos ~ Cantidad, data=StarbucksDatos)
# Resumen de resultados
summary(modelo)
##
## Call:
## lm(formula = Ingresos ~ Cantidad, data = StarbucksDatos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.964 -4.154 -1.352 2.247 18.045
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 27.9465 1.8452 15.146 1.87e-13 ***
## Cantidad 0.2802 0.0362 7.739 7.53e-08 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared: 0.7226, Adjusted R-squared: 0.7105
## F-statistic: 59.9 on 1 and 23 DF, p-value: 7.534e-08
Modelo final con los resultados:
Modelo general
$ = 27.9465 + 0.2802 x $
Modelo para el caso:
\(\hat{Ingresos} = 27.9465 + 0.2802 Cantidad\)