Asignatura:

Estadística Aplicada a la Computación

Integrantes:

Yennifer Alyshender Ñañajuari Villalta

Asesor:

Victor Manuel Guevara Ponce

Periodo académico

Cuarto Periodo Académico

ICA – PERÚ

2024

Práctica calificada

# Asignacion de directorio

setwd("D:/Estadística Aplicada a la Computación/RStudio")
getwd()
## [1] "D:/Estadística Aplicada a la Computación/RStudio"
# Cargar el conjunto de datos CSV

StarbucksDatos<- read.csv("https://raw.githubusercontent.com/VictorGuevaraP/Estadistica-R/master/starbucks_1.csv",
                          encoding = "latin1", sep = ";", stringsAsFactors = T)
# Mostrar datos

head(StarbucksDatos)
##   Cantidad Ingresos
## 1        5       20
## 2       25       35
## 3       10       30
## 4        5       30
## 5       15       25
## 6       50       60

Pasos para construir un modelo de regresión

Paso 1

Determinar las variables X, Y

  • Variable independiente (X): Cantidad

  • Variable dependiente (Y): Ingresos

Paso 2

Diagrama de dispersíon o puntos

# Gráfico con plot
plot(x=StarbucksDatos$Cantidad, y=StarbucksDatos$Ingresos)

# Gráfico con pairs
pairs(StarbucksDatos)

Interpretación: Según los resultados se observa que hay correlación directa o positiva entre la cantidad y los ingresos.

Covarianza de correlacion

# Mediante la función cor
cor(StarbucksDatos) # Matriz de correlaciones
##           Cantidad  Ingresos
## Cantidad 1.0000000 0.8500323
## Ingresos 0.8500323 1.0000000

Coeficiente de correlación:

r = 0.8500323

Interpretación: Existe correlación positiva muy alta entre la cantidad y los ingresos.

Paso 3

Regesión lineal simple

Modelo general

\(\hat{Y} = b_o + b_1X\)

Modelo para el caso:

\(\hat{Ingresos} = b_0 + b_1 Cantidad\)

# lm, notacion: Y ~ X, data=
modelo <- lm(Ingresos ~ Cantidad, data=StarbucksDatos)

# Resumen de resultados
summary(modelo)
## 
## Call:
## lm(formula = Ingresos ~ Cantidad, data = StarbucksDatos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -10.964  -4.154  -1.352   2.247  18.045 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  27.9465     1.8452  15.146 1.87e-13 ***
## Cantidad      0.2802     0.0362   7.739 7.53e-08 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.239 on 23 degrees of freedom
## Multiple R-squared:  0.7226, Adjusted R-squared:  0.7105 
## F-statistic:  59.9 on 1 and 23 DF,  p-value: 7.534e-08

Modelo final con los resultados:

Modelo general

$ = 27.9465 + 0.2802 x $

Modelo para el caso:

\(\hat{Ingresos} = 27.9465 + 0.2802 Cantidad\)