Introducción

El geiser es un tipo de fuente termal que emite una columna de agua caliente y de vapor subterraneo, este fenómeno requiere de una hidrogeología favorable que existe solo en algunas partes del planeta, por lo que son un fenómeno bastante anormal y no son muy comunes en el mundo. Los geiser son zonas donde se ha producido actividad volcánica en el pasado y donde coincide la presencia de rocas sometidas a altas temperaturas por el magma del interior de la Tierra, agua subterránea y una red de conductos con una salida a la superficie. Existen cerca de 1000 alrededor del planeta, de los cuales casi la mitad están ubicados en el parque nacional de Yellowstone ubicado en Estados Unidos.

El géiser Old Faithful es la atracción más visitada del parque nacional Yellowstone y los guardabosques ayudan a los turistas apredecir este fenómeno. Esta predicción se ejecuta cuando el geiser hace erupción, un gran chorro de agua caliente y vapor emerge de la tierra creando una espectacular fuente natural que alcanza varios metros de altura durante varios minutos. En el parque se realiza un registro de las siguientes mediciones: duración de la erupción en segundos, el intervalo de tiempo entre cada erupción en minutos y la altura en pies.

De acuerdo a la información anterior, en la base de datos geiser define las variables duración de las erupciones y waiting como el tiempo de espera entre erupciones, siendo eruptions (variable predictora) y waiting (variable Respuesta).

datos1<-as.data.frame(datos1)

colnames(datos1)<-c("eruptions", "waiting")
datos1

1) Análisis exploratorio de la base géiser Old Faithful

# Dimension de la Base de datos

dim(datos1)
## [1] 272   2
# La base de datos tiene 272 observaciones y 2 variables.

describe(datos1)
## datos1 
## 
##  2  Variables      272  Observations
## --------------------------------------------------------------------------------
## eruptions 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##      272        0      126        1    3.488    1.266    1.800    1.852 
##      .25      .50      .75      .90      .95 
##    2.163    4.000    4.454    4.700    4.817 
## 
## lowest : 1.600 1.667 1.700 1.733 1.750, highest: 4.933 5.000 5.033 5.067 5.100
## --------------------------------------------------------------------------------
## waiting 
##        n  missing distinct     Info     Mean      Gmd      .05      .10 
##      272        0       51    0.999     70.9    15.37       48       51 
##      .25      .50      .75      .90      .95 
##       58       76       82       86       89 
## 
## lowest : 43 45 46 47 48, highest: 91 92 93 94 96
## --------------------------------------------------------------------------------
# Las dos variables analizadas son cuantitativas

str(datos1)
## 'data.frame':    272 obs. of  2 variables:
##  $ eruptions: num  3.6 1.8 3.33 2.28 4.53 ...
##  $ waiting  : num  79 54 74 62 85 55 88 85 51 85 ...
# El comando Crosstable nos permite observar el número de repeticiones para los diferentes valores que toma la variable eruptions.

CrossTable(datos1$eruptions)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## |         N / Table Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  272 
## 
##  
##           |       1.6 |     1.667 |       1.7 |     1.733 |      1.75 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         1 |         1 |         1 |         6 | 
##           |     0.004 |     0.004 |     0.004 |     0.004 |     0.022 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     1.783 |       1.8 |     1.817 |     1.833 |      1.85 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         4 |         3 |         7 |         2 | 
##           |     0.007 |     0.015 |     0.011 |     0.026 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     1.867 |     1.883 |     1.917 |     1.933 |      1.95 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         8 |         4 |         2 |         2 |         1 | 
##           |     0.029 |     0.015 |     0.007 |     0.007 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     1.967 |     1.983 |         2 |     2.017 |     2.033 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         3 |         3 |         4 |         3 |         2 | 
##           |     0.011 |     0.011 |     0.015 |     0.011 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     2.067 |     2.083 |       2.1 |     2.133 |      2.15 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         2 |         3 |         1 |         1 | 
##           |     0.004 |     0.007 |     0.011 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     2.167 |     2.183 |       2.2 |     2.217 |     2.233 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         3 |         1 |         2 | 
##           |     0.007 |     0.004 |     0.011 |     0.004 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |      2.25 |     2.267 |     2.283 |       2.3 |     2.317 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         1 |         1 |         1 | 
##           |     0.007 |     0.004 |     0.004 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     2.333 |      2.35 |     2.367 |     2.383 |       2.4 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         1 |         1 |         1 |         2 | 
##           |     0.004 |     0.004 |     0.004 |     0.004 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     2.417 |     2.483 |     2.617 |     2.633 |       2.8 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         1 |         1 |         1 | 
##           |     0.007 |     0.004 |     0.004 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     2.883 |       2.9 |     3.067 |     3.317 |     3.333 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         1 |         1 |         1 |         2 | 
##           |     0.004 |     0.004 |     0.004 |     0.004 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     3.367 |     3.417 |      3.45 |       3.5 |     3.567 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         1 |         1 |         2 |         2 | 
##           |     0.004 |     0.004 |     0.004 |     0.007 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       3.6 |     3.683 |     3.717 |     3.733 |      3.75 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         4 |         1 |         1 |         1 |         1 | 
##           |     0.015 |     0.004 |     0.004 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     3.767 |     3.817 |     3.833 |      3.85 |     3.883 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         5 |         2 |         1 | 
##           |     0.007 |     0.004 |     0.018 |     0.007 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     3.917 |      3.95 |     3.966 |     3.967 |         4 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         3 |         2 |         1 |         1 |         6 | 
##           |     0.011 |     0.007 |     0.004 |     0.004 |     0.022 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.033 |      4.05 |     4.067 |     4.083 |       4.1 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         2 |         5 |         2 | 
##           |     0.007 |     0.004 |     0.007 |     0.018 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.117 |     4.133 |      4.15 |     4.167 |     4.183 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         2 |         4 |         4 |         1 | 
##           |     0.007 |     0.007 |     0.015 |     0.015 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       4.2 |     4.233 |      4.25 |     4.267 |     4.283 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         3 |         4 |         2 |         2 | 
##           |     0.004 |     0.011 |     0.015 |     0.007 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       4.3 |     4.317 |     4.333 |      4.35 |     4.366 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         1 |         5 |         4 |         1 | 
##           |     0.007 |     0.004 |     0.018 |     0.015 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.367 |     4.383 |       4.4 |     4.417 |     4.433 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         3 |         1 |         1 |         4 |         2 | 
##           |     0.011 |     0.004 |     0.004 |     0.015 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |      4.45 |     4.467 |     4.483 |       4.5 |     4.517 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         3 |         2 |         1 |         8 |         1 | 
##           |     0.011 |     0.007 |     0.004 |     0.029 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.533 |      4.55 |     4.567 |     4.583 |       4.6 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         5 |         1 |         3 |         4 |         4 | 
##           |     0.018 |     0.004 |     0.011 |     0.015 |     0.015 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.617 |     4.633 |      4.65 |     4.667 |       4.7 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         3 |         1 |         2 |         6 | 
##           |     0.004 |     0.011 |     0.004 |     0.007 |     0.022 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |     4.716 |     4.733 |      4.75 |     4.767 |     4.783 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         1 |         1 |         1 |         1 | 
##           |     0.004 |     0.004 |     0.004 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       4.8 |     4.817 |     4.833 |      4.85 |     4.883 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         6 |         2 |         2 |         1 |         1 | 
##           |     0.022 |     0.007 |     0.007 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       4.9 |     4.933 |         5 |     5.033 |     5.067 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         2 |         3 |         1 |         1 |         1 | 
##           |     0.007 |     0.011 |     0.004 |     0.004 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |       5.1 | 
##           |-----------|
##           |         1 | 
##           |     0.004 | 
##           |-----------|
## 
## 
## 
## 
#El comando Crosstable nos permite observar el número de repeticiones para los diferentes valores que toma la variable waiting.

CrossTable(datos1$waiting)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## |         N / Table Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  272 
## 
##  
##           |        43 |        45 |        46 |        47 |        48 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         1 |         3 |         5 |         4 |         3 | 
##           |     0.004 |     0.011 |     0.018 |     0.015 |     0.011 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        49 |        50 |        51 |        52 |        53 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         5 |         5 |         6 |         5 |         7 | 
##           |     0.018 |     0.018 |     0.022 |     0.018 |     0.026 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        54 |        55 |        56 |        57 |        58 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         9 |         6 |         4 |         3 |         4 | 
##           |     0.033 |     0.022 |     0.015 |     0.011 |     0.015 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        59 |        60 |        62 |        63 |        64 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         7 |         6 |         4 |         3 |         4 | 
##           |     0.026 |     0.022 |     0.015 |     0.011 |     0.015 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        65 |        66 |        67 |        68 |        69 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         3 |         2 |         1 |         1 |         2 | 
##           |     0.011 |     0.007 |     0.004 |     0.004 |     0.007 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        70 |        71 |        72 |        73 |        74 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         4 |         5 |         1 |         7 |         6 | 
##           |     0.015 |     0.018 |     0.004 |     0.026 |     0.022 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        75 |        76 |        77 |        78 |        79 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         8 |         9 |        12 |        15 |        10 | 
##           |     0.029 |     0.033 |     0.044 |     0.055 |     0.037 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        80 |        81 |        82 |        83 |        84 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         8 |        13 |        12 |        14 |        10 | 
##           |     0.029 |     0.048 |     0.044 |     0.051 |     0.037 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        85 |        86 |        87 |        88 |        89 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         6 |         6 |         2 |         6 |         3 | 
##           |     0.022 |     0.022 |     0.007 |     0.022 |     0.011 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        90 |        91 |        92 |        93 |        94 | 
##           |-----------|-----------|-----------|-----------|-----------|
##           |         6 |         1 |         1 |         2 |         1 | 
##           |     0.022 |     0.004 |     0.004 |     0.007 |     0.004 | 
##           |-----------|-----------|-----------|-----------|-----------|
## 
## 
##           |        96 | 
##           |-----------|
##           |         1 | 
##           |     0.004 | 
##           |-----------|
## 
## 
## 
## 

Medidas de tendencia central de la variable eruptions

# Media
meanerup<- mean(datos1$eruptions, na.rm = T)

meanerup
## [1] 3.487783
cat("La media de la variable erupción es:  ",meanerup," ")
## La media de la variable erupción es:   3.487783
# Mediana 
medianerup<- median(datos1$eruptions, na.rm = T)

medianerup
## [1] 4
cat("La mediana de la variable erupción es:  ",medianerup," ")
## La mediana de la variable erupción es:   4

Medidas de dispersión de la variable eruptions

# Varianza 

varerup<-var(datos1$eruptions, na.rm = T)

cat("La varianza de la variable erupción es:  ",varerup," ")
## La varianza de la variable erupción es:   1.302728
# Desviación estandar

sderup<-sd(datos1$eruptions, na.rm = T)
sderup
## [1] 1.141371
 cat("La desviación estandar de la variable erupción es:  ",sderup," ")
## La desviación estandar de la variable erupción es:   1.141371
# Quantiles 
quantilerup<-quantile(datos1$eruptions,na.rm = T)
quantilerup
##      0%     25%     50%     75%    100% 
## 1.60000 2.16275 4.00000 4.45425 5.10000
cat("Los cuantiles de la variable  erupción:  ",quantilerup," ")
## Los cuantiles de la variable  erupción:   1.6 2.16275 4 4.45425 5.1
# Rango intercuartilico 

IQRerup<-IQR(datos1$eruptions,na.rm = T)
IQRerup
## [1] 2.2915
cat("El rango intercuartilico de la variable  erupción:  ",IQRerup," ")
## El rango intercuartilico de la variable  erupción:   2.2915
summary(datos1$eruptions)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.600   2.163   4.000   3.488   4.454   5.100
hist(datos1$eruptions, main = "Duración de las erupciones (seg)", xlab = "eruptions", ylab = "Frecuencia", 
     col = "green",
     border = "red",
     xlim = c(0, 7),
     ylim = c(0, 85),labels = T)

boxplot(datos1$eruptions, horizontal = T, col = "gray", range = 1.5, 
main = " Gráfico Boxplot de la variable eruptions"  )

El gráfico permite identificar que en la variable eruptions no se evidencian datos atípicos que puedan representar grandes cambios en la estimación de los parámetros de localización.

Medidas de tendencia central de la variable waiting

# Media

meanwait<- mean(datos1$waiting, na.rm = T)

meanwait
## [1] 70.89706
cat("La media de la variable waiting es:  ",meanwait," ")
## La media de la variable waiting es:   70.89706
# Mediana 

medianwait<- median(datos1$waiting, na.rm = T)

medianwait
## [1] 76
cat("La mediana de la variable waiting es:  ",medianwait," ")
## La mediana de la variable waiting es:   76

Medidas de dispersión de la variable waiting

# Varianza 

varwait<-var(datos1$waiting, na.rm = T)

cat("La varianza de la variable waiting es:  ",varwait," ")
## La varianza de la variable waiting es:   184.8233
# Desviación estandar

sdwait<-sd(datos1$waiting, na.rm = T)

sdwait
## [1] 13.59497
cat("La desviación estandar de la variable waiting es:  ",sdwait," ")
## La desviación estandar de la variable waiting es:   13.59497
# Quantiles

quantilewait<-quantile(datos1$waiting,na.rm = T)

quantilewait
##   0%  25%  50%  75% 100% 
##   43   58   76   82   96
cat("Los cuantiles de la variable waiting:  ",quantilewait," ")
## Los cuantiles de la variable waiting:   43 58 76 82 96
# Rango intercuartilico 

IQRwait<-IQR(datos1$waiting,na.rm = T)
IQRwait
## [1] 24
cat("El rango intercuartilico de la variable  waiting:  ",IQRwait," ")
## El rango intercuartilico de la variable  waiting:   24
summary(datos1$waiting)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    43.0    58.0    76.0    70.9    82.0    96.0
hist(datos1$waiting, main = "Tiempo de espera entre erupciones (min)", xlab = "waiting", ylab = "Frecuencia", 
     col = "deepskyblue1",
     border = "red",
     xlim = c(0, 116),
     ylim = c(0, 60),labels = T)

boxplot(datos1$waiting, horizontal = T, col = "gray", range = 1.5, 
main = " Gráfico Boxplot de la variable waiting")

El gráfico permite identificar que en la variable waiting no se evidencian datos atípicos que puedan representar grandes cambios en la estimación de los parámetros de localización.

2) Gráfico de dispersión que relaciona la variable duration eruptions y la variable waiting.

El diagrama de dispersión representa los valores de la variable predictora (\(x=eruptions\)), junto con los de la variable respuesta (\(y=waiting\)), Permite determinar de una forma visual si hay una relación lineal entre ambas variables.

Si es razonable suponer que existe una relación de dependecia lineal entre las variables, ya que en el gráfico se observa que a medida que aumenta el valor de la variable predictora, aumenta el valor de la variable respuesta, por lo tanto existe una relación de dependencia lineal entre la variable predictora (eruptions) y la variable respuesta (waiting). En el centro del gráfico se visualizan datos dispersos en relación a los demas datos, que no influyen mucho en la linealidad.

El diagrama de dispersión parece indicar una posible relación lineal positiva entre ambas variables.

ggplot(datos1, mapping = aes(x , y )) +
geom_point(color = "firebrick", size = 1) +
labs(title = "Diagrama de dispersión", x = "eruptions", y = "waiting") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5)) 

pairs(datos1)

3) Modelo de regresión lineal que relaciona el tiempo de espera entre cada erupción con la duración de la erupciones.

# Correlación 

cor(x, y)
## [1] 0.9008112

Las variables presentan un alto grado de correlación (0.9008112), la correlación positiva indica que están asociadas de forma lineal y directamente proporcional.

# Construccion del modelo 

modelo<-lm(y~x)

summary(modelo)
## 
## Call:
## lm(formula = y ~ x)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -12.0796  -4.4831   0.2122   3.9246  15.9719 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  33.4744     1.1549   28.98   <2e-16 ***
## x            10.7296     0.3148   34.09   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 5.914 on 270 degrees of freedom
## Multiple R-squared:  0.8115, Adjusted R-squared:  0.8108 
## F-statistic:  1162 on 1 and 270 DF,  p-value: < 2.2e-16
names(modelo)
##  [1] "coefficients"  "residuals"     "effects"       "rank"         
##  [5] "fitted.values" "assign"        "qr"            "df.residual"  
##  [9] "xlevels"       "call"          "terms"         "model"
coef(modelo)
## (Intercept)           x 
##    33.47440    10.72964
confint(modelo, level = 0.95)
##                2.5 %   97.5 %
## (Intercept) 31.20069 35.74810
## x           10.10996 11.34932

Los coeficientes de regresión (\(\beta_0\) y \(\beta_1\)) son significativos y sus valores son respectivamente 33.4744 y 10.7296, además el Residual standar error del modelo (RSE) indica que cualquier prediccion se aleja 5.914 unidades del valor verdadero y el coeficiente de determinación \(R^2\) establece que el predictor \(x\) eruptions empleado en el modelo es capaz de explicar el 81.15% de la variabilidad observada en la variable respuesta \(y\) waiting.

la ecuación de la recta del modelo es: \[\hat{y}=10.7296x + 33.4744\].

Por cada segundo que se incrementa la duración de cada erupción, aumenta el tiempo de espera entre erupciones en promedio de 10.7296 minutos.

ggplot(datos1, mapping = aes(x , y )) +
geom_point(color = "firebrick", size = 1) +
labs(title = "Recta de regresión:", x = "eruptions", y = "waiting") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5)) +geom_smooth(method = 'lm', se=F, color='black')
## `geom_smooth()` using formula 'y ~ x'

plot(datos1, main="Ajuste de Recta de regresión",
     xlab="eruptions", ylab="waiting")
lines(lowess(datos1), col="red")
abline(modelo)

La línea roja muestra el mejor valor de regresión y la línea negra muestra el ajuste lineal, lo cual nos indica que hay una pequeña diferencia, por lo cual se puede condiderar que la regresión lineal es adecuada.

4) Prueba t para evaluar la contribucion de la variable regresora al modelo.

La prubea t del modelo para la variable regresora eruptions es significativa puesto que el p-value<0.05, lo que quiere decir que la variable regresora tiene una buena constribución a el modelo de regresión, además al análizar el test de hipótesis sobre el modelo de regresión, se determino que el estimador de la variable regresora eruptions \[\hat{\beta_1}=10.7296\] y el error estandar 0.3148 son de gran importancia para el calculo del estadistico t por que cumple con la aceptación de la prueba de hipotesis alternativa y ayuda a verificar que el t estadístico teórico es similiar al t value del modelo con un valor de 34.09.

5) ¿Tiene el modelo obtenido un buen ajuste?

\[ \begin{aligned} H_{0}&: \beta_{1}=0\\ H_{1}&: \beta_{1} \neq 0\ \end{aligned} \]

Como el p-value es \(2.2e^−16\), donde p-value <0.05, rechazamos la hipótesis nula de que la correlación es igual a cero. Dado que solo hay un predictor, el p-value del test F es igual al p-value del t-test del predictor.

Además, el p-value obtenido en el test F (\(2.2e^−16\)) determina que sí es significativamente superior la varianza explicada por el modelo en comparación con la varianza total, por lo que podemos aceptar nuestro modelo como válido y útil. Por lo tanto el modelo tiene un buen ajuste.

Por otro lado el coeficiente de correlación de Pearson es bastante alto (r = 0,90) y significativo (p-value = \(2.2e^−16\)). Ello indica que las variables estan fuertemente correlacionadas, por lo tanto se concluye que el modelo lineal es apropiado.

cor.test(x=datos1$eruptions, y=datos1$waiting, method = "pearson", digits = 2)
## 
##  Pearson's product-moment correlation
## 
## data:  datos1$eruptions and datos1$waiting
## t = 34.089, df = 270, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.8756964 0.9210652
## sample estimates:
##       cor 
## 0.9008112

Conclusión