El geiser es un tipo de fuente termal que emite una columna de agua caliente y de vapor subterraneo, este fenómeno requiere de una hidrogeología favorable que existe solo en algunas partes del planeta, por lo que son un fenómeno bastante anormal y no son muy comunes en el mundo. Los geiser son zonas donde se ha producido actividad volcánica en el pasado y donde coincide la presencia de rocas sometidas a altas temperaturas por el magma del interior de la Tierra, agua subterránea y una red de conductos con una salida a la superficie. Existen cerca de 1000 alrededor del planeta, de los cuales casi la mitad están ubicados en el parque nacional de Yellowstone ubicado en Estados Unidos.
El géiser Old Faithful es la atracción más visitada del parque nacional Yellowstone y los guardabosques ayudan a los turistas apredecir este fenómeno. Esta predicción se ejecuta cuando el geiser hace erupción, un gran chorro de agua caliente y vapor emerge de la tierra creando una espectacular fuente natural que alcanza varios metros de altura durante varios minutos. En el parque se realiza un registro de las siguientes mediciones: duración de la erupción en segundos, el intervalo de tiempo entre cada erupción en minutos y la altura en pies.
De acuerdo a la información anterior, en la base de datos geiser define las variables duración de las erupciones y waiting como el tiempo de espera entre erupciones, siendo eruptions (variable predictora) y waiting (variable Respuesta).
datos1<-as.data.frame(datos1)
colnames(datos1)<-c("eruptions", "waiting")
datos1
# Dimension de la Base de datos
dim(datos1)
## [1] 272 2
# La base de datos tiene 272 observaciones y 2 variables.
describe(datos1)
## datos1
##
## 2 Variables 272 Observations
## --------------------------------------------------------------------------------
## eruptions
## n missing distinct Info Mean Gmd .05 .10
## 272 0 126 1 3.488 1.266 1.800 1.852
## .25 .50 .75 .90 .95
## 2.163 4.000 4.454 4.700 4.817
##
## lowest : 1.600 1.667 1.700 1.733 1.750, highest: 4.933 5.000 5.033 5.067 5.100
## --------------------------------------------------------------------------------
## waiting
## n missing distinct Info Mean Gmd .05 .10
## 272 0 51 0.999 70.9 15.37 48 51
## .25 .50 .75 .90 .95
## 58 76 82 86 89
##
## lowest : 43 45 46 47 48, highest: 91 92 93 94 96
## --------------------------------------------------------------------------------
# Las dos variables analizadas son cuantitativas
str(datos1)
## 'data.frame': 272 obs. of 2 variables:
## $ eruptions: num 3.6 1.8 3.33 2.28 4.53 ...
## $ waiting : num 79 54 74 62 85 55 88 85 51 85 ...
# El comando Crosstable nos permite observar el número de repeticiones para los diferentes valores que toma la variable eruptions.
CrossTable(datos1$eruptions)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | N / Table Total |
## |-------------------------|
##
##
## Total Observations in Table: 272
##
##
## | 1.6 | 1.667 | 1.7 | 1.733 | 1.75 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 1 | 1 | 1 | 6 |
## | 0.004 | 0.004 | 0.004 | 0.004 | 0.022 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 1.783 | 1.8 | 1.817 | 1.833 | 1.85 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 4 | 3 | 7 | 2 |
## | 0.007 | 0.015 | 0.011 | 0.026 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 1.867 | 1.883 | 1.917 | 1.933 | 1.95 |
## |-----------|-----------|-----------|-----------|-----------|
## | 8 | 4 | 2 | 2 | 1 |
## | 0.029 | 0.015 | 0.007 | 0.007 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 1.967 | 1.983 | 2 | 2.017 | 2.033 |
## |-----------|-----------|-----------|-----------|-----------|
## | 3 | 3 | 4 | 3 | 2 |
## | 0.011 | 0.011 | 0.015 | 0.011 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.067 | 2.083 | 2.1 | 2.133 | 2.15 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 2 | 3 | 1 | 1 |
## | 0.004 | 0.007 | 0.011 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.167 | 2.183 | 2.2 | 2.217 | 2.233 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 3 | 1 | 2 |
## | 0.007 | 0.004 | 0.011 | 0.004 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.25 | 2.267 | 2.283 | 2.3 | 2.317 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 1 | 1 | 1 |
## | 0.007 | 0.004 | 0.004 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.333 | 2.35 | 2.367 | 2.383 | 2.4 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 1 | 1 | 1 | 2 |
## | 0.004 | 0.004 | 0.004 | 0.004 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.417 | 2.483 | 2.617 | 2.633 | 2.8 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 1 | 1 | 1 |
## | 0.007 | 0.004 | 0.004 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 2.883 | 2.9 | 3.067 | 3.317 | 3.333 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 1 | 1 | 1 | 2 |
## | 0.004 | 0.004 | 0.004 | 0.004 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 3.367 | 3.417 | 3.45 | 3.5 | 3.567 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 1 | 1 | 2 | 2 |
## | 0.004 | 0.004 | 0.004 | 0.007 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 3.6 | 3.683 | 3.717 | 3.733 | 3.75 |
## |-----------|-----------|-----------|-----------|-----------|
## | 4 | 1 | 1 | 1 | 1 |
## | 0.015 | 0.004 | 0.004 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 3.767 | 3.817 | 3.833 | 3.85 | 3.883 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 5 | 2 | 1 |
## | 0.007 | 0.004 | 0.018 | 0.007 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 3.917 | 3.95 | 3.966 | 3.967 | 4 |
## |-----------|-----------|-----------|-----------|-----------|
## | 3 | 2 | 1 | 1 | 6 |
## | 0.011 | 0.007 | 0.004 | 0.004 | 0.022 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.033 | 4.05 | 4.067 | 4.083 | 4.1 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 2 | 5 | 2 |
## | 0.007 | 0.004 | 0.007 | 0.018 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.117 | 4.133 | 4.15 | 4.167 | 4.183 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 2 | 4 | 4 | 1 |
## | 0.007 | 0.007 | 0.015 | 0.015 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.2 | 4.233 | 4.25 | 4.267 | 4.283 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 3 | 4 | 2 | 2 |
## | 0.004 | 0.011 | 0.015 | 0.007 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.3 | 4.317 | 4.333 | 4.35 | 4.366 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 1 | 5 | 4 | 1 |
## | 0.007 | 0.004 | 0.018 | 0.015 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.367 | 4.383 | 4.4 | 4.417 | 4.433 |
## |-----------|-----------|-----------|-----------|-----------|
## | 3 | 1 | 1 | 4 | 2 |
## | 0.011 | 0.004 | 0.004 | 0.015 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.45 | 4.467 | 4.483 | 4.5 | 4.517 |
## |-----------|-----------|-----------|-----------|-----------|
## | 3 | 2 | 1 | 8 | 1 |
## | 0.011 | 0.007 | 0.004 | 0.029 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.533 | 4.55 | 4.567 | 4.583 | 4.6 |
## |-----------|-----------|-----------|-----------|-----------|
## | 5 | 1 | 3 | 4 | 4 |
## | 0.018 | 0.004 | 0.011 | 0.015 | 0.015 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.617 | 4.633 | 4.65 | 4.667 | 4.7 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 3 | 1 | 2 | 6 |
## | 0.004 | 0.011 | 0.004 | 0.007 | 0.022 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.716 | 4.733 | 4.75 | 4.767 | 4.783 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 1 | 1 | 1 | 1 |
## | 0.004 | 0.004 | 0.004 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.8 | 4.817 | 4.833 | 4.85 | 4.883 |
## |-----------|-----------|-----------|-----------|-----------|
## | 6 | 2 | 2 | 1 | 1 |
## | 0.022 | 0.007 | 0.007 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 4.9 | 4.933 | 5 | 5.033 | 5.067 |
## |-----------|-----------|-----------|-----------|-----------|
## | 2 | 3 | 1 | 1 | 1 |
## | 0.007 | 0.011 | 0.004 | 0.004 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 5.1 |
## |-----------|
## | 1 |
## | 0.004 |
## |-----------|
##
##
##
##
#El comando Crosstable nos permite observar el número de repeticiones para los diferentes valores que toma la variable waiting.
CrossTable(datos1$waiting)
##
##
## Cell Contents
## |-------------------------|
## | N |
## | N / Table Total |
## |-------------------------|
##
##
## Total Observations in Table: 272
##
##
## | 43 | 45 | 46 | 47 | 48 |
## |-----------|-----------|-----------|-----------|-----------|
## | 1 | 3 | 5 | 4 | 3 |
## | 0.004 | 0.011 | 0.018 | 0.015 | 0.011 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 49 | 50 | 51 | 52 | 53 |
## |-----------|-----------|-----------|-----------|-----------|
## | 5 | 5 | 6 | 5 | 7 |
## | 0.018 | 0.018 | 0.022 | 0.018 | 0.026 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 54 | 55 | 56 | 57 | 58 |
## |-----------|-----------|-----------|-----------|-----------|
## | 9 | 6 | 4 | 3 | 4 |
## | 0.033 | 0.022 | 0.015 | 0.011 | 0.015 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 59 | 60 | 62 | 63 | 64 |
## |-----------|-----------|-----------|-----------|-----------|
## | 7 | 6 | 4 | 3 | 4 |
## | 0.026 | 0.022 | 0.015 | 0.011 | 0.015 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 65 | 66 | 67 | 68 | 69 |
## |-----------|-----------|-----------|-----------|-----------|
## | 3 | 2 | 1 | 1 | 2 |
## | 0.011 | 0.007 | 0.004 | 0.004 | 0.007 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 70 | 71 | 72 | 73 | 74 |
## |-----------|-----------|-----------|-----------|-----------|
## | 4 | 5 | 1 | 7 | 6 |
## | 0.015 | 0.018 | 0.004 | 0.026 | 0.022 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 75 | 76 | 77 | 78 | 79 |
## |-----------|-----------|-----------|-----------|-----------|
## | 8 | 9 | 12 | 15 | 10 |
## | 0.029 | 0.033 | 0.044 | 0.055 | 0.037 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 80 | 81 | 82 | 83 | 84 |
## |-----------|-----------|-----------|-----------|-----------|
## | 8 | 13 | 12 | 14 | 10 |
## | 0.029 | 0.048 | 0.044 | 0.051 | 0.037 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 85 | 86 | 87 | 88 | 89 |
## |-----------|-----------|-----------|-----------|-----------|
## | 6 | 6 | 2 | 6 | 3 |
## | 0.022 | 0.022 | 0.007 | 0.022 | 0.011 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 90 | 91 | 92 | 93 | 94 |
## |-----------|-----------|-----------|-----------|-----------|
## | 6 | 1 | 1 | 2 | 1 |
## | 0.022 | 0.004 | 0.004 | 0.007 | 0.004 |
## |-----------|-----------|-----------|-----------|-----------|
##
##
## | 96 |
## |-----------|
## | 1 |
## | 0.004 |
## |-----------|
##
##
##
##
# Media
meanerup<- mean(datos1$eruptions, na.rm = T)
meanerup
## [1] 3.487783
cat("La media de la variable erupción es: ",meanerup," ")
## La media de la variable erupción es: 3.487783
# Mediana
medianerup<- median(datos1$eruptions, na.rm = T)
medianerup
## [1] 4
cat("La mediana de la variable erupción es: ",medianerup," ")
## La mediana de la variable erupción es: 4
# Varianza
varerup<-var(datos1$eruptions, na.rm = T)
cat("La varianza de la variable erupción es: ",varerup," ")
## La varianza de la variable erupción es: 1.302728
# Desviación estandar
sderup<-sd(datos1$eruptions, na.rm = T)
sderup
## [1] 1.141371
cat("La desviación estandar de la variable erupción es: ",sderup," ")
## La desviación estandar de la variable erupción es: 1.141371
# Quantiles
quantilerup<-quantile(datos1$eruptions,na.rm = T)
quantilerup
## 0% 25% 50% 75% 100%
## 1.60000 2.16275 4.00000 4.45425 5.10000
cat("Los cuantiles de la variable erupción: ",quantilerup," ")
## Los cuantiles de la variable erupción: 1.6 2.16275 4 4.45425 5.1
# Rango intercuartilico
IQRerup<-IQR(datos1$eruptions,na.rm = T)
IQRerup
## [1] 2.2915
cat("El rango intercuartilico de la variable erupción: ",IQRerup," ")
## El rango intercuartilico de la variable erupción: 2.2915
summary(datos1$eruptions)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.600 2.163 4.000 3.488 4.454 5.100
hist(datos1$eruptions, main = "Duración de las erupciones (seg)", xlab = "eruptions", ylab = "Frecuencia",
col = "green",
border = "red",
xlim = c(0, 7),
ylim = c(0, 85),labels = T)
boxplot(datos1$eruptions, horizontal = T, col = "gray", range = 1.5,
main = " Gráfico Boxplot de la variable eruptions" )
El gráfico permite identificar que en la variable eruptions no se evidencian datos atípicos que puedan representar grandes cambios en la estimación de los parámetros de localización.
# Media
meanwait<- mean(datos1$waiting, na.rm = T)
meanwait
## [1] 70.89706
cat("La media de la variable waiting es: ",meanwait," ")
## La media de la variable waiting es: 70.89706
# Mediana
medianwait<- median(datos1$waiting, na.rm = T)
medianwait
## [1] 76
cat("La mediana de la variable waiting es: ",medianwait," ")
## La mediana de la variable waiting es: 76
# Varianza
varwait<-var(datos1$waiting, na.rm = T)
cat("La varianza de la variable waiting es: ",varwait," ")
## La varianza de la variable waiting es: 184.8233
# Desviación estandar
sdwait<-sd(datos1$waiting, na.rm = T)
sdwait
## [1] 13.59497
cat("La desviación estandar de la variable waiting es: ",sdwait," ")
## La desviación estandar de la variable waiting es: 13.59497
# Quantiles
quantilewait<-quantile(datos1$waiting,na.rm = T)
quantilewait
## 0% 25% 50% 75% 100%
## 43 58 76 82 96
cat("Los cuantiles de la variable waiting: ",quantilewait," ")
## Los cuantiles de la variable waiting: 43 58 76 82 96
# Rango intercuartilico
IQRwait<-IQR(datos1$waiting,na.rm = T)
IQRwait
## [1] 24
cat("El rango intercuartilico de la variable waiting: ",IQRwait," ")
## El rango intercuartilico de la variable waiting: 24
summary(datos1$waiting)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 43.0 58.0 76.0 70.9 82.0 96.0
hist(datos1$waiting, main = "Tiempo de espera entre erupciones (min)", xlab = "waiting", ylab = "Frecuencia",
col = "deepskyblue1",
border = "red",
xlim = c(0, 116),
ylim = c(0, 60),labels = T)
boxplot(datos1$waiting, horizontal = T, col = "gray", range = 1.5,
main = " Gráfico Boxplot de la variable waiting")
El gráfico permite identificar que en la variable waiting no se evidencian datos atípicos que puedan representar grandes cambios en la estimación de los parámetros de localización.
El diagrama de dispersión representa los valores de la variable predictora (\(x=eruptions\)), junto con los de la variable respuesta (\(y=waiting\)), Permite determinar de una forma visual si hay una relación lineal entre ambas variables.
Si es razonable suponer que existe una relación de dependecia lineal entre las variables, ya que en el gráfico se observa que a medida que aumenta el valor de la variable predictora, aumenta el valor de la variable respuesta, por lo tanto existe una relación de dependencia lineal entre la variable predictora (eruptions) y la variable respuesta (waiting). En el centro del gráfico se visualizan datos dispersos en relación a los demas datos, que no influyen mucho en la linealidad.
El diagrama de dispersión parece indicar una posible relación lineal positiva entre ambas variables.
ggplot(datos1, mapping = aes(x , y )) +
geom_point(color = "firebrick", size = 1) +
labs(title = "Diagrama de dispersión", x = "eruptions", y = "waiting") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5))
pairs(datos1)
# Correlación
cor(x, y)
## [1] 0.9008112
Las variables presentan un alto grado de correlación (0.9008112), la correlación positiva indica que están asociadas de forma lineal y directamente proporcional.
# Construccion del modelo
modelo<-lm(y~x)
summary(modelo)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.0796 -4.4831 0.2122 3.9246 15.9719
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 33.4744 1.1549 28.98 <2e-16 ***
## x 10.7296 0.3148 34.09 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 5.914 on 270 degrees of freedom
## Multiple R-squared: 0.8115, Adjusted R-squared: 0.8108
## F-statistic: 1162 on 1 and 270 DF, p-value: < 2.2e-16
names(modelo)
## [1] "coefficients" "residuals" "effects" "rank"
## [5] "fitted.values" "assign" "qr" "df.residual"
## [9] "xlevels" "call" "terms" "model"
coef(modelo)
## (Intercept) x
## 33.47440 10.72964
confint(modelo, level = 0.95)
## 2.5 % 97.5 %
## (Intercept) 31.20069 35.74810
## x 10.10996 11.34932
Los coeficientes de regresión (\(\beta_0\) y \(\beta_1\)) son significativos y sus valores son respectivamente 33.4744 y 10.7296, además el Residual standar error del modelo (RSE) indica que cualquier prediccion se aleja 5.914 unidades del valor verdadero y el coeficiente de determinación \(R^2\) establece que el predictor \(x\) eruptions empleado en el modelo es capaz de explicar el 81.15% de la variabilidad observada en la variable respuesta \(y\) waiting.
la ecuación de la recta del modelo es: \[\hat{y}=10.7296x + 33.4744\].
Por cada segundo que se incrementa la duración de cada erupción, aumenta el tiempo de espera entre erupciones en promedio de 10.7296 minutos.
ggplot(datos1, mapping = aes(x , y )) +
geom_point(color = "firebrick", size = 1) +
labs(title = "Recta de regresión:", x = "eruptions", y = "waiting") +
theme_bw() +
theme(plot.title = element_text(hjust = 0.5)) +geom_smooth(method = 'lm', se=F, color='black')
## `geom_smooth()` using formula 'y ~ x'
plot(datos1, main="Ajuste de Recta de regresión",
xlab="eruptions", ylab="waiting")
lines(lowess(datos1), col="red")
abline(modelo)
La línea roja muestra el mejor valor de regresión y la línea negra muestra el ajuste lineal, lo cual nos indica que hay una pequeña diferencia, por lo cual se puede condiderar que la regresión lineal es adecuada.
La prubea t del modelo para la variable regresora eruptions es significativa puesto que el p-value<0.05, lo que quiere decir que la variable regresora tiene una buena constribución a el modelo de regresión, además al análizar el test de hipótesis sobre el modelo de regresión, se determino que el estimador de la variable regresora eruptions \[\hat{\beta_1}=10.7296\] y el error estandar 0.3148 son de gran importancia para el calculo del estadistico t por que cumple con la aceptación de la prueba de hipotesis alternativa y ayuda a verificar que el t estadístico teórico es similiar al t value del modelo con un valor de 34.09.
\[ \begin{aligned} H_{0}&: \beta_{1}=0\\ H_{1}&: \beta_{1} \neq 0\ \end{aligned} \]
Como el p-value es \(2.2e^−16\), donde p-value <0.05, rechazamos la hipótesis nula de que la correlación es igual a cero. Dado que solo hay un predictor, el p-value del test F es igual al p-value del t-test del predictor.
Además, el p-value obtenido en el test F (\(2.2e^−16\)) determina que sí es significativamente superior la varianza explicada por el modelo en comparación con la varianza total, por lo que podemos aceptar nuestro modelo como válido y útil. Por lo tanto el modelo tiene un buen ajuste.
Por otro lado el coeficiente de correlación de Pearson es bastante alto (r = 0,90) y significativo (p-value = \(2.2e^−16\)). Ello indica que las variables estan fuertemente correlacionadas, por lo tanto se concluye que el modelo lineal es apropiado.
cor.test(x=datos1$eruptions, y=datos1$waiting, method = "pearson", digits = 2)
##
## Pearson's product-moment correlation
##
## data: datos1$eruptions and datos1$waiting
## t = 34.089, df = 270, p-value < 2.2e-16
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.8756964 0.9210652
## sample estimates:
## cor
## 0.9008112
Al realizar el análisis exploratorio de la base de datos géiser Old Faithful en el Parque Nacional de Yellowstone se concluye que hay una relación de dependencia lineal entre la duración de las erupciones y el tiempo de espera de cada erupción.
Las varibles en estudio se encuentran estadísticamente correlacionadas entre sí.
Al analizar el modelo de regresión se obtuvo que cumple con las condiciones de hipotesis para ser válido y útil.