#CARGA
#install.packages("datarium")
#Banco de datos para análisis estadísticos y visualización
#install.packages("confintr")
library(datarium)
library(confintr)
#VARIABLES
X <- c(stress$age)
Y <- c(stress$score)
plot(stress$age, stress$score, xlab='Edad', ylab='Nivel de Colesterol')
#CALCULO COEFICIENTE DE CORRELACION MMC
promx <- mean(X)
promy <- mean(Y)
sumxy <- sum((X-promx)*(Y-promy))
sumxp <- sum((X-promx)^2)
sumyp <- sum((Y-promy)^2)
r = sumxy/(sqrt(sumxp)*sqrt(sumyp))
r
## [1] 0.5303787
Comprobación
cor(X,Y,method="pearson")
## [1] 0.5303787
Interpretación: Como el valor obtenido se encuentra entre 40 y 60% se puede afirmar que la relación lineal entre las variables es positiva y moderada
#ESTIMACION DEL IC PARA “ρ”
Zr <- 1/2*log((1+r)/(1-r))
alfa <- 0.02
n <- length(X)
Zrho_inf <- Zr - qnorm(1-alfa/2)*sqrt(1/(n-3))
Zrho_sup <- Zr + qnorm(1-alfa/2)*sqrt(1/(n-3))
rho_inf <- (exp(2*Zrho_inf)-1)/(exp(2*Zrho_inf)+1)
rho_sup <- (exp(2*Zrho_sup)-1)/(exp(2*Zrho_sup)+1)
c(rho_inf,rho_sup)
## [1] 0.2752539 0.7157151
Comprobación
cor.test(X, Y, method = "pearson", alternative = "two.sided", conf.level = 0.98)
##
## Pearson's product-moment correlation
##
## data: X and Y
## t = 4.7646, df = 58, p-value = 1.308e-05
## alternative hypothesis: true correlation is not equal to 0
## 98 percent confidence interval:
## 0.2752539 0.7157151
## sample estimates:
## cor
## 0.5303787
Interpretación: Como el IC no contiene al “0” se puede afirmar que a un nivel de confianza del 98% ρ!=0.
#PRUEBA DE HIPOTESIS
tcalc <- r*sqrt(n-2)/sqrt(1-r^2)
2*pt(abs(tcalc),n-2,lower.tail = FALSE)
## [1] 1.308366e-05