##Regresion Lineal de los estudiantes de la escuela profesional de Ingenieria Estadistica e Informatica V-Semestre
dat<-("
PESO   TALLA
65.5    1.64  
67      1.67    
60      1.62    
60      1.60    
62.5    1.64    
71      1.70    
66.5    1.67    
65.5    1.66    
64      1.65    
62.5    1.69    
63.5    1.60    
64.5    1.64    
66      1.63    
67.5    1.65  
72      1.72  
70      1.71  
72      1.74 ")     
data1 = read.table(textConnection(dat),header=TRUE)
library(sjPlot)
## Warning: package 'sjPlot' was built under R version 4.0.2
tab_df(data1)
PESO TALLA
65.50 1.64
67.00 1.67
60.00 1.62
60.00 1.60
62.50 1.64
71.00 1.70
66.50 1.67
65.50 1.66
64.00 1.65
62.50 1.69
63.50 1.60
64.50 1.64
66.00 1.63
67.50 1.65
72.00 1.72
70.00 1.71
72.00 1.74
attach(data1)
model1<-lm(PESO~.,data=data1)
summary(model1)
## 
## Call:
## lm(formula = PESO ~ ., data = data1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.6376 -1.0705  0.1963  1.5621  2.4631 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   -61.45      22.31  -2.754   0.0148 *  
## TALLA          76.68      13.43   5.708 4.14e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.178 on 15 degrees of freedom
## Multiple R-squared:  0.6848, Adjusted R-squared:  0.6638 
## F-statistic: 32.58 on 1 and 15 DF,  p-value: 4.145e-05
# Graficamos la dispersi?n y a?adimos las etiquetas y t?tulo
plot(PESO, TALLA, main = "Tallas registradas en funci?n de la edad", xlab = "Edad", ylab 
     = "Tallas")

# Obtenemos el numero de observaciones
n = length(PESO)
# Sumatoria de x por y
Sxy = sum(PESO * TALLA)
# Sumatoria de x
Sx = sum(PESO) 
# Sumatoria de y
Sy = sum(TALLA)
# Sumatoria de x al cuadrado
Sx2 = sum(PESO^2)
# Reemplazamos en la formula de Beta 1
Beta_1 = (n*Sxy - Sx*Sy)/(n*Sx2 - Sx^2)
# Visualizamos el valor de Beta 1
Beta_1
## [1] 0.008930433
# Calculamos la cov(xy) - covarianza
cov_xy = cov(PESO, TALLA)
# Calculamos la varianza de x
var_x = var(PESO)
# Estimamos el valor de Beta 1
Beta_2 = cov_xy/var_x

# Media de x
media_x = mean(PESO)
# Media de y
media_y = mean(TALLA)
# Estimamos el valor de Beta 0
Beta_0 = media_y - Beta_1*media_x
# Visualizamos el valor de Beta 0
Beta_0
## [1] 1.07223
# Asignamos a la variable modelo, los resultados de la regresi?n
modelo = lm(TALLA ~ PESO)
# Visualizamos los resultados del modelo
modelo
## 
## Call:
## lm(formula = TALLA ~ PESO)
## 
## Coefficients:
## (Intercept)         PESO  
##     1.07223      0.00893
# Definimos el numero de datos
n = 17
# Calculamos SSE 
SSE = sum((TALLA - (Beta_0 + Beta_1*PESO))^2)
SSE
## [1] 0.00828879
# Calculo de Sxx
Sxx = sum((PESO - media_x)^2)
Sxx
## [1] 225.7647
# Entonces calculamos SBo
SBo = sqrt((SSE/(n-2)) * (1/n + media_x^2/Sxx))
SBo
## [1] 0.1032296
# Calculamos entonces tBo
tBo = (Beta_0 - 0)/SBo
# Visualizamos tBo
tBo
## [1] 10.38685
# Reemplazamos los valores antes calculados en SB1 
SB1 = sqrt(SSE/((n - 2)*Sxx))
# Visualizamos SB1
SB1
## [1] 0.001564487
# Hallamos el estad?stico tB1 para beta 1
tB1 = Beta_1/SB1
# Visualizamos tB1
tB1
## [1] 5.708218
# Desviaci?n estandar de x
Sx = sd(PESO)
# Desviaci?n estandar de y
Sy = sd(TALLA)
# Finalmente el coeficiente de correlaci?n r
r = cov_xy/(Sx * Sy)
# Visualizamos r
r
## [1] 0.8275061
# O simplemente utilizamos la funci?n cor()
r  = cor(PESO, TALLA)
r
## [1] 0.8275061
# El coeficiente r
tr = r/sqrt((1-r^2)/(n-2))
# Visualizamos r
tr
## [1] 5.708218
cor.test(PESO, TALLA, conf.level = 0.95)
## 
##  Pearson's product-moment correlation
## 
## data:  PESO and TALLA
## t = 5.7082, df = 15, p-value = 4.145e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.5759296 0.9359067
## sample estimates:
##       cor 
## 0.8275061
# Obtenemos el resumen de la regresi?n
summary(modelo)
## 
## Call:
## lm(formula = TALLA ~ PESO)
## 
## Residuals:
##       Min        1Q    Median        3Q       Max 
## -0.039313 -0.008243  0.002826  0.009618  0.059618 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 1.072230   0.103230  10.387 3.03e-08 ***
## PESO        0.008930   0.001564   5.708 4.14e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.02351 on 15 degrees of freedom
## Multiple R-squared:  0.6848, Adjusted R-squared:  0.6638 
## F-statistic: 32.58 on 1 and 15 DF,  p-value: 4.145e-05