library(readxl)
data <- read_excel("C:/Users/Alejandra/Downloads/Reg_2.xlsx")
View(data)

#Gravedad crudo

with(data, plot(Gravedad_crudo,Cant_gasol))

Sxy <- sum((data$Gravedad_crudo)*(data$Cant_gasol)) - (sum(data$Gravedad_crudo)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] 461.415
Sxx<-sum((data$Gravedad_crudo)^2) - (sum(data$Gravedad_crudo)^2)/length(data$Cant_gasol)
Sxx
## [1] 984.5
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
r1<-Sxy/sqrt(Sxx*Syy)
r1
## [1] 0.246326
shapiro.test(data$Gravedad_crudo)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Gravedad_crudo
## W = 0.85135, p-value = 0.0004439
shapiro.test(data$Cant_gasol)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Cant_gasol
## W = 0.9604, p-value = 0.2817

El p-valor de publicidad de radio es 0.0001118<0.05

cor(data$Gravedad_crudo,data$Cant_gasol)
## [1] 0.246326
cor(data$Gravedad_crudo,data$Cant_gasol,method = "spearman" )
## [1] 0.09463396

Hay una correlación débil

cor.test(data$Gravedad_crudo,data$Cant_gasol)
## 
##  Pearson's product-moment correlation
## 
## data:  data$Gravedad_crudo and data$Cant_gasol
## t = 1.3921, df = 30, p-value = 0.1741
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  -0.1119868  0.5479548
## sample estimates:
##      cor 
## 0.246326
cor.test(data$Gravedad_crudo,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$Gravedad_crudo, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  data$Gravedad_crudo and data$Cant_gasol
## S = 4939.7, p-value = 0.6064
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## 0.09463396

No se rechaza Ho, es decir, p=0. no hay una relación estadísticamente significativa entre la gravedad del crudo y la cantidad de gasolina en porcentaje con respecto a la cantidad de petróleo en crudo.

R12<-r1^2 * 100
R12
## [1] 6.067651

El 6% de la variabilidad observada en las Cant_gasol se explica por la gravedad del crudo.

#Presión vapor

with(data, plot(Presion_vapor,Cant_gasol))

summary(data$Presion_vapor)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.200   1.800   4.800   4.181   6.100   8.600
summary(data$Cant_gasol)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2.80   11.65   17.80   19.66   27.05   45.70
cov<- sum((data$Presion_vapor - mean(data$Presion_vapor))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] 10.78889
cov(data$Presion_vapor,data$Cant_gasol)
## [1] 10.78889
shapiro.test(data$Presion_vapor)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Presion_vapor
## W = 0.92813, p-value = 0.03475
shapiro.test(data$Cant_gasol)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Cant_gasol
## W = 0.9604, p-value = 0.2817

La cantidad de petroleo en crudo tiene un p-valor > 0.05, por lo tanto asumimos normalidad; sin embargo, la presión de vapor da un p-valor < 0.05, por lo tanto no es normal, debemos usar coeficiente de Spearman.

r2<-cor(data$Presion_vapor,data$Cant_gasol,method = "spearman" )
r2
## [1] 0.3042194

Observamos un coeficiente de correlación de 0.3, lo que indica una correlación lineal positiva débil.

cor.test(data$Presion_vapor,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$Presion_vapor, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  data$Presion_vapor and data$Cant_gasol
## S = 3796.2, p-value = 0.09048
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.3042194

Obtuvimos un p-valor=0.09, el cual es mayor a 0.05, por lo tanto no se rechaza la hipótesis nula, así, no significativo hacer un modelo.

R22<-r2^2 * 100
R22
## [1] 9.254942

El 9% de la variabilidad observada en las Cant_gasol se explica por la presión de vapor.

#lm linear model (y~x)
m3<-lm(data$Cant_gasol ~ data$Presion_vapor)
m3
## 
## Call:
## lm(formula = data$Cant_gasol ~ data$Presion_vapor)
## 
## Coefficients:
##        (Intercept)  data$Presion_vapor  
##             13.087               1.572
summary(m3)
## 
## Call:
## lm(formula = data$Cant_gasol ~ data$Presion_vapor)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -15.7755  -7.9857   0.7413   7.7963  19.0947 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         13.0868     3.3892   3.861 0.000558 ***
## data$Presion_vapor   1.5719     0.6899   2.278 0.029992 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.06 on 30 degrees of freedom
## Multiple R-squared:  0.1475, Adjusted R-squared:  0.1191 
## F-statistic: 5.191 on 1 and 30 DF,  p-value: 0.02999

y= 13.0868 + 1.5719x por cada aumento de 1 grado API en la gravedad del crudo, el porcentaje de gasolina aumenta en 1.5719%. Cuando la presión de vapor es 0 se esperaría que el porcentaje de gasolina alcanzara los 13.0868%.

Temperatura para la cual se evapora un 10

with(data, plot(temperatura10,Cant_gasol))

cov<- sum((data$temperatura10 - mean(data$temperatura10))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] -130.9542
cov(data$temperatura10,data$Cant_gasol)
## [1] -130.9542
Sxy <- sum((data$temperatura10)*(data$Cant_gasol)) - (sum(data$temperatura10)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] -4059.581
Sxx<-sum((data$temperatura10)^2) - (sum(data$temperatura10)^2)/length(data$Cant_gasol)
Sxx
## [1] 44381.88
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
R3<-Sxy/sqrt(Sxx*Syy)
R3
## [1] -0.3227787
shapiro.test(data$temperatura10)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$temperatura10
## W = 0.91164, p-value = 0.01241
shapiro.test(data$Cant_gasol)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Cant_gasol
## W = 0.9604, p-value = 0.2817

El p-valor de publicidad de radio es 0.0001118<0.05

cor(data$temperatura10,data$Cant_gasol)
## [1] -0.3227787
cor(data$temperatura10,data$Cant_gasol,method = "spearman" )
## [1] -0.2392293

Hay una correlación moderada

cor.test(data$temperatura10,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$temperatura10, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  data$temperatura10 and data$Cant_gasol
## S = 6761.2, p-value = 0.1873
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.2392293

no se rechaza Ho, es decir, p!=0. no hay una relación estadísticamente significativa entre la temperatura para la cual se evapora un 10% y el porcentaje de petroleo crudo que se convierte en gasolina.

R2<-R3^2 * 100
R2
## [1] 10.41861

El 10% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se explica por la temperatura para la cual se evapora un 10%. El 10% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se debe a la regresión entre la temperatura para la cual se evapora en un 10% y en las en el porcentaje de petroleo crudo que se convierte en gasolina y el 90% restante se debe a otras variables que no han sido incluidas en el estudio.

Temperatura para la cual se evapora un 100

with(data, plot(temperatura100,Cant_gasol))

cov<- sum((data$temperatura100 - mean(data$temperatura100))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] 532.1878
cov(data$temperatura100,data$Cant_gasol)
## [1] 532.1878
Sxy <- sum((data$temperatura100)*(data$Cant_gasol)) - (sum(data$temperatura100)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] 16497.82
Sxx<-sum((data$temperatura100)^2) - (sum(data$temperatura100)^2)/length(data$Cant_gasol)
Sxx
## [1] 150842.7
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
R4<-Sxy/sqrt(Sxx*Syy)
R4
## [1] 0.7115262
shapiro.test(data$temperatura100)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$temperatura100
## W = 0.94499, p-value = 0.1038
shapiro.test(data$Cant_gasol)
## 
##  Shapiro-Wilk normality test
## 
## data:  data$Cant_gasol
## W = 0.9604, p-value = 0.2817

Asumimos normalidad.

cor(data$temperatura100,data$Cant_gasol)
## [1] 0.7115262

Hay una correlación fuerte.

cor.test(data$temperatura100,data$Cant_gasol)
## 
##  Pearson's product-moment correlation
## 
## data:  data$temperatura100 and data$Cant_gasol
## t = 5.5463, df = 30, p-value = 4.983e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.4825569 0.8494640
## sample estimates:
##       cor 
## 0.7115262

Se rechaza Ho, es decir, p!=0. Hay una relación estadísticamente significativa entre la temperatura para la cual se evapora un 100% y el porcentaje de petroleo crudo que se convierte en gasolina.

R2<-R4^2 * 100
R2
## [1] 50.62695

El 50% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se explica por la temperatura para la cual se evapora un 100% . El 50% de la variabilidad observada en las Cant_gasol se debe a la regresión entre la temperatura para la cual se evapora al 100% y en las Cant_gasol y el 50% restante se debe a otras variables que no han sido incluidas en el estudio.

#lm linear model (y~x)
m4<-lm(data$Cant_gasol ~ data$temperatura100)
m4
## 
## Call:
## lm(formula = data$Cant_gasol ~ data$temperatura100)
## 
## Coefficients:
##         (Intercept)  data$temperatura100  
##            -16.6621               0.1094
summary(m4)
## 
## Call:
## lm(formula = data$Cant_gasol ~ data$temperatura100)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -14.7584  -6.2783   0.0525   5.1624  17.8481 
## 
## Coefficients:
##                      Estimate Std. Error t value Pr(>|t|)    
## (Intercept)         -16.66206    6.68721  -2.492   0.0185 *  
## data$temperatura100   0.10937    0.01972   5.546 4.98e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.659 on 30 degrees of freedom
## Multiple R-squared:  0.5063, Adjusted R-squared:  0.4898 
## F-statistic: 30.76 on 1 and 30 DF,  p-value: 4.983e-06

y= -16.66206 + 0.10937x

Por cada por cada aumento de 1°C en la temperatura para el cual se evapora al 100% aumenta el porcentaje en gasolina en 0.10927%. Cuando la temperatura para la cual se evapora al 100% es 0, se esperaría que el porcentaje de crudo que se convierte a gasolina fuera de -16.66206% (no tiene sentido).