library(readxl)
data <- read_excel("C:/Users/Alejandra/Downloads/Reg_2.xlsx")
View(data)
#Gravedad crudo
with(data, plot(Gravedad_crudo,Cant_gasol))
Sxy <- sum((data$Gravedad_crudo)*(data$Cant_gasol)) - (sum(data$Gravedad_crudo)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] 461.415
Sxx<-sum((data$Gravedad_crudo)^2) - (sum(data$Gravedad_crudo)^2)/length(data$Cant_gasol)
Sxx
## [1] 984.5
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
r1<-Sxy/sqrt(Sxx*Syy)
r1
## [1] 0.246326
shapiro.test(data$Gravedad_crudo)
##
## Shapiro-Wilk normality test
##
## data: data$Gravedad_crudo
## W = 0.85135, p-value = 0.0004439
shapiro.test(data$Cant_gasol)
##
## Shapiro-Wilk normality test
##
## data: data$Cant_gasol
## W = 0.9604, p-value = 0.2817
El p-valor de publicidad de radio es 0.0001118<0.05
cor(data$Gravedad_crudo,data$Cant_gasol)
## [1] 0.246326
cor(data$Gravedad_crudo,data$Cant_gasol,method = "spearman" )
## [1] 0.09463396
Hay una correlación débil
cor.test(data$Gravedad_crudo,data$Cant_gasol)
##
## Pearson's product-moment correlation
##
## data: data$Gravedad_crudo and data$Cant_gasol
## t = 1.3921, df = 30, p-value = 0.1741
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.1119868 0.5479548
## sample estimates:
## cor
## 0.246326
cor.test(data$Gravedad_crudo,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$Gravedad_crudo, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: data$Gravedad_crudo and data$Cant_gasol
## S = 4939.7, p-value = 0.6064
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.09463396
No se rechaza Ho, es decir, p=0. no hay una relación estadísticamente significativa entre la gravedad del crudo y la cantidad de gasolina en porcentaje con respecto a la cantidad de petróleo en crudo.
R12<-r1^2 * 100
R12
## [1] 6.067651
El 6% de la variabilidad observada en las Cant_gasol se explica por la gravedad del crudo.
#Presión vapor
with(data, plot(Presion_vapor,Cant_gasol))
summary(data$Presion_vapor)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.200 1.800 4.800 4.181 6.100 8.600
summary(data$Cant_gasol)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.80 11.65 17.80 19.66 27.05 45.70
cov<- sum((data$Presion_vapor - mean(data$Presion_vapor))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] 10.78889
cov(data$Presion_vapor,data$Cant_gasol)
## [1] 10.78889
shapiro.test(data$Presion_vapor)
##
## Shapiro-Wilk normality test
##
## data: data$Presion_vapor
## W = 0.92813, p-value = 0.03475
shapiro.test(data$Cant_gasol)
##
## Shapiro-Wilk normality test
##
## data: data$Cant_gasol
## W = 0.9604, p-value = 0.2817
La cantidad de petroleo en crudo tiene un p-valor > 0.05, por lo tanto asumimos normalidad; sin embargo, la presión de vapor da un p-valor < 0.05, por lo tanto no es normal, debemos usar coeficiente de Spearman.
r2<-cor(data$Presion_vapor,data$Cant_gasol,method = "spearman" )
r2
## [1] 0.3042194
Observamos un coeficiente de correlación de 0.3, lo que indica una correlación lineal positiva débil.
cor.test(data$Presion_vapor,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$Presion_vapor, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: data$Presion_vapor and data$Cant_gasol
## S = 3796.2, p-value = 0.09048
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.3042194
Obtuvimos un p-valor=0.09, el cual es mayor a 0.05, por lo tanto no se rechaza la hipótesis nula, así, no significativo hacer un modelo.
R22<-r2^2 * 100
R22
## [1] 9.254942
El 9% de la variabilidad observada en las Cant_gasol se explica por la presión de vapor.
#lm linear model (y~x)
m3<-lm(data$Cant_gasol ~ data$Presion_vapor)
m3
##
## Call:
## lm(formula = data$Cant_gasol ~ data$Presion_vapor)
##
## Coefficients:
## (Intercept) data$Presion_vapor
## 13.087 1.572
summary(m3)
##
## Call:
## lm(formula = data$Cant_gasol ~ data$Presion_vapor)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.7755 -7.9857 0.7413 7.7963 19.0947
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.0868 3.3892 3.861 0.000558 ***
## data$Presion_vapor 1.5719 0.6899 2.278 0.029992 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.06 on 30 degrees of freedom
## Multiple R-squared: 0.1475, Adjusted R-squared: 0.1191
## F-statistic: 5.191 on 1 and 30 DF, p-value: 0.02999
y= 13.0868 + 1.5719x por cada aumento de 1 grado API en la gravedad del crudo, el porcentaje de gasolina aumenta en 1.5719%. Cuando la presión de vapor es 0 se esperaría que el porcentaje de gasolina alcanzara los 13.0868%.
with(data, plot(temperatura10,Cant_gasol))
cov<- sum((data$temperatura10 - mean(data$temperatura10))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] -130.9542
cov(data$temperatura10,data$Cant_gasol)
## [1] -130.9542
Sxy <- sum((data$temperatura10)*(data$Cant_gasol)) - (sum(data$temperatura10)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] -4059.581
Sxx<-sum((data$temperatura10)^2) - (sum(data$temperatura10)^2)/length(data$Cant_gasol)
Sxx
## [1] 44381.88
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
R3<-Sxy/sqrt(Sxx*Syy)
R3
## [1] -0.3227787
shapiro.test(data$temperatura10)
##
## Shapiro-Wilk normality test
##
## data: data$temperatura10
## W = 0.91164, p-value = 0.01241
shapiro.test(data$Cant_gasol)
##
## Shapiro-Wilk normality test
##
## data: data$Cant_gasol
## W = 0.9604, p-value = 0.2817
El p-valor de publicidad de radio es 0.0001118<0.05
cor(data$temperatura10,data$Cant_gasol)
## [1] -0.3227787
cor(data$temperatura10,data$Cant_gasol,method = "spearman" )
## [1] -0.2392293
Hay una correlación moderada
cor.test(data$temperatura10,data$Cant_gasol, method = "spearman")
## Warning in cor.test.default(data$temperatura10, data$Cant_gasol, method =
## "spearman"): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: data$temperatura10 and data$Cant_gasol
## S = 6761.2, p-value = 0.1873
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## -0.2392293
no se rechaza Ho, es decir, p!=0. no hay una relación estadísticamente significativa entre la temperatura para la cual se evapora un 10% y el porcentaje de petroleo crudo que se convierte en gasolina.
R2<-R3^2 * 100
R2
## [1] 10.41861
El 10% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se explica por la temperatura para la cual se evapora un 10%. El 10% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se debe a la regresión entre la temperatura para la cual se evapora en un 10% y en las en el porcentaje de petroleo crudo que se convierte en gasolina y el 90% restante se debe a otras variables que no han sido incluidas en el estudio.
with(data, plot(temperatura100,Cant_gasol))
cov<- sum((data$temperatura100 - mean(data$temperatura100))*(data$Cant_gasol - mean(data$Cant_gasol)))/(length(data$Cant_gasol)-1)
cov
## [1] 532.1878
cov(data$temperatura100,data$Cant_gasol)
## [1] 532.1878
Sxy <- sum((data$temperatura100)*(data$Cant_gasol)) - (sum(data$temperatura100)*sum(data$Cant_gasol))/length(data$Cant_gasol)
Sxy
## [1] 16497.82
Sxx<-sum((data$temperatura100)^2) - (sum(data$temperatura100)^2)/length(data$Cant_gasol)
Sxx
## [1] 150842.7
Syy<-sum((data$Cant_gasol)^2) - (sum(data$Cant_gasol)^2)/length(data$Cant_gasol)
Syy
## [1] 3564.077
R4<-Sxy/sqrt(Sxx*Syy)
R4
## [1] 0.7115262
shapiro.test(data$temperatura100)
##
## Shapiro-Wilk normality test
##
## data: data$temperatura100
## W = 0.94499, p-value = 0.1038
shapiro.test(data$Cant_gasol)
##
## Shapiro-Wilk normality test
##
## data: data$Cant_gasol
## W = 0.9604, p-value = 0.2817
Asumimos normalidad.
cor(data$temperatura100,data$Cant_gasol)
## [1] 0.7115262
Hay una correlación fuerte.
cor.test(data$temperatura100,data$Cant_gasol)
##
## Pearson's product-moment correlation
##
## data: data$temperatura100 and data$Cant_gasol
## t = 5.5463, df = 30, p-value = 4.983e-06
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.4825569 0.8494640
## sample estimates:
## cor
## 0.7115262
Se rechaza Ho, es decir, p!=0. Hay una relación estadísticamente significativa entre la temperatura para la cual se evapora un 100% y el porcentaje de petroleo crudo que se convierte en gasolina.
R2<-R4^2 * 100
R2
## [1] 50.62695
El 50% de la variabilidad observada en el porcentaje de petroleo crudo que se convierte en gasolina se explica por la temperatura para la cual se evapora un 100% . El 50% de la variabilidad observada en las Cant_gasol se debe a la regresión entre la temperatura para la cual se evapora al 100% y en las Cant_gasol y el 50% restante se debe a otras variables que no han sido incluidas en el estudio.
#lm linear model (y~x)
m4<-lm(data$Cant_gasol ~ data$temperatura100)
m4
##
## Call:
## lm(formula = data$Cant_gasol ~ data$temperatura100)
##
## Coefficients:
## (Intercept) data$temperatura100
## -16.6621 0.1094
summary(m4)
##
## Call:
## lm(formula = data$Cant_gasol ~ data$temperatura100)
##
## Residuals:
## Min 1Q Median 3Q Max
## -14.7584 -6.2783 0.0525 5.1624 17.8481
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -16.66206 6.68721 -2.492 0.0185 *
## data$temperatura100 0.10937 0.01972 5.546 4.98e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 7.659 on 30 degrees of freedom
## Multiple R-squared: 0.5063, Adjusted R-squared: 0.4898
## F-statistic: 30.76 on 1 and 30 DF, p-value: 4.983e-06
y= -16.66206 + 0.10937x
Por cada por cada aumento de 1°C en la temperatura para el cual se evapora al 100% aumenta el porcentaje en gasolina en 0.10927%. Cuando la temperatura para la cual se evapora al 100% es 0, se esperaría que el porcentaje de crudo que se convierte a gasolina fuera de -16.66206% (no tiene sentido).