Una compañía reconocida en el sector automotriz cuyo objeto es la fabricación de resortes de amortiguadores, quiere explorar nuevos materiales para la elaboración de estas piezas. El material A es el que utilizan actualmente y quieren compararlo contra el material B.
El resorte fabricado con el material A tiene un costo de 50.000 um
El resorte fabricado con el material B tiene un costo de 30.000 um
Para medir la eficiencia del resorte, se procede a realizar ensayos por fatiga1, después de 1.000 compresiones a una fuerza de 1000𝑘𝑔/ 𝑐𝑚2, es medida la fuerza elástica (ley de hooke). Los estándares indican que al aplicar dicha fuerza al resorte este no debe superar el 5 cm de extensión o compresión, el diámetro del resorte en estado de reposo es de 25 cm. Por temas de costos el muestreo no puede superar el 20% de la producción de un día, la cual es de 100 resortes. El proceso es relativamente nuevo por cual no se tiene datos de los parámetros poblacionales de media y desviación estándar.
Los análisis se tienen que realizar con una confianza del 98%
Calcule los estimadores puntuales de media y desviación estándar de la muestra seleccionada.
¿Cuál es el material que cumple con las especificaciones? Asuma varianzas desconocidas e iguales, y varianzas desconocidas diferentes.
Plantee una hipótesis por cada tipo de material donde el parámetro de la media será de 25 cm, que puede inferir de estas hipótesis.
Plantee una hipótesis para la diferencia de medias e interprétela.
¿Recomendaría al fabricante cambiar el tipo de material con el que fabrica los resortes? Argumente su respuesta.
library(readr)
datos<- read_delim("~/SEMESTRE II/Estadistica Avanzada/Semana 7/base_resortes.txt",
"\t", escape_double = FALSE, trim_ws = TRUE)
## Parsed with column specification:
## cols(
## Resorte_A = col_double(),
## Resorte_B = col_double()
## )
View(datos)
attach(datos)
class(Resorte_A)
## [1] "numeric"
class(Resorte_B)
## [1] "numeric"
Mediante muestreo aleatorio simple se extrae una muestra del 20% de la producción del día:
set.seed(7)
N<-100
a<-sample(N,20,replace = FALSE)# selecciona en intervalo 1:20
a
## [1] 42 83 31 92 66 15 90 8 67 88 40 22 47 93 59 12 51 20 94 98
#Extraer los elementos del muestreo de la base
muestra<-datos[sort(a),]#sort=ordenar
View(muestra)
muestra
## # A tibble: 20 x 2
## Resorte_A Resorte_B
## <dbl> <dbl>
## 1 34.2 27.0
## 2 24.0 23.2
## 3 25.8 24.8
## 4 20.3 26.8
## 5 28.9 26.8
## 6 30.8 25.7
## 7 24 27.2
## 8 26.0 27.4
## 9 29.4 25.5
## 10 27.1 23.4
## 11 30.2 25.3
## 12 32.5 24.8
## 13 31.1 24.2
## 14 25.7 25.2
## 15 18.3 24.9
## 16 29.0 25.8
## 17 25.6 22.2
## 18 27.7 24.4
## 19 28.2 23.0
## 20 28.3 26.2
Histograma con estadisticos de la muestra del Resorte A
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.
## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.
## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.
## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Histograma con estadisticos de la muestra del Resorte B
## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.
## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.
## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.
## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Estimador puntual de la media de la muestra del resorte A
xbar_A<-round(mean(muestra$Resorte_A),2)
xbar_A
## [1] 27.36
Estimador puntual de la desviacion de la muestra del resorte A
Des_A<-round(sd(muestra$Resorte_A),2)
Des_A
## [1] 3.87
Estimador puntual de la Varianza de la muestra del resorte A
Var_A<-round(var(muestra$Resorte_A),2)
Var_A
## [1] 14.99
Estimador puntual de la media de la muestra del resorte B
xbar_B<-round(mean(muestra$Resorte_B),2)
xbar_B
## [1] 25.19
Estimador puntual de la desviacion de la muestra del resorte B
Des_B<-round(sd(muestra$Resorte_B),2)
Des_B
## [1] 1.49
Estimador puntual de la Varianza de la muestra del resorte B
Var_B<-round(var(muestra$Resorte_B),2)
Var_B
## [1] 2.23
Resumen de los estimadores puntuales de las muestras de los resortes A y B
Resorte = c("A", "B")
Media = c(xbar_A, xbar_B)
Desviacion = c(Des_A, Des_B)
Varianza = c(Var_A,Var_B)
resumen <- data.frame(Resorte,Media,Desviacion,Varianza)
resumen
## Resorte Media Desviacion Varianza
## 1 A 27.36 3.87 14.99
## 2 B 25.19 1.49 2.23
Primero verificamos si las variable numericas tienen una distribucion Normal
par(mar = c(2, 2, 2, 2))
par(mfrow = c(1, 2))
qqnorm(muestra$Resorte_A, xlab = "", ylab = "",
main = "Resorte A", col = "firebrick")
qqline(muestra$Resorte_A)
qqnorm(muestra$Resorte_B, xlab = "", ylab = "",
main = "Resorte B", col = "springgreen4")
qqline(muestra$Resorte_B)
shapiro.test(muestra$Resorte_A)
##
## Shapiro-Wilk normality test
##
## data: muestra$Resorte_A
## W = 0.96746, p-value = 0.7006
shapiro.test(muestra$Resorte_B)
##
## Shapiro-Wilk normality test
##
## data: muestra$Resorte_B
## W = 0.96291, p-value = 0.6036
Analisis: El test de shapiro Wilk para el caso de de las dos variables indica con un p valor mayor 0.02, no se rechaza la hipotesis Nula, indicando que los valores de dos variables siguen una distribucion Normal.
Analisis de la varianzas
var.test(x = muestra$Resorte_A,y = muestra$Resorte_B,conf.level = 0.98)
##
## F test to compare two variances
##
## data: muestra$Resorte_A and muestra$Resorte_B
## F = 6.7322, num df = 19, denom df = 19, p-value = 0.0001204
## alternative hypothesis: true ratio of variances is not equal to 1
## 98 percent confidence interval:
## 2.223784 20.380747
## sample estimates:
## ratio of variances
## 6.732189
Analisis: El test de Varianza para el caso de de las dos variables indica con un p valor menor 0.02, se rechaza la hipotesis Nula, indicando que los valores no presentan igualdad de la varianzas, no hay homegeneidad de las varianzas.
t.test(muestra$Resorte_A,mu = 27.36,var.eq = F, conf.level = 0.98)
##
## One Sample t-test
##
## data: muestra$Resorte_A
## t = 0.0051975, df = 19, p-value = 0.9959
## alternative hypothesis: true mean is not equal to 27.36
## 98 percent confidence interval:
## 25.16582 29.56318
## sample estimates:
## mean of x
## 27.3645
t.test(muestra$Resorte_B,mu = 25.19,var.eq = F, conf.level = 0.98)
##
## One Sample t-test
##
## data: muestra$Resorte_B
## t = 0.013486, df = 19, p-value = 0.9894
## alternative hypothesis: true mean is not equal to 25.19
## 98 percent confidence interval:
## 24.34711 26.04189
## sample estimates:
## mean of x
## 25.1945
Analisis: La Prueba T para dos muestras el p valor es mayor 0.02, con un nivel de confianza del 98% no podemos rechazar la hipotesis nula, con lo que tenemos pruebas estadisticas significativas para poder afirmar que las medias son iguales para el resorte A y para el resorte B.
Con una confianza del 98% podemos asegurar que el intervalo en que se mueve el promedio del resorte A segun el t.test esta entre *25.16582* y *29.56318*
Con una confianza del 98% podemos asegurar que el intervalo en que se mueve el promedio del resorte B segun el t.test esta entre *24.34711* y *26.04189*
Basados en los estándares que indican que al aplicar dicha fuerza al resorte este no debe superar el 5 cm de extensión o compresión, y que el diámetro del resorte en estado de reposo es de 25 cm. al tener que eleguir uno de los materiales seleccionaria el Material B ya que el intervalo en el que se mueve el promedio de estos resortes son los mas cercanos a los requerimientos.
n_est_1<-20
n_est_2<-20
xbar_est_1<-27.36
xbar_est_2<-25.19
dif_medias_1<-xbar_est_1-xbar_est_2
dif_medias_1
## [1] 2.17
D_est_est_1<-3.87
D_est_est_2<-1.49
gl<-n_est_1+n_est_2-2
gl
## [1] 38
t_1<-qt(0.98,gl)
t_1
## [1] 2.126674
ee_dif_medias_1<-sqrt((1/n_est_1)+(1/n_est_2))
ee_dif_medias_1
## [1] 0.3162278
sp<-sqrt(round((((n_est_1-1)*(D_est_est_1^2))+((n_est_2-1)*D_est_est_2^2))/gl,3))
sp
## [1] 2.932235
L_inf_dif_medias_1<-round(dif_medias_1-(t_1*sp*ee_dif_medias_1),3)
L_sup_dif_medias_1<-round(dif_medias_1+(t_1*sp*ee_dif_medias_1),3)
c(L_inf_dif_medias_1,L_sup_dif_medias_1)
## [1] 0.198 4.142
intervaloconfvardes<-matrix(c(round(L_inf_dif_medias_1),round(L_sup_dif_medias_1,3)),ncol=2)
colnames(intervaloconfvardes)<-(c("Limite Inferior","Limite Superior"))
intervaloconfvardes<-as.table(intervaloconfvardes)
intervaloconfvardes
## Limite Inferior Limite Superior
## A 0.000 4.142
Analisis: Asumiendo varianzaS desconocidaS pero que son iguales, podemos afirmar con una confianza del 98%, que la diferencia de medias muestrales esta entre 0 y 4.142
n_esta_1<-20
n_esta_2<-20
xbar_esta_1<-27.36
xbar_esta_2<-25.19
D_est_esta_1<-3.87
D_est_esta_2<-1.49
dif_medias_2<-xbar_esta_1-xbar_esta_2
dif_medias_2
## [1] 2.17
num_gl<-((D_est_esta_1^2/n_esta_1)+(D_est_esta_2^2/n_esta_2))^2
num_gl
## [1] 0.739342
den_gl<-(((D_est_esta_1^2/n_esta_1)^2)/(n_esta_1-1))+(((D_est_esta_2^2/n_esta_2)^2)/(n_esta_2-1))
den_gl
## [1] 0.03016268
gl2<-trunc(num_gl/den_gl)
gl2
## [1] 24
t_2<-round(qt(0.02/2,gl2,lower.tail = FALSE),3)
t_2
## [1] 2.492
ee_dif_medias_2<-sqrt((D_est_esta_1^2/n_esta_1)+(D_est_esta_2^2/n_esta_2))
ee_dif_medias_2
## [1] 0.927281
L_inf_dif_medias_2<-round(dif_medias_2-(t_2*ee_dif_medias_2),3)
L_sup_dif_medias_2<-round(dif_medias_2+(t_2*ee_dif_medias_2),3)
c(L_inf_dif_medias_2,L_sup_dif_medias_2)
## [1] -0.141 4.481
intervaloconf<-matrix(c(round(L_inf_dif_medias_2),round(L_sup_dif_medias_2,3)),ncol=2)
colnames(intervaloconf)<-(c("Limite Inferior","Limite Superior"))
intervaloconf<-as.table(intervaloconf)
intervaloconf
## Limite Inferior Limite Superior
## A 0.000 4.481
Analisis: Asumiendo varianzas desconocidas y diferentes, podemos afirmar con una confianza del 98% que la diferencia de medias muestrales se va a encontrar entre 0 y 4.481
miu_A<-27.36
miu_B<-25.19
dif_medias<-miu_B-miu_A
dif_medias
## [1] -2.17
z_1<-round(qnorm((0.02/2),lower.tail = FALSE),2)
z_1#distribucion de z porque las varianza son conocidas
## [1] 2.33
D_est_A<-3.87
D_est_B<-1.49
n_A<-20
n_B<-20
ee_dif_medias<-sqrt((D_est_A^2/n_A)+(D_est_B^2/n_B))
ee_dif_medias
## [1] 0.927281
L_inf_dif_medias<-round(dif_medias-(z_1*ee_dif_medias),2)
L_sup_dif_medias<-round(dif_medias+(z_1*ee_dif_medias),2)
c(L_inf_dif_medias,L_sup_dif_medias)
## [1] -4.33 -0.01
intervalovarconocida<-matrix(c(round(L_inf_dif_medias),round(L_sup_dif_medias,3)),ncol=2)
colnames(intervalovarconocida)<-(c("Limite Inferior","Limite Superior"))
intervalovarconocida<-as.table(intervalovarconocida)
intervalovarconocida
## Limite Inferior Limite Superior
## A -4.00 -0.01
Analisis: Asumiendo varianza conocidas, con una confianza del 98% podemos asegurar que la diferencia de la media muestral esta entre -4.00 y -0.01
Hipotesis Nula: El promedio muestral Miu del resorte A =25
Hipotesis Alterna: El promedio muestral Miu del resorte A ≠ 25
miu_resorteA<-25
datos_Resorte_A<-c(muestra$Resorte_A)
n_resorteA<-length(datos_Resorte_A)
x_bar_resorteA<-round(mean(datos_Resorte_A),2)
x_bar_resorteA
## [1] 27.36
sigma_resorteA<-3.87
alfa1<-0.02
#Cálculo de los estadísticos.
Z_calculado<-round((x_bar_resorteA-miu_resorteA)/(sigma_resorteA/sqrt(n_resorteA)),2)
Z_critico<-round(qnorm(1-(alfa1/2)),4)
c(Z_calculado,Z_critico)
## [1] 2.7300 2.3263
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.0.5
ZTest(datos_Resorte_A,alternative = "two.sided",conf.level = 0.98,sd_pop = 3.87,mu = miu_resorteA )
##
## One Sample z-test
##
## data: datos_Resorte_A
## z = 2.7324, Std. Dev. Population = 3.87, p-value = 0.006288
## alternative hypothesis: true mean is not equal to 25
## 98 percent confidence interval:
## 25.35138 29.37762
## sample estimates:
## mean of x
## 27.3645
Analisis: Como se tiene una población con distribución normal y se conoce la varianza que se calculo para este ejercicio es posible emplear el estadístico Z para la prueba de hipótesis.
como el p valor 0.006288 es menor a nuestro nivel de significancia 0.02, Tenemos evidencia suficiente para rechazar la hipotesis nula y aceptar la hipotesis alterna, es decir; el valor promedio de los resortes A es diferente a 25.
De igual manera, el Z calculado es mayor al Z critico, confirmando el rechazo de la hipotesis Nula.
Hipotesis Nula: El promedio muestral Miu del resorte B =25
Hipotesis Alterna: El promedio muestral Miu del resorte B ≠ 25
miu_resorteB<-25
datos_Resorte_B<-c(muestra$Resorte_B)
n_resorteB<-length(datos_Resorte_B)
x_bar_resorteB<-round(mean(datos_Resorte_B),2)
x_bar_resorteB
## [1] 25.19
sigma_resorteB<-1.49
alfa2<-0.02
#Cálculo de los estadísticos.
Z_calculadoB<-round((x_bar_resorteB-miu_resorteB)/(sigma_resorteB/sqrt(n_resorteB)),2)
Z_criticoB<-round(qnorm(1-(alfa2/2)),4)
c(Z_calculadoB,Z_criticoB)
## [1] 0.5700 2.3263
ZTest(datos_Resorte_B,alternative = "two.sided",conf.level = 0.98,sd_pop = 1.49,mu = miu_resorteB )
##
## One Sample z-test
##
## data: datos_Resorte_B
## z = 0.58378, Std. Dev. Population = 1.49, p-value = 0.5594
## alternative hypothesis: true mean is not equal to 25
## 98 percent confidence interval:
## 24.41942 25.96958
## sample estimates:
## mean of x
## 25.1945
Analisis: Como se tiene una población con distribución normal y se conoce la varianza que se calculo para este ejercicio es posible emplear el estadístico Z para la prueba de hipótesis.
como el p valor 0.5594 es mayor a nuestro nivel de significancia 0.02, No tenemos evidencia suficiente para rechazar la hipotesis nula , es decir; el valor promedio de los resortes B es igual a 25.
De igual manera, el Z calculado es menor al Z critico, confirmando la aceptacion de la hipotesis Nula.
Hipótesis nula: H0 : μA - μB = 0
Hipótesis alternativa: H1 : μA - μB ≠ 0
Analisis En este caso tenemos un contraste bilateral, ya que nuestra hipótesis nula se encuentra formulada en forma de igualdad. Nos seria util si tenemos la intencion de comparar la media entre dos poblaciones de los resortes, tendriamos dos variables con distribución normal y para las que queremos contrastar la diferencia de sus medias.