Ejercicio de entrega 7

Curso: Estadistica Avanzada

Una compañía reconocida en el sector automotriz cuyo objeto es la fabricación de resortes de amortiguadores, quiere explorar nuevos materiales para la elaboración de estas piezas. El material A es el que utilizan actualmente y quieren compararlo contra el material B.

El resorte fabricado con el material A tiene un costo de 50.000 um 
El resorte fabricado con el material B tiene un costo de 30.000 um

Para medir la eficiencia del resorte, se procede a realizar ensayos por fatiga1, después de 1.000 compresiones a una fuerza de 1000𝑘𝑔/ 𝑐𝑚2, es medida la fuerza elástica (ley de hooke). Los estándares indican que al aplicar dicha fuerza al resorte este no debe superar el 5 cm de extensión o compresión, el diámetro del resorte en estado de reposo es de 25 cm. Por temas de costos el muestreo no puede superar el 20% de la producción de un día, la cual es de 100 resortes. El proceso es relativamente nuevo por cual no se tiene datos de los parámetros poblacionales de media y desviación estándar.

Los análisis se tienen que realizar con una confianza del 98%

  1. Calcule los estimadores puntuales de media y desviación estándar de la muestra seleccionada.

  2. ¿Cuál es el material que cumple con las especificaciones? Asuma varianzas desconocidas e iguales, y varianzas desconocidas diferentes.

  3. Plantee una hipótesis por cada tipo de material donde el parámetro de la media será de 25 cm, que puede inferir de estas hipótesis.

  4. Plantee una hipótesis para la diferencia de medias e interprétela.

  5. ¿Recomendaría al fabricante cambiar el tipo de material con el que fabrica los resortes? Argumente su respuesta.

library(readr)
datos<- read_delim("~/SEMESTRE II/Estadistica Avanzada/Semana 7/base_resortes.txt", 
                            "\t", escape_double = FALSE, trim_ws = TRUE)
## Parsed with column specification:
## cols(
##   Resorte_A = col_double(),
##   Resorte_B = col_double()
## )
View(datos)
attach(datos)
class(Resorte_A)
## [1] "numeric"
class(Resorte_B)
## [1] "numeric"

Mediante muestreo aleatorio simple se extrae una muestra del 20% de la producción del día:

set.seed(7)
N<-100
a<-sample(N,20,replace = FALSE)# selecciona en intervalo 1:20
a
##  [1] 42 83 31 92 66 15 90  8 67 88 40 22 47 93 59 12 51 20 94 98
#Extraer los elementos del muestreo de la base
muestra<-datos[sort(a),]#sort=ordenar
View(muestra)
muestra
## # A tibble: 20 x 2
##    Resorte_A Resorte_B
##        <dbl>     <dbl>
##  1      34.2      27.0
##  2      24.0      23.2
##  3      25.8      24.8
##  4      20.3      26.8
##  5      28.9      26.8
##  6      30.8      25.7
##  7      24        27.2
##  8      26.0      27.4
##  9      29.4      25.5
## 10      27.1      23.4
## 11      30.2      25.3
## 12      32.5      24.8
## 13      31.1      24.2
## 14      25.7      25.2
## 15      18.3      24.9
## 16      29.0      25.8
## 17      25.6      22.2
## 18      27.7      24.4
## 19      28.2      23.0
## 20      28.3      26.2

Histograma con estadisticos de la muestra del Resorte A

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.

## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.

## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.

## Warning: Use of `muestra$Resorte_A` is discouraged. Use `Resorte_A` instead.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Histograma con estadisticos de la muestra del Resorte B

## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.

## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.

## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.

## Warning: Use of `muestra$Resorte_B` is discouraged. Use `Resorte_B` instead.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

1. Estimadores en funcion de la muestra del resorte A

Estimador puntual de la media de la muestra del resorte A

xbar_A<-round(mean(muestra$Resorte_A),2)
xbar_A
## [1] 27.36

Estimador puntual de la desviacion de la muestra del resorte A

Des_A<-round(sd(muestra$Resorte_A),2)
Des_A
## [1] 3.87

Estimador puntual de la Varianza de la muestra del resorte A

Var_A<-round(var(muestra$Resorte_A),2)
Var_A
## [1] 14.99

Estimador puntual de la media de la muestra del resorte B

xbar_B<-round(mean(muestra$Resorte_B),2)
xbar_B
## [1] 25.19

Estimador puntual de la desviacion de la muestra del resorte B

Des_B<-round(sd(muestra$Resorte_B),2)
Des_B
## [1] 1.49

Estimador puntual de la Varianza de la muestra del resorte B

Var_B<-round(var(muestra$Resorte_B),2)
Var_B
## [1] 2.23

Resumen de los estimadores puntuales de las muestras de los resortes A y B

Resorte = c("A", "B") 
Media = c(xbar_A, xbar_B)
Desviacion = c(Des_A, Des_B)
Varianza = c(Var_A,Var_B)
resumen <- data.frame(Resorte,Media,Desviacion,Varianza)
resumen
##   Resorte Media Desviacion Varianza
## 1       A 27.36       3.87    14.99
## 2       B 25.19       1.49     2.23

2. Que material cumple con las especificaciones

Primero verificamos si las variable numericas tienen una distribucion Normal

par(mar = c(2, 2, 2, 2))
par(mfrow = c(1, 2))
qqnorm(muestra$Resorte_A, xlab = "", ylab = "",
       main = "Resorte A", col = "firebrick")
qqline(muestra$Resorte_A)
qqnorm(muestra$Resorte_B, xlab = "", ylab = "",
       main = "Resorte B", col = "springgreen4")
qqline(muestra$Resorte_B)

shapiro.test(muestra$Resorte_A)
## 
##  Shapiro-Wilk normality test
## 
## data:  muestra$Resorte_A
## W = 0.96746, p-value = 0.7006
shapiro.test(muestra$Resorte_B)
## 
##  Shapiro-Wilk normality test
## 
## data:  muestra$Resorte_B
## W = 0.96291, p-value = 0.6036

Analisis: El test de shapiro Wilk para el caso de de las dos variables indica con un p valor mayor 0.02, no se rechaza la hipotesis Nula, indicando que los valores de dos variables siguen una distribucion Normal.

Analisis de la varianzas

var.test(x = muestra$Resorte_A,y = muestra$Resorte_B,conf.level = 0.98)
## 
##  F test to compare two variances
## 
## data:  muestra$Resorte_A and muestra$Resorte_B
## F = 6.7322, num df = 19, denom df = 19, p-value = 0.0001204
## alternative hypothesis: true ratio of variances is not equal to 1
## 98 percent confidence interval:
##   2.223784 20.380747
## sample estimates:
## ratio of variances 
##           6.732189

Analisis: El test de Varianza para el caso de de las dos variables indica con un p valor menor 0.02, se rechaza la hipotesis Nula, indicando que los valores no presentan igualdad de la varianzas, no hay homegeneidad de las varianzas.

Se realiza prueba de comparacion de medias para variazas diferentes aplicando prueba T para Varianzas diferentes

t.test(muestra$Resorte_A,mu = 27.36,var.eq = F, conf.level = 0.98)
## 
##  One Sample t-test
## 
## data:  muestra$Resorte_A
## t = 0.0051975, df = 19, p-value = 0.9959
## alternative hypothesis: true mean is not equal to 27.36
## 98 percent confidence interval:
##  25.16582 29.56318
## sample estimates:
## mean of x 
##   27.3645
t.test(muestra$Resorte_B,mu = 25.19,var.eq = F, conf.level = 0.98)
## 
##  One Sample t-test
## 
## data:  muestra$Resorte_B
## t = 0.013486, df = 19, p-value = 0.9894
## alternative hypothesis: true mean is not equal to 25.19
## 98 percent confidence interval:
##  24.34711 26.04189
## sample estimates:
## mean of x 
##   25.1945

Analisis: La Prueba T para dos muestras el p valor es mayor 0.02, con un nivel de confianza del 98% no podemos rechazar la hipotesis nula, con lo que tenemos pruebas estadisticas significativas para poder afirmar que las medias son iguales para el resorte A y para el resorte B.

Con una confianza del 98% podemos asegurar que el intervalo en que se mueve el promedio  del resorte A segun el      t.test esta entre *25.16582* y *29.56318*

Con una confianza del 98% podemos asegurar que el intervalo en que se mueve el promedio  del resorte B segun el      t.test esta entre *24.34711* y *26.04189*

Basados en los estándares que indican que al aplicar dicha fuerza al resorte este no debe superar el 5 cm de extensión o compresión, y que el diámetro del resorte en estado de reposo es de 25 cm. al tener que eleguir uno de los materiales seleccionaria el Material B ya que el intervalo en el que se mueve el promedio de estos resortes son los mas cercanos a los requerimientos.

Intervalo diferencia de medias asumiendo desconocida pero que son iguales

n_est_1<-20
n_est_2<-20
xbar_est_1<-27.36
xbar_est_2<-25.19
dif_medias_1<-xbar_est_1-xbar_est_2
dif_medias_1
## [1] 2.17
D_est_est_1<-3.87
D_est_est_2<-1.49
gl<-n_est_1+n_est_2-2
gl
## [1] 38
t_1<-qt(0.98,gl)
t_1
## [1] 2.126674
ee_dif_medias_1<-sqrt((1/n_est_1)+(1/n_est_2))
ee_dif_medias_1
## [1] 0.3162278
sp<-sqrt(round((((n_est_1-1)*(D_est_est_1^2))+((n_est_2-1)*D_est_est_2^2))/gl,3))
sp
## [1] 2.932235
L_inf_dif_medias_1<-round(dif_medias_1-(t_1*sp*ee_dif_medias_1),3)
L_sup_dif_medias_1<-round(dif_medias_1+(t_1*sp*ee_dif_medias_1),3)
c(L_inf_dif_medias_1,L_sup_dif_medias_1)
## [1] 0.198 4.142
intervaloconfvardes<-matrix(c(round(L_inf_dif_medias_1),round(L_sup_dif_medias_1,3)),ncol=2)
colnames(intervaloconfvardes)<-(c("Limite Inferior","Limite Superior"))
intervaloconfvardes<-as.table(intervaloconfvardes)
intervaloconfvardes
##   Limite Inferior Limite Superior
## A           0.000           4.142

Analisis: Asumiendo varianzaS desconocidaS pero que son iguales, podemos afirmar con una confianza del 98%, que la diferencia de medias muestrales esta entre 0 y 4.142

Intervalo diferencia de medias asumiendo varianzas desconocidas y diferentes

n_esta_1<-20
n_esta_2<-20
xbar_esta_1<-27.36
xbar_esta_2<-25.19
D_est_esta_1<-3.87
D_est_esta_2<-1.49
dif_medias_2<-xbar_esta_1-xbar_esta_2
dif_medias_2
## [1] 2.17
num_gl<-((D_est_esta_1^2/n_esta_1)+(D_est_esta_2^2/n_esta_2))^2
num_gl
## [1] 0.739342
den_gl<-(((D_est_esta_1^2/n_esta_1)^2)/(n_esta_1-1))+(((D_est_esta_2^2/n_esta_2)^2)/(n_esta_2-1))
den_gl
## [1] 0.03016268
gl2<-trunc(num_gl/den_gl)
gl2
## [1] 24
t_2<-round(qt(0.02/2,gl2,lower.tail = FALSE),3)
t_2
## [1] 2.492
ee_dif_medias_2<-sqrt((D_est_esta_1^2/n_esta_1)+(D_est_esta_2^2/n_esta_2))
ee_dif_medias_2
## [1] 0.927281
L_inf_dif_medias_2<-round(dif_medias_2-(t_2*ee_dif_medias_2),3)
L_sup_dif_medias_2<-round(dif_medias_2+(t_2*ee_dif_medias_2),3)
c(L_inf_dif_medias_2,L_sup_dif_medias_2)
## [1] -0.141  4.481
intervaloconf<-matrix(c(round(L_inf_dif_medias_2),round(L_sup_dif_medias_2,3)),ncol=2)
colnames(intervaloconf)<-(c("Limite Inferior","Limite Superior"))
intervaloconf<-as.table(intervaloconf)
intervaloconf
##   Limite Inferior Limite Superior
## A           0.000           4.481

Analisis: Asumiendo varianzas desconocidas y diferentes, podemos afirmar con una confianza del 98% que la diferencia de medias muestrales se va a encontrar entre 0 y 4.481

Intervalo diferencia de medias asumiendo varianza conocidas

miu_A<-27.36
miu_B<-25.19 
dif_medias<-miu_B-miu_A
dif_medias
## [1] -2.17
z_1<-round(qnorm((0.02/2),lower.tail = FALSE),2)
z_1#distribucion de z porque las varianza son conocidas
## [1] 2.33
D_est_A<-3.87
D_est_B<-1.49
n_A<-20
n_B<-20
ee_dif_medias<-sqrt((D_est_A^2/n_A)+(D_est_B^2/n_B))
ee_dif_medias
## [1] 0.927281
L_inf_dif_medias<-round(dif_medias-(z_1*ee_dif_medias),2)
L_sup_dif_medias<-round(dif_medias+(z_1*ee_dif_medias),2)
c(L_inf_dif_medias,L_sup_dif_medias)
## [1] -4.33 -0.01
intervalovarconocida<-matrix(c(round(L_inf_dif_medias),round(L_sup_dif_medias,3)),ncol=2)
colnames(intervalovarconocida)<-(c("Limite Inferior","Limite Superior"))
intervalovarconocida<-as.table(intervalovarconocida)
intervalovarconocida
##   Limite Inferior Limite Superior
## A           -4.00           -0.01

Analisis: Asumiendo varianza conocidas, con una confianza del 98% podemos asegurar que la diferencia de la media muestral esta entre -4.00 y -0.01

3. hipótesis por cada tipo de material donde el parámetro de la media será de 25 cm, que puede inferir de estas hipótesis.

Hipótesis Material del resorte A:
    Hipotesis Nula: El promedio muestral Miu del resorte A =25
    Hipotesis Alterna: El promedio muestral Miu del resorte A ≠ 25
Supuesto: La población se distribuye de manera normal con varianza conocida.
miu_resorteA<-25
datos_Resorte_A<-c(muestra$Resorte_A)
n_resorteA<-length(datos_Resorte_A)
x_bar_resorteA<-round(mean(datos_Resorte_A),2)
x_bar_resorteA
## [1] 27.36
sigma_resorteA<-3.87
alfa1<-0.02


#Cálculo de los estadísticos.
Z_calculado<-round((x_bar_resorteA-miu_resorteA)/(sigma_resorteA/sqrt(n_resorteA)),2)
Z_critico<-round(qnorm(1-(alfa1/2)),4)
c(Z_calculado,Z_critico)
## [1] 2.7300 2.3263
library(DescTools)
## Warning: package 'DescTools' was built under R version 4.0.5
ZTest(datos_Resorte_A,alternative = "two.sided",conf.level = 0.98,sd_pop = 3.87,mu = miu_resorteA )
## 
##  One Sample z-test
## 
## data:  datos_Resorte_A
## z = 2.7324, Std. Dev. Population = 3.87, p-value = 0.006288
## alternative hypothesis: true mean is not equal to 25
## 98 percent confidence interval:
##  25.35138 29.37762
## sample estimates:
## mean of x 
##   27.3645

Analisis: Como se tiene una población con distribución normal y se conoce la varianza que se calculo para este ejercicio es posible emplear el estadístico Z para la prueba de hipótesis.

como el p valor 0.006288 es menor a nuestro nivel de significancia 0.02,  Tenemos evidencia suficiente para          rechazar la hipotesis nula y aceptar la hipotesis alterna, es decir; el valor promedio de los resortes A es          diferente a 25.

De igual manera, el Z calculado es mayor al Z critico, confirmando el rechazo de la hipotesis Nula.

Conclusiones sobre analisis: los resultados de la prueba de hipotesis sugieren que los resortes de tipo presentan una media diferente a 25cm, por lo cual no estaria cumpliendo con los estándares indican que el diámetro del resorte en estado de reposo deber de 25 cm y no debe superar los 5 cm, por lo cual podriamos rechazar este tipo de resorte A.

Hipótesis Material del resorte B:
  Hipotesis Nula: El promedio muestral Miu del resorte B =25
  Hipotesis Alterna: El promedio muestral Miu del resorte B ≠ 25
  
Supuesto: La población se distribuye de manera normal con varianza conocida.
miu_resorteB<-25
datos_Resorte_B<-c(muestra$Resorte_B)
n_resorteB<-length(datos_Resorte_B)
x_bar_resorteB<-round(mean(datos_Resorte_B),2)
x_bar_resorteB
## [1] 25.19
sigma_resorteB<-1.49
alfa2<-0.02


#Cálculo de los estadísticos.
Z_calculadoB<-round((x_bar_resorteB-miu_resorteB)/(sigma_resorteB/sqrt(n_resorteB)),2)
Z_criticoB<-round(qnorm(1-(alfa2/2)),4)
c(Z_calculadoB,Z_criticoB)
## [1] 0.5700 2.3263
ZTest(datos_Resorte_B,alternative = "two.sided",conf.level = 0.98,sd_pop = 1.49,mu = miu_resorteB )
## 
##  One Sample z-test
## 
## data:  datos_Resorte_B
## z = 0.58378, Std. Dev. Population = 1.49, p-value = 0.5594
## alternative hypothesis: true mean is not equal to 25
## 98 percent confidence interval:
##  24.41942 25.96958
## sample estimates:
## mean of x 
##   25.1945

Analisis: Como se tiene una población con distribución normal y se conoce la varianza que se calculo para este ejercicio es posible emplear el estadístico Z para la prueba de hipótesis.

como el p valor 0.5594 es mayor a nuestro nivel de significancia 0.02, No tenemos evidencia suficiente para          rechazar la hipotesis nula , es decir; el valor promedio de los resortes B es igual a 25.

De igual manera, el Z calculado es menor al Z critico, confirmando la aceptacion de la hipotesis Nula.

Conclusiones sobre analisis: los resultados de la prueba de hipotesis sugieren que los resortes de tipo presentan una media igual a 25cm, por lo cual cumpliria con los estándares indican que el diámetro del resorte en estado de reposo es de 25 cm y no debe superar los 5 cm, por lo cual nos quedariamos con este material

3. Hipótesis para la diferencia de medias

             Hipótesis nula:       H0  :  μA - μB = 0
            Hipótesis alternativa: H1  :  μA - μB ≠ 0

Analisis En este caso tenemos un contraste bilateral, ya que nuestra hipótesis nula se encuentra formulada en forma de igualdad. Nos seria util si tenemos la intencion de comparar la media entre dos poblaciones de los resortes, tendriamos dos variables con distribución normal y para las que queremos contrastar la diferencia de sus medias.

¿Recomendaría al fabricante cambiar el tipo de material con el que fabrica los resortes?

Si, de acuerdo a los resultados de las pruebas de hipotesis, de los estadisticos y los intervalos de confianza para la diferencia de las medias, recomendaria al fabricante cambiar el tipo de resorte A, por el resorte B, ya que los valores de la media de estos son muy aproximados a 25 con un 98% de confianza, la desviacion de los datos y la varianza es menor, y intervalo en que se mueve el promedio de los valores del resorte B segun el t.test es mucho menor a los de el resorte A.