Primero

Suponga que se estudia la compra de una nueva maquina para una empresa. Se comprara la maquina si la proporción de la producción que necesita ser reprocesados por tener defectos es inferior al 5 %. Se examina una muestra de 40 artículos construidos por la maquina y 3 necesitan ser reprocesados. ¿Que decisión se toma? ( Se compra o no la maquina?)

Ho:p≥0,05 Ha:p<0,05

prop.test(3,40, conf.level = 0.95)$conf.int
## [1] 0.01957186 0.21476152
## attr(,"conf.level")
## [1] 0.95
z=(3/40-0.05)/(sqrt(0.05*(1-0.05)/40))

prop.test(3,40,0.05,alternative="less")
## Warning in prop.test(3, 40, 0.05, alternative = "less"): Chi-squared
## approximation may be incorrect
## 
##  1-sample proportions test with continuity correction
## 
## data:  3 out of 40, null probability 0.05
## X-squared = 0.13158, df = 1, p-value = 0.6416
## alternative hypothesis: true p is less than 0.05
## 95 percent confidence interval:
##  0.0000000 0.1894048
## sample estimates:
##     p 
## 0.075

Como no se rechaza la hipótesis se asume que Ho es verdad,por lo que no se compra la máquina.

Segundo

Suponga que una empresa desarrolla un curso de entrenamiento para sus empleados, formando dos grupos y aplicándoles dos métodos distintos de entrenamiento. El primer grupo lo componen 36 empleados que obtuvieron un puntaje promedio de 6 ( en escala de 0 a 10 puntos) y una desviación estándar de 4 puntos y el segundo grupo de 40 empleados cuyo puntaje promedio fue de 8.2 y una desviación de 4.3. Se puede afirmar que el método aplicado al segundo grupo es superior al aplicado al primero? Que supuestos debe de tener en cuenta?

Ho:E1≥E2 Ha:E1<E2

mx1=6
mx2=8.2
sx1=4
sx2=4.3
n1=36
n2=40

qt(c(0.05),n1+n2-2)
## [1] -1.665707
sp2=((n1-1)*sx1+(n2-1)*sx2^2)/(n1+n2-2)
(sx1^2)/(sx2^2)
## [1] 0.8653326
qf(c(0.025,0.975),35,39)
## [1] 0.5161628 1.9148067
t=(mx1-mx2)/sqrt(sp2*(1/n1+1/n2))
cat("valor de t:",t,"/n")
## valor de t: -2.807267 /n

Se rechaza el Ho, asumiendo que la alterna es verdadera. El segundo entrenamiento si es mejor que el primero, para ello, se debe tener en cuenta si se tiene distribución normal, que las varianzas son diferentes, identificar si los grupos están relacionados o no.

Tercer

Los ingenieros de una ensambladora de automóviles requieren decidir sobre cuál de dos de las marcas de neumáticos deben comprar. La marca FB o la marca KT. Con el fin de tomar una decisión basada en evidencias estadísticas, deciden realizar un experimento en el que usan 12 neumáticos de cada marca. Los neumáticos se utilizan hasta su terminación. Los resultados obtenidos son los siguientes:

Marca FB: 41.8 41.6 31.5 48.7 40.8 31.2 36.5 36.2 32.8 36.3 38.6 30.5 Marca KT: 40.5 38.4 44.0 34.9 44.0 44.7 44.0 47.1 39.8 43.9 44.2 40.2

Cuál marca de neumáticos recomendaría comprar. Justifique su respuesta. Suponga que la distancia recorrida por un neumático se distribuye aproximadamente normal y un α = 0,05.

Ho:FB≥kT Ha:FB<KT Hipótesis de varianzas Ho:FB≠KT Ha:FB=KT

FB=c (41.8, 41.6, 31.5, 48.7, 40.8, 31.2, 36.5, 36.2, 32.8, 36.3, 38.6, 30.5)
KT=c (40.5, 38.4, 44.0, 34.9, 44.0, 44.7, 44.0, 47.1, 39.8, 43.9, 44.2, 40.2)
var.test(FB,KT)
## 
##  F test to compare two variances
## 
## data:  FB and KT
## F = 2.537, num df = 11, denom df = 11, p-value = 0.1379
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.7303443 8.8127611
## sample estimates:
## ratio of variances 
##           2.536996
t.test(FB,KT, alternative="two.sided", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  FB and KT
## t = -2.6721, df = 22, p-value = 0.01392
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -8.762213 -1.104454
## sample estimates:
## mean of x mean of y 
##  37.20833  42.14167
t.test(FB,KT, alternative="less", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  FB and KT
## t = -2.6721, df = 22, p-value = 0.006961
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -1.763063
## sample estimates:
## mean of x mean of y 
##  37.20833  42.14167

La hipótesis nula se rechaza porque el p es muy pequeño respecto a alfa, entonces,es mejor comprar la marca KT teniendo en cuenta que tiene mejor rendimiento. Con respecto a la varianza, son diferentes.

Cuarto

Un ingeniero desea establecer si existen diferencias entre dos métodos diferentes de realizar el ensamble de una casa prefabricada. Para comprobarlo recoge información de ambos métodos que se presentan a continuación:

Procedimiento estándar: 32, 37, 35, 28, 41, 44, 35, 31, 34. Nuevo procedimiento: 35, 31, 29, 25, 34, 40, 27, 32, 31.

Presentan los datos suficiente evidencia estadística para afirmar que el nuevo método es más eficiente que el estándar? (utilice un α = 0,05).

Ho: Est≥Nue Ha: Est<Nue

Hipótesis de varianzas Ho:Est≠Nue Ha:Est=Nue

Est=c (32, 37, 35, 28, 41, 44, 35, 31, 34)
Nue=c ( 35, 31, 29, 25, 34, 40, 27, 32, 31)
var.test(Est,Nue)
## 
##  F test to compare two variances
## 
## data:  Est and Nue
## F = 1.2205, num df = 8, denom df = 8, p-value = 0.7849
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2753114 5.4109136
## sample estimates:
## ratio of variances 
##           1.220527
t.test(Est,Nue, alternative="two.sided", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  Est and Nue
## t = 1.6495, df = 16, p-value = 0.1185
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.045706  8.379039
## sample estimates:
## mean of x mean of y 
##  35.22222  31.55556
t.test(Est,Nue, alternative="less", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  Est and Nue
## t = 1.6495, df = 16, p-value = 0.9407
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##     -Inf 7.54762
## sample estimates:
## mean of x mean of y 
##  35.22222  31.55556

No rechazo Ho, por lo que asumo que es verdadera; los datos no son suficientes evidencia para decidir.Las varianzas son diferentes.

Quinto

Un director de un gimnasio quiere determinar si un instructor de ejercicio debe ser contratado o no para su campaña estrella “Reducción de peso”, Para tomar la decisión le dice que pruebe con 16 de las personas que habitualmente concurren tomadas al azar. Los datos que se tomaron antes (x1) y después (x2) de haber realizado un mes de ejercicios son los siguientes:

id 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 x1 104 89 84 106 90 96 79 90 85 76 91 82 100 89 121 72 x2 98 85 85 103 88 95 79 90 82 76 89 81 99 86 111 70

Emplee y realice las pruebas de hipótesis a un nivel de significancia del 0.01 para determinar si el programa que ofrece el nuevo instructor es eficaz. Suponga que la variable peso se distribuye aproximadamente normal.

Ho:x1≤x2 Ha:x1>x2

Hipótesis de varianzas Ho:x1≠x2 Ha:x1=x2

x1=c (32, 37, 35, 28, 41, 44, 35, 31, 34)
x2=c (35, 31, 29, 25, 34, 40, 27, 32, 31)
var.test(x1,x2)
## 
##  F test to compare two variances
## 
## data:  x1 and x2
## F = 1.2205, num df = 8, denom df = 8, p-value = 0.7849
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2753114 5.4109136
## sample estimates:
## ratio of variances 
##           1.220527
t.test(x1,x2, alternative="two.sided", mu=0, paired=TRUE,conf.level=0.99)$conf.int
## [1] -0.4428268  7.7761601
## attr(,"conf.level")
## [1] 0.99
t.test(x1,x2, alternative="greater", mu=0, paired=TRUE,conf.level=0.99)$conf.int
## [1] 0.1192428       Inf
## attr(,"conf.level")
## [1] 0.99

No rechazo la Ho por lo que se asume que el programa no es efectivo.Las varianzas son diferentes,

Sexto

Se realizan pruebas de un nuevo lector láser manual para uso en inventarios y el lector utilizado actualmente, con el fin de decidir si se adquiere el primero. Se obtienen los datos siguientes sobre el número de códigos de barra de 7 pulgadas que pueden leerse por segundo. Sea X1: número de códigos leído por segundo con el dispositivo nuevo y X2 el correspondiente al dispositivo antiguo.

n1 = 61 ; x¯1 = 40 ; s^2 = 24,9 n2 = 61 ; x¯2 = 29 ; s^2 = 22,7

De acuerdo con la información suministrada, es posible preferir alguno de ellos?. En caso de poderlo realizar con cual se quedaría? Justifique su respuesta. En cada caso determine las pruebas de hipótesis, el estadístico de prueba apropiado, el valor − p obtenido y las conclusiones resultantes.

Ho:n1-n2=0 Ha:n1-n2>0

m1=40
m2=29
s1=24.9
s2=22.7
n1x=61
n2x=61

qt(c(0.025,0.975),n1x+n2x-2)
## [1] -1.97993  1.97993
sp2=((n1x-1)*s1+(n2x-1)*s2^2)/(n1x+n2x-2)

(s1^2)/(s2^2)
## [1] 1.203225
qf(c(0.025,0.975),60,60)
## [1] 0.5999553 1.6667908
t=(m1-m2)/sqrt(sp2*(1/n1x+1/n2x))
cat("valor de t:",t)
## valor de t: 3.696446
t_stat <-3.696446  
df <- n1x + n2x - 2  
p_value <- 2 * pt(-abs(t_stat), df)
p_value <- pt(t_stat, df) 
cat("valor de p_value:",p_value)
## valor de p_value: 0.9998346

No se rechaza la Ho,por lo que no hay información suficiente para afirmar que un láser es mejor que el otro. ## Séptimo

Un empresario registro el número de artículos producidos durante 10 días, para un grupo de 15 obreros que trabajaban con base en un salario fijo (Grupo 1). El industrial introdujo un plan de incentivos para otros 15 obreros y registro su producción durante otros 10 días (Grupo 2). El número de artículos producidos por cada uno de los grupos fue :

G1 75 76 74 80 72 78 76 73 72 75 G2 86 78 86 84 81 79 78 84 88 80

Suponiendo que los salarios pagados a cada grupo son equivalentes. Se puede concluir que el plan de incentivos es efectivo?

Ho: G1≥G2 Ha: G1<G2 Hipótesis de varianzas Ho:G1≠G2 Ha:G1=G2

G1=c (75,76,74,80,72,78,76,73,72,75)
G2=c (86,78,86,84,81,79,78,84,88,80)
var.test(G1,G2)
## 
##  F test to compare two variances
## 
## data:  G1 and G2
## F = 0.4892, num df = 9, denom df = 9, p-value = 0.3018
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.121511 1.969527
## sample estimates:
## ratio of variances 
##          0.4892027
t.test(G1,G2, alternative="two.sided", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  G1 and G2
## t = -5.1719, df = 18, p-value = 6.409e-05
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.26537  -4.33463
## sample estimates:
## mean of x mean of y 
##      75.1      82.4
t.test(G1,G2, alternative="less", mu=0, paired=FALSE, var.equal=TRUE,conf.level=0.95)
## 
##  Two Sample t-test
## 
## data:  G1 and G2
## t = -5.1719, df = 18, p-value = 3.204e-05
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf -4.852437
## sample estimates:
## mean of x mean of y 
##      75.1      82.4

Se rechaza la Ho, aceptando Ha como verdadera, entonces, se puede decir que el incentivo fue efectivo.Variazas diferentes.

Octavo

En una muestra de 200 clientes, el 20 % (v) indica una preferencia por tamaño especial de pizza. Con posterioridad a una campaña publicitaria realizada en radio y televisión promoviendo dicho producto (p), se selecciono una muestra de igual tamaño. En esta ultima muestra el 22 % de los clientes indico preferencia por el producto. De acuerdo con estos resultados y un nivel de significancia del 5 % , podría decirse que la campaña publicitaria no fue efectiva?

Ho:v≤p Ha:v>p

prop.test(c(40,44),c(200,200))$conf.int
## [1] -0.10480688  0.06480688
## attr(,"conf.level")
## [1] 0.95
success_after <- 0.22 * 200
n_after <- 200
success_before <- 0.20 * 200
n_before <- 200
test_result <- prop.test(c(success_after, success_before), n=c(n_after, n_before), correct = FALSE, alternative = "greater")
p_value <- test_result$p.value
cat("valor de p_value:",p_value)
## valor de p_value: 0.3117031

Por los intervalos obtenidos, las proporciones son iguales por lo que no se puede afirmar la efectividad de la campaña publicitaria.Con respecto al valor p, no hay evidencia suficiente para rechazar Ho.

Noveno

Los siguientes son los datos de las horas hombre que se pierden en promedio por accidentes en 10 plantas industriales antes (A) y después (D) de la implantación de un programa de seguridad industrial:

id 1 2 3 4 5 6 7 8 9 10 A 45 73 46 124 30 57 83 34 26 17 D 36 60 44 119 35 51 77 29 24 11

Utilice un nivel de significancia de 0.05 para probar si el programa de seguridad implantado es eficaz. Suponga que esta variable se distribuye aproximadamente normal.

Ho:A≤D Ha:A>D Hipótesis de varianzas Ho:A≠D Ha:A=D

A=c (45, 73, 46, 124, 30, 57, 83, 34, 26, 17)
D=c (36, 60, 44, 119, 35, 51, 77, 29, 24, 11)
var.test(A,D)
## 
##  F test to compare two variances
## 
## data:  A and D
## F = 1.0826, num df = 9, denom df = 9, p-value = 0.9078
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##  0.2689098 4.3586599
## sample estimates:
## ratio of variances 
##           1.082629
t.test(A,D,   alternative = "greater", paired = TRUE,conf.level = 0.95)
## 
##  Paired t-test
## 
## data:  A and D
## t = 3.2796, df = 9, p-value = 0.004767
## alternative hypothesis: true mean difference is greater than 0
## 95 percent confidence interval:
##  2.161215      Inf
## sample estimates:
## mean difference 
##             4.9

Rechazo la Ho, es decir, que al aceptar la Ha como verdadera, se evidencia como el plan de seguridad ha sido efectivo reduciendo las muertes.Varianzas diferentes.

Décimo

La compañía de dulces Mars publica en su sitio web información relacionada con los porcentajes de los distintos colores de sus dulces M&M para la variedad de chocolate con leche.

Color cont. en la bolsa café amarillo rojo azul naranja verde Porcentaje ( %) 13 14 13 24 20 16

Se realiza una verificación mediante el conteo delos dulces contenidos en una bolsa de 14 onzas de dulces M&M, obteniendo los siguientes resultados: 70 duces cafés, 72 amarillos, 61 rojos, 118 azules, 108 naranjas y 85 verdes.Se podria afirmar que los datos anteriores respaldan la información suministrada por la compañía en su sitio web? Sustente su respuesta.

Ho:esp=obs Ha:esp≠obs Hipótesis de varianzas Ho:esp≠obs Ha:esp=obs

probabilidades_esperadas <- c(0.13, 0.14, 0.13, 0.24, 0.20, 0.16)
frecuencias_esperadas <-c(13,14,13,24,20,16)
frecuencias_observadas <- c(70, 72, 61, 118, 108, 85)
resultado_chi_cuadrado <- chisq.test(frecuencias_observadas, p = probabilidades_esperadas)
print(resultado_chi_cuadrado)
## 
##  Chi-squared test for given probabilities
## 
## data:  frecuencias_observadas
## X-squared = 1.2468, df = 5, p-value = 0.9403
var.test(frecuencias_observadas,frecuencias_esperadas)
## 
##  F test to compare two variances
## 
## data:  frecuencias_observadas and frecuencias_esperadas
## F = 26.027, num df = 5, denom df = 5, p-value = 0.002749
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##    3.641961 185.997777
## sample estimates:
## ratio of variances 
##           26.02685

Como el valor p supera el 5%, se asume Ho como verdadera. Es decir, que los observados serán igual a los esperados. En las varianzas, rechazo la Ho, aceptando que las varianzas son iguales.

Once

En una línea de producción los artículos se inspeccionan en forma periódica con el fin de detectar defectos. La siguiente secuencia de artículos defectuosos (D) y no defectuosos (N) corresponde a la producción de uno de los turnos.

D D N N N N D N N D D N N N N N D D D D N N D N N N N D N D N N N N N N D N N N D D N N N N N N D N D N N N N D D D D D N D D N N N N N N N D D D D D D D D D N N N N N N D D N

Se puede afirmar que los datos no presentan patrón alguno y que la generación de artículos defectuosos se debe al azar? . Utilice un α = 0,05.

Ho: Artículos no al azar Ha: Artículos al azar

install.packages("randtests")
## Installing package into 'C:/Users/sarha/AppData/Local/R/win-library/4.3'
## (as 'lib' is unspecified)
## package 'randtests' successfully unpacked and MD5 sums checked
## 
## The downloaded binary packages are in
##  C:\Users\sarha\AppData\Local\Temp\RtmpIrGNPi\downloaded_packages
library(randtests)
w <- c("D", "D", "N", "N", "N", "N", "D", "N", "N", "D", "D", "N", "N", "N", "N", "N", "D", "D", "D", "D", "N", "N", "D", "N", "N", "N", "N", "D", "N", "D", "N", "N", "N", "N", "N", "N", "D", "N", "N", "N", "D", "D", "N", "N", "N", "N", "N", "N", "D", "N", "D", "N", "N", "N", "N", "D", "D", "D", "D", "N", "D", "D", "N", "N", "N", "N", "N", "N", "N", "D", "D", "D", "D", "D", "D", "D", "D", "D", "N", "N", "N", "N", "N", "N", "D", "D", "N")

rachas <- as.numeric(w == "N")
rachas
##  [1] 0 0 1 1 1 1 0 1 1 0 0 1 1 1 1 1 0 0 0 0 1 1 0 1 1 1 1 0 1 0 1 1 1 1 1 1 0 1
## [39] 1 1 0 0 1 1 1 1 1 1 0 1 0 1 1 1 1 0 0 0 0 1 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0
## [77] 0 0 1 1 1 1 1 1 0 0 1
runs.test(rachas,alternative = "left.sided",threshold = 0.5,pvalue = "exact",plot=F)
## 
##  Runs Test
## 
## data:  rachas
## statistic = -2.8158, runs = 30, n1 = 53, n2 = 34, n = 87, p-value =
## 0.003441
## alternative hypothesis: trend

Cómo p es menor que el alfa de 0,05, se rechaza la Ho, por lo que se acepta que la generación de artículos es al azar.

Doce

En una planta ensambladora de camiones la supervisión diaria de las soldaduras generó la siguiente información : Número de soldaduras Turno Alta calidad Moderada calidad Baja calidad

           Día                            470                 191              42
          Tarde                           445                 171              28
          Noche                           257                 129              17
          

¿Se puede concluir que la calidad varia con los turnos?, en otras palabras se puede concluir que la calidad de las soldaduras es independiente de los turnos? . Utilice un nivel de significancia α = 0,05.

Ho: Calidad no varía con los turnos. Ha: Calidad varía con los turnos.

m=c(470,445,257,191,171,129,42,28,17)
m=as.table(matrix(m,nrow=3))
rownames(m)=c("Día", "Tarde", "Noche")
colnames(m)=c("Alta", "Modereda","Baja")
chisq.test(m)
## 
##  Pearson's Chi-squared test
## 
## data:  m
## X-squared = 6.4001, df = 4, p-value = 0.1712

Se asume que la Ho es verdad,es decir, que la calidad no varía con los turnos.

Trece

Los siguientes datos corresponde a las notas obtenidas por un grupo de estudiantes de la asignatura Matemáticas Fundamentales. Si la distribución de los datos es normal, podría afirmar que la prueba realizada es una prueba normalizada. En caso contrario serviría para estudiar problemas relacionados con su aprendizaje. Para un α = 0; 05, se podría afirmar que los datos proceden de una distribución normal? . Si se requiere realizar una prueba de hipótesis sobre la media de la nota Ho : µ ≤ 3,3 vs Ha : µ > 3,3, ¿Que prueba se realizaría?

3.4, 2.8, 4.2, 2.1, 2.8, 2.4, 3.5, 4.2, 3.1, 4.1, 2.4, 3.4, 4.1, 4.0, 2.4, 4.1, 3.4, 4.4, 3.8, 3.7, 2.2, 3.6, 2.3, 3.7, 2.8, 4.1, 2.3, 4.6, 4.6, 5.2, 2.4, 2.4, 2.7, 3.8, 4.6, 4.4, 4.2, 4.4, 2.4, 3.3, 3.8, 2.9, 3.1, 2.7, 3.6, 3.8, 4.4, 3.9, 2.8, 3.7

Ho:Distribución no normal. Ha:Distribución normal.

Ho : µ ≤ 3,3 Ha : µ > 3,3

notas <- c(3.4, 2.8, 4.2, 2.1, 2.8, 2.4, 3.5, 4.2, 3.1, 4.1, 2.4, 3.4, 4.1, 4.0, 2.4, 4.1, 3.4, 4.4,
           3.8, 3.7, 2.2, 3.6, 2.3, 3.7, 2.8, 4.1, 2.3, 4.6, 4.6, 5.2, 2.4, 2.4, 2.7, 3.8, 4.6, 4.4,
           4.2, 4.4, 2.4, 3.3, 3.8, 2.9, 3.1, 2.7, 3.6, 3.8, 4.4, 3.9, 2.8, 3.7)

resultado_shapiro_wilk <- shapiro.test(notas)
print(resultado_shapiro_wilk)
## 
##  Shapiro-Wilk normality test
## 
## data:  notas
## W = 0.95071, p-value = 0.03649
t.test(notas)
## 
##  One Sample t-test
## 
## data:  notas
## t = 30.621, df = 49, p-value < 2.2e-16
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
##  3.232933 3.687067
## sample estimates:
## mean of x 
##      3.46

La muestra si se distribuye normal, teniendo en cuenta que el p-value de la prueba Shapiro es menor a alfa.Se acepta la Ha.

Podría utilizarse una prueba de diferencia de medias o t student para resolver la hipótesis de las medias.De lo que se obtuvo que se acepta la Ha, la media es menor a 3.3.