Taller Capitulos 2 y 4

Capítulo 2: Estadística Descriptiva.

Ejercicio 17.

En una empresa que fabrica y vende equipo para fotocopiado utilizan como un indicador importante de la calidad en el servicio posventa, el tiempo de respuesta a solicitudes de apoyo técnico debido a fallas en losequipos. Para problemas mayores, en cierta zona del país se estableció como meta que la respuesta se dé en un máximo de 6 horas hábiles; es decir, de que habla el cliente solicitando apoyo, y que si el problema se clasifica como grave no deben pasar más de 6 horas hábiles para que un técnico acuda a resolver el problema. A continuación se aprecian los tiempos de respuesta en horas para los primeros nueve meses del año (65 datos).

Datos		Datos		Datos
1	5.0	23	2.0	45	1.7
2	5.4	24	5.4	46	3.2
3	7.1	25	2.9	47	6.8
4	7.0	26	5.3	48	7.0
5	5.5	27	7.4	49	5.4
6	4.4	28	5.1	50	5.6
7	5.4	29	6.9	51	4.5
8	6.6	30	7.5	52	6.5
9	7.1	31	3.2	53	4.1
10	4.2	32	3.9	54	7.5
11	4.1	33	5.9	55	6.8
12	3.0	34	3.6	56	4.3
13	5.7	35	4.0	57	5.9
14	6.7	36	2.3	58	3.1
15	6.8	37	8.9	59	8.3
16	4.7	38	5.8	60	5.4
17	7.1	39	5.8	61	4.7
18	3.2	40	6.4	62	6.3
19	5.7	41	7.7	63	6.0
20	4.1	42	3.9	64	3.1
21	5.5	43	5.8	65	4.8
21	7.9	44	5.9	–	—

a)Calcule las medidas de tendecia central y con base en estas ¿cree que se cumple con la meta?

data<-c(5.0,5.4,7.1,7.0,5.5,4.4,5.4,6.6,7.1,4.2,4.1,3.0,5.7,6.7,6.8,4.7,7.1,3.2,5.7,4.1,5.5,7.9,2.0,5.4,2.9,5.3,7.4,5.1,6.9,7.5,3.2,3.9,5.9,3.6,4.0,2.3,8.9,5.8,5.8,6.4,7.7,3.9,5.8,5.9,1.7,3.2,6.8,7.0,5.4,5.6,4.5,6.5,4.1,7.5,6.8,4.3,5.9,3.1,8.3,5.4,4.7,6.3,6.0,3.1,4.8)
xbardata<-mean(data)
xbardata

## [1] 5.366154

meddata<-median(data)
meddata

## [1] 5.5

vardata<-var(data)
vardata

## [1] 2.619462

sddata<-sd(data)
sddata

## [1] 1.618475

Con los resultados obtenidos podemos concluir que los limites no son sobrepasados y por tanto se cumple la meta que se propuso.

b)Aplique la regla empirica, interprete y diga que tan bien se cumple la meta

c)Haga un histograma e interprete sus aspectos mas relevantes

hist(data)

Como se puede observar, existe mucha variabilidad y esta un poco descentrada el proceso estudiado.

d)A partir del analisis que se ha realizado, ¿que recomendaciones daria para ayudar a cumplir mejor la meta?
Se podria organizar de tal forma que los problemas que son considerados graves se los resuelva en menor tiempo.

Ejercicio 18.

Los siguientes datos representan las horas caídas de equipos por semana en tres líneas de producción.

SEMANA	LINEA 1	LINEA 2	LINEA 3	SEMANA	LINEA 1	LINEA 2	LINEA 3
1	7.7	6.6	7.5	14	6.3	6.5	8.5
2	6.8	5.2	8.1	15	7.8	7.7	8.0
3	8.5	7.2	6.2	16	6.7	7.4	7.7
4	8.6	9.2	7.4	17	7.3	6.1	7.5
5	5.7	6.7	8.2	18	5.7	6.2	8.3
6	7.9	6.2	6.0	19	6.2	7.3	7.7
7	8.1	7.1	8.2	20	7.3	6.9	7.0
8	7.6	8.1	8.1	21	5.0	6.1	6.5
9	7.1	6.4	6.7	22	5.0	6.9	6.2
10	7.3	6.3	8.0	23	5.4	8.4	6.0
11	7.8	8.2	8.1	24	7.5	5.0	6.1
12	6.1	8.4	8.1	25	6.0	7.4	5.8
13	6.4	7.4	7.0	—	—	—	—

a)Analice los datos para cada linea y anote las principales caracteristicas de la distribucion de los datos

##LINEA 1
linea1<-c(7.7,6.8,8.5,8.6,5.7,7.9,8.1,7.6,7.1,7.3,7.8,6.1,6.4,6.3,7.8,6.7,7.3,5.7,6.2,7.3,5.0,5.0,5.4,7.5,6.0)
hist(linea1)

##LINEA 2
linea2<-c(6.6,5.2,7.2,9.2,6.7,6.2,7.1,8.1,6.4,6.3,8.2,8.4,7.4,6.5,7.7,7.4,6.1,6.2,7.3,6.9,6.1,6.9,8.4,5.0,7.4)
hist(linea2)

##LINEA3
linea3<-c(7.5,8.1,6.2,7.4,8.2,6.0,8.2,8.1,6.7,8.0,8.1,8.1,7.0,8.5,8.0,7.7,7.5,8.2,7.7,7.0,6.5,6.2,6.0,6.1,5.8)
hist(linea3)

##Linea1
xbarlinea1

## [1] 6.872

medlinea1

## [1] 7.1

sdlinea1

## [1] 1.1021

varlinea1

## [1] 1.1021

##Linea2
xbarlinea2

## [1] 6.996

medlinea2

## [1] 6.9

sdlinea2

## [1] 1.001233

varlinea2

## [1] 1.001233

##Linea3
xbarlinea3

## [1] 7.312

medlinea3

## [1] 7.5

sdlinea3

## [1] 0.7702667

varlinea3

## [1] 0.7702667

Podemos notar que las lineas 1 y 2 son muy parecias en lo que respecta a la media y mediana, sin embargo su desviacion estandar es diferente. Por lo cual en base a las desviaciones estandar podemos decir que la linea 1 tiene menos control, por otro lado las demas lineas tienen mas caidas de produccion.

b)Compare las tres lineas ¿Nota alguna diferencia importante?
Las lineas 1 y 3 tienen caidas parecidas, en cambio la linea 2 tiene caidas casi iguales.

Capítulo 4: Elementos de inferencia Estadistica.

Ejercicio 26.

Se tiene dos proveedores de una pieza metalica, cuyo diametro ideal o valor objetivo es igual a 20.25 cm. Se toman dos muestras de 14 piezas a cada proveedor y los datos obtenidos se muestran a continuacion

Proveedor	Diametros x Proveedor
1	21.38, 20.13, 19.12, 19.85, 20.54, 18.00, 22.24, 21.94, 19.07, 18.60, 21.89, 22.60, 18.10, 19.25
2	21.51, 22.22, 21.49, 21.91, 21.52, 22.06, 21.51, 21.29, 22.71, 22.65, 21.53, 22.22, 21.92, 20.82

a)Pruebe la hipotesis de igualdad de los diametros de los proveedores en cuanto a sus medias

Consideramos nuestra prueba de hipotesis \[H_0:\mu_1=\mu_2\] vs \[H_0:\mu_1\neq \mu_2\]

prod1<-c(21.38, 20.13, 19.12, 19.85, 20.54,18.00, 22.24, 21.94, 19.07, 18.60,21.89, 22.60, 18.10, 19.25)
prod2<-c(21.51, 22.22, 21.49, 21.91, 21.52,22.06, 21.51, 21.29, 22.71, 22.65,21.53, 22.22, 21.92, 20.82)
t.test(prod1, prod2,alternative = "two.sided",paired = T)

## 
##  Paired t-test
## 
## data:  prod1 and prod2
## t = -3.3291, df = 13, p-value = 0.005435
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.6677495 -0.5679648
## sample estimates:
## mean of the differences 
##               -1.617857

Considerando un \(\alpha=0.05\), para la comparacion de medias se utilizo el test t, que nos dio como resultado un \(p-valor=0.005435\), por lo tanto podemos rechazar la hipotesis nula de igualdad y asumir cada proveedor tiene media diferente.

b)Pruebe la hipotesis de igualdad de varianzas.

t.test(prod1, prod2, var.equal=T)

## 
##  Two Sample t-test
## 
## data:  prod1 and prod2
## t = -3.6262, df = 26, p-value = 0.001229
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -2.5349395 -0.7007748
## sample estimates:
## mean of x mean of y 
##  20.19357  21.81143

De igual manera considerando \(\alpha=0.05\), para la comparacion de varianza se utilizo el test t, que nos dio como resultado un \(p-valor=0.001229\) podemos rechazar la hipotesis nula de igualdad de varianzas y decir que cada proveedor tiene una varianza diferente.

c)Si las especificaciones para el diametro son 20.25 mm \(\pm\) 2.25 mm ¿cual proveedoor produce menos piezas defectuosas?

Notemos que los valores en los que se debe encontrar las piezas son

## [1] 18.0 22.5

y los valores en los que se encuentran los proveedores 1 y 2 son

## [1] 17.68619 22.70095

## [1] 21.53206 22.09080

respectivamente.
Por lo tanto podemos notar que el primer proveedor produce menos piezas defectuosas.

d)¿Con cual proveedor se quedaria usted?
Con el primer proveedor, puesto que este produce menos piezas defectuosas.

Ejercicio 28.

Se realiza un estudio para comparar dos tratamientos que se aplicaran a frijoles crudos con el objetivo de reducir el tiempo de coccion. Un tratamiento (T1) es a base de bicarbonato de sodio; mientras que el otro (T2), se realiza con cloruro de sodio o sal comun. La variable de respuesta es el tiempo de coccion en minutos. Se hacen siete replicas. Los datos se muestran en la siguiente tabla:

Tratamiento	Minutos
1	76 85 74 78 82 75 82
2	57 67 55 64 61 63 63

a)Formule la hipotes para probar la igualdad de medias de los tratamientos

T1<-c(76, 85, 74, 78, 82, 75, 82)
T2<-c(57, 67, 55, 64, 61, 63, 63)
xbarT1<-mean(T1)
xbarT2<-mean(T2)
sdT1<-sd(T1)
sdT2<-sd(T2)
varT1<-var(T1)
varT2<-var(T2)

Formulandolo: No se rechaza la hipotesis nula (de que las medias de los tiempos de coccion son iguales) si el valor estadistico de prueba t se encuentra entre -3.060 y 3.060.
b)Anote la formula del estadistico de prueba para probar la hipotesis

Sp<-sqrt(((7-1)*(sdT1^2))+((7-1)*(sdT2^2))/(7+7-2))
t0<-(xbarT1-xbarT2)/((Sp)*(sqrt(2/7)))

c)Pruebe la hipotesis a un nivel de significacion de 5%. Para rechazar o no la hipotesis, apoyese tanto en el criterio del p-valor como en el valor critico de las tablas.

t.test(T1, T2)

## 
##  Welch Two Sample t-test
## 
## data:  T1 and T2
## t = 7.8209, df = 12, p-value = 4.738e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  12.57318 22.28396
## sample estimates:
## mean of x mean of y 
##  78.85714  61.42857

Por lo tanto en nuestro ejercicio rechazamos la hipotesis nuela y asumimos que las medias son diferentes.

d)Pruebe la hipotesis de igualdad de varianzas entre tratamientos

F0<-(sdT1^2)/(sdT2^2)
t.test(T1, T2, var.equal=T)

## 
##  Two Sample t-test
## 
## data:  T1 and T2
## t = 7.8209, df = 12, p-value = 4.737e-06
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  12.57320 22.28395
## sample estimates:
## mean of x mean of y 
##  78.85714  61.42857

e)De acuerdo con el analisis realizado hasta aqui, ¿existe algun tratmiento mejor? Evidentemente, podemos notar que el tiempo de coccion utlizando cloruro de sodio (sal) es mucho mas efectivo.