\(x=1,2,3,4,5,6:p(x) = cx\)
c siento una constante. Y en cualquier otro caso:
\(p(x)=0\)
a. Calcula el valor de c para que p(x) sea una funcion de probabilidad
\(c+2c+3c+4c+5c+6c = 21c = 1\) \(c= 1/21\)
El valor de c debe ser 1/21 para que sea una funcion de probabilidad.
b. Calcula P(X=4)
\(P(X=4) = 4c = 4/21 = 0,19\)
Es decir un 19% de probabilidad de que 4 botellas sean aptas para consumo.
4/21
## [1] 0.1904762
c. Calcula la medida del numero de botellas
\(µ = 1*1/21 + 2*2/21 + 3*3/21 +4*4/21 + 5*5/21 + 6*6/21 = 4,3333333333\)
La media del numero de botellas aptas para el consumo es de 4.3 botellas.
1*1/21 + 2*2/21 + 3*3/21 +4*4/21 + 5*5/21 + 6*6/21
## [1] 4.333333
d.Calcula la varianza y la desviacion tipica del número de botellas que son aptas para consumo
\(\sigma^2=1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2 = 2.22\)
\(\sigma = \sqrt(\sigma^2) = 1.49\)
1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2
## [1] 2.222233
sqrt(1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2)
## [1] 1.490716
A <- c(189, 191, 161, 167, 175, 176, 174, 185)
B <- c(173, 190, 179, 185, 170, 175, 177, 175)
a) Si las cantidades siguen una distribución normal, ¿cuál seria el tipo de prueba estadística más adecuado para las muestras?¿H0 y H1?
Como se sigue una distribución normal, se deberá usar un test Z de dos poblaciones independientes, en la que no conoceremos su variabilidad.
H0: La variabilidad es igual entre A y B. \(\sigma(A) = \sigma(B)\)
H1: La variabilidad no es igual entre A y B. \(\sigma(A) \ne \sigma(B)\)
b) ¿Hay evidencia suficiente para afirmar H0?
A <- c(189, 191, 161, 167, 175, 176, 174, 185)
B <- c(173, 190, 179, 185, 170, 175, 177, 175)
var.test(A,B)
##
## F test to compare two variances
##
## data: A and B
## F = 2.5613, num df = 7, denom df = 7, p-value = 0.2379
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
## 0.5127737 12.7932526
## sample estimates:
## ratio of variances
## 2.561258
Se ve que F = 2.5613.Como p-value = 0.2379 y 0.2379 > 0.05 entonces al 97% no hay evidencia estadística en contra de que sean iguales las varianzas. Podemos suponer que tienen la misma variabilidad
c) Ahora la UCLM ha pedido que la media de cantidades sea similar. ¿Hay evidencia para afirmar esto?
H0: \(\mu(A) = \mu(B)\)
H1: \(\mu(A) \ne \mu(B)\)
-No sabemos la varianza
-Segun B) las varianzas “parecen” iguales
t.test(A,B,var.equal = T)
##
## Two Sample t-test
##
## data: A and B
## t = -0.17114, df = 14, p-value = 0.8666
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -10.149295 8.649295
## sample estimates:
## mean of x mean of y
## 177.25 178.00
Como p-value = 0.8666 y 0.8666 > 0.05 entonces no hay evidencia estadística en contra de H0. Podemos suponer que tienen la misma media
d) Para asegurarse la UCLM pide 33 maquinas de café. Ahora se sabe que la desviación poblacional es de 10 ml y dan una media de 160 ml. Si para ser de calidad las maquinas deberían dar 175 ml de media, ¿podemos afirmar que son unas máquinas de calidad?¿Cual es el p-valor?
xbarra=160;mu=175;sigma=10;n=33
Zs = (xbarra-mu)/(sigma/sqrt(n))
Z = qnorm(1-0.05/2)
Z
## [1] 1.959964
Zs
## [1] -8.616844
Zs < (-Z)
## [1] TRUE
Como Zs = -8.616844 y Zs < -Z no podemos afirmar que son maquinas de calidad.
pvalor = 2*pnorm(Zs)
pvalor
## [1] 6.882482e-18
pvalor < 0.05
## [1] TRUE
Como pvalor es menor a alfa (0.05), no podemos afirmar que son maquinas de calidad, pues existe evidencia estadística en contra de H0.
Notas del examen (10 notas) = {6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00}
a) Los alumnos quiren hayar la media real de la clase, pero con los datos que tienen no pueden calcularla de forma exacta, por lo que piensan calcular el intervalo de confianza de la media del 95%. ¿Es posible que la media real de la clase sea de 8?
x=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
t.test(x,mu=mean(x))
##
## One Sample t-test
##
## data: x
## t = 0, df = 9, p-value = 1
## alternative hypothesis: true mean is not equal to 6.488
## 95 percent confidence interval:
## 5.281588 7.694412
## sample estimates:
## mean of x
## 6.488
La media real no podrá ser un 8, pues este valor no esta en el intervalo de confianza de la media que es [5.28,7,69].
b) Los alumnos quieren calcular el intervalo de confianza de las notas al 95%, suponiendo que las notas siguen una normal.
x=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
len=length(x)
sd=sd(x)
alpha=0.05
t=qnorm(1-alpha)
int_inf=mean(x)-t*sd/sqrt(len)
int_sup=mean(x)+t*sd/sqrt(len)
int_inf; int_sup
## [1] 5.610797
## [1] 7.365203
c) Los alumnos del grupo B, que tienen amigos en el grupo A, les han pedido que les digan sus notas, para compararlas con las suyas, y ver si existe diferencia real entre las notas de difernetes cursos, más alla del azar. Suponemos que tienen la misma varianza. Notas de la clase A ={6.57 , 7.50 , 3.23 , 9.00 , 4.98 , 6.11 , 5.55 , 8.33 , 5.67 , 9.80}
notas_clase_b=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
notas_clase_a=c(6.57 , 7.50 , 3.23 , 9.00 , 4.98 , 6.11 , 5.55 , 8.33 , 5.67 , 9.80)
t.test(notas_clase_b, notas_clase_a)
##
## Welch Two Sample t-test
##
## data: notas_clase_b and notas_clase_a
## t = -0.22494, df = 17.506, p-value = 0.8246
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -1.92672 1.55472
## sample estimates:
## mean of x mean of y
## 6.488 6.674
En este caso se puede observar que no existe diferencia real entre las notas de las 2 clases, ya que al ser el p-valor mucho mayor a alpha(0.05), se verifica con fundamento estadistico H0.
d) Ahora que ya han acabado el curso, los alumnos quieren comparar los resultados de este ultimo exámen con los del primero, siendo los resultados del ultimo examen :{9.50 , 5.30 , 8.04 , 3.57 , 6.88 , 4.20 , 7.33 , 9.75 , 5.95 , 8.33}
notas_primer_examen=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
notas_ultimo_examen=c(9.50 , 5.30 , 8.04 , 3.57 , 6.88 , 4.20 , 7.33 , 9.75 , 5.95 , 8.33)
wilcox.test(notas_primer_examen,notas_ultimo_examen, paired=TRUE)
##
## Wilcoxon signed rank exact test
##
## data: notas_primer_examen and notas_ultimo_examen
## V = 22, p-value = 0.625
## alternative hypothesis: true location shift is not equal to 0
Como p-value es mayor a 0.05 (valor por defecto de alpha) se puede decir que hay respaldo estadistico para H0 (no ha habido cambio desde el primer examen);