1 Probabilidad 2

  1. La compañía de importación de chucherías y bebidas del extranjero PEPCO pide cajas de Doctor Pepper desde Estados Unidos. Estas cajas contienen 6 botellas de Doctor Pepper. Siendo X el numero de botellas sin defectos y aptas para su consumo, podemos suponer que la probabilidad de que X botellas sean aptas es proporcional a x, y por ello su funcion de probabilidad es la siguiente:

\(x=1,2,3,4,5,6:p(x) = cx\)

c siento una constante. Y en cualquier otro caso:

\(p(x)=0\)

a. Calcula el valor de c para que p(x) sea una funcion de probabilidad

\(c+2c+3c+4c+5c+6c = 21c = 1\) \(c= 1/21\)

El valor de c debe ser 1/21 para que sea una funcion de probabilidad.

b. Calcula P(X=4)

\(P(X=4) = 4c = 4/21 = 0,19\)

Es decir un 19% de probabilidad de que 4 botellas sean aptas para consumo.

4/21
## [1] 0.1904762

c. Calcula la medida del numero de botellas

\(µ = 1*1/21 + 2*2/21 + 3*3/21 +4*4/21 + 5*5/21 + 6*6/21 = 4,3333333333\)

La media del numero de botellas aptas para el consumo es de 4.3 botellas.

1*1/21 + 2*2/21 + 3*3/21 +4*4/21 + 5*5/21 + 6*6/21
## [1] 4.333333

d.Calcula la varianza y la desviacion tipica del número de botellas que son aptas para consumo

\(\sigma^2=1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2 = 2.22\)

\(\sigma = \sqrt(\sigma^2) = 1.49\)

1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2
## [1] 2.222233
sqrt(1/21*(1-4.33)^2 + 2/21*(2-4.33)^2 + 3/21*(3-4.33)^2 + 4/21*(4-4.33)^2 + 5/21*(5-4.33)^2 + 6/21*(6-4.33)^2)
## [1] 1.490716

2 Contraste de hipótesis

  1. Una empresa de maquinas de cafés ha recibido una petición de la uclm para entregar dos maquinas, una para la esii y otra para la facultad de humanidades, cuyas variabilidades tienen que ser similares. Para cumplir con las exigencias de la UCLM se recopilan muestras independientes de la cantidad de café que echa cada maquina en ml.

A <- c(189, 191, 161, 167, 175, 176, 174, 185)

B <- c(173, 190, 179, 185, 170, 175, 177, 175)

a) Si las cantidades siguen una distribución normal, ¿cuál seria el tipo de prueba estadística más adecuado para las muestras?¿H0 y H1?

Como se sigue una distribución normal, se deberá usar un test Z de dos poblaciones independientes, en la que no conoceremos su variabilidad.

H0: La variabilidad es igual entre A y B. \(\sigma(A) = \sigma(B)\)

H1: La variabilidad no es igual entre A y B. \(\sigma(A) \ne \sigma(B)\)

b) ¿Hay evidencia suficiente para afirmar H0?

    A <- c(189, 191, 161, 167, 175, 176, 174, 185)
    B <- c(173, 190, 179, 185, 170, 175, 177, 175)

    var.test(A,B)
## 
##  F test to compare two variances
## 
## data:  A and B
## F = 2.5613, num df = 7, denom df = 7, p-value = 0.2379
## alternative hypothesis: true ratio of variances is not equal to 1
## 95 percent confidence interval:
##   0.5127737 12.7932526
## sample estimates:
## ratio of variances 
##           2.561258

Se ve que F = 2.5613.Como p-value = 0.2379 y 0.2379 > 0.05 entonces al 97% no hay evidencia estadística en contra de que sean iguales las varianzas. Podemos suponer que tienen la misma variabilidad

c) Ahora la UCLM ha pedido que la media de cantidades sea similar. ¿Hay evidencia para afirmar esto?

H0: \(\mu(A) = \mu(B)\)

H1: \(\mu(A) \ne \mu(B)\)

-No sabemos la varianza

-Segun B) las varianzas “parecen” iguales

      t.test(A,B,var.equal = T)
## 
##  Two Sample t-test
## 
## data:  A and B
## t = -0.17114, df = 14, p-value = 0.8666
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -10.149295   8.649295
## sample estimates:
## mean of x mean of y 
##    177.25    178.00

Como p-value = 0.8666 y 0.8666 > 0.05 entonces no hay evidencia estadística en contra de H0. Podemos suponer que tienen la misma media

d) Para asegurarse la UCLM pide 33 maquinas de café. Ahora se sabe que la desviación poblacional es de 10 ml y dan una media de 160 ml. Si para ser de calidad las maquinas deberían dar 175 ml de media, ¿podemos afirmar que son unas máquinas de calidad?¿Cual es el p-valor?

    xbarra=160;mu=175;sigma=10;n=33
    Zs = (xbarra-mu)/(sigma/sqrt(n))
    Z = qnorm(1-0.05/2)
    Z
## [1] 1.959964
    Zs
## [1] -8.616844
    Zs < (-Z)
## [1] TRUE

Como Zs = -8.616844 y Zs < -Z no podemos afirmar que son maquinas de calidad.

    pvalor = 2*pnorm(Zs)
    pvalor
## [1] 6.882482e-18
    pvalor < 0.05
## [1] TRUE

Como pvalor es menor a alfa (0.05), no podemos afirmar que son maquinas de calidad, pues existe evidencia estadística en contra de H0.

3 Contraste de hipótesis

  1. Los alumnos de 2ºB de la facultad de ingenieria informatica de albacete, acaban de realizar un examen tipo test de la asignatura de Bases de datos. Un grupo de alumnos de este curso, han recogido la informacion sobre un numero de notas de este test, para tratar de extraer algunos datos, que les ayuden a averiguar que tal ha ido el examen, y como va su clase en esa asignatura.

Notas del examen (10 notas) = {6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00}

a) Los alumnos quiren hayar la media real de la clase, pero con los datos que tienen no pueden calcularla de forma exacta, por lo que piensan calcular el intervalo de confianza de la media del 95%. ¿Es posible que la media real de la clase sea de 8?

    x=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
    t.test(x,mu=mean(x))
## 
##  One Sample t-test
## 
## data:  x
## t = 0, df = 9, p-value = 1
## alternative hypothesis: true mean is not equal to 6.488
## 95 percent confidence interval:
##  5.281588 7.694412
## sample estimates:
## mean of x 
##     6.488

La media real no podrá ser un 8, pues este valor no esta en el intervalo de confianza de la media que es [5.28,7,69].

b) Los alumnos quieren calcular el intervalo de confianza de las notas al 95%, suponiendo que las notas siguen una normal.

x=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
len=length(x)
sd=sd(x)
alpha=0.05
t=qnorm(1-alpha)
int_inf=mean(x)-t*sd/sqrt(len)
int_sup=mean(x)+t*sd/sqrt(len)
int_inf; int_sup
## [1] 5.610797
## [1] 7.365203

c) Los alumnos del grupo B, que tienen amigos en el grupo A, les han pedido que les digan sus notas, para compararlas con las suyas, y ver si existe diferencia real entre las notas de difernetes cursos, más alla del azar. Suponemos que tienen la misma varianza. Notas de la clase A ={6.57 , 7.50 , 3.23 , 9.00 , 4.98 , 6.11 , 5.55 , 8.33 , 5.67 , 9.80}

notas_clase_b=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
notas_clase_a=c(6.57 , 7.50 , 3.23 , 9.00 , 4.98 , 6.11 , 5.55 , 8.33 , 5.67 , 9.80)
t.test(notas_clase_b, notas_clase_a)
## 
##  Welch Two Sample t-test
## 
## data:  notas_clase_b and notas_clase_a
## t = -0.22494, df = 17.506, p-value = 0.8246
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.92672  1.55472
## sample estimates:
## mean of x mean of y 
##     6.488     6.674

En este caso se puede observar que no existe diferencia real entre las notas de las 2 clases, ya que al ser el p-valor mucho mayor a alpha(0.05), se verifica con fundamento estadistico H0.

d) Ahora que ya han acabado el curso, los alumnos quieren comparar los resultados de este ultimo exámen con los del primero, siendo los resultados del ultimo examen :{9.50 , 5.30 , 8.04 , 3.57 , 6.88 , 4.20 , 7.33 , 9.75 , 5.95 , 8.33}

notas_primer_examen=c(6.35 , 7.07 , 4.56 , 8.63 , 5.78 , 3.65 , 9.14 , 6.20 , 7.50 , 6.00)
notas_ultimo_examen=c(9.50 , 5.30 , 8.04 , 3.57 , 6.88 , 4.20 , 7.33 , 9.75 , 5.95 , 8.33)
wilcox.test(notas_primer_examen,notas_ultimo_examen, paired=TRUE)
## 
##  Wilcoxon signed rank exact test
## 
## data:  notas_primer_examen and notas_ultimo_examen
## V = 22, p-value = 0.625
## alternative hypothesis: true location shift is not equal to 0

Como p-value es mayor a 0.05 (valor por defecto de alpha) se puede decir que hay respaldo estadistico para H0 (no ha habido cambio desde el primer examen);