\[t-student\]

la prueba T_student es muy util cuando queremos COMPARAR 2 medias con cierto nivel de confianza.

primer caso que se usa:

por ejemplo, si usted necesita realizar deporte 40 minutos todos los días por recomendación médica y necesita saber si está cumpliendo el tiempo propuesto, puede hacer el ejercicio de tomar el tiempo destinado para esta actividad en cierta cantidad de días y mirar si está cumpliendo o no la meta. Entonces en este caso decimos que su media poblacional es una media que usted quiere comprobar y es de cierta manera es teórica.

Primero: hay que recordar cual es la fórmula t-student

La formula general es la siguiente

\[t = \frac{\bar x - \mu}{\frac{s}{\sqrt n}}\] donde

\[\bar x= media~muestral\\ \mu=media~ poblacional\\ s=desviacion~ estandar \\ n= numero~ total~ datos\]

pero hay que tener en cuenta lo que significa el error estandar así que podemos describir los terminos de la siguiente manera \[\bar x= media ~ muestral\\ mu=media~ poblacional\\ \frac{s}{\sqrt n}=Error~Estandar\\\]

y retomando un poco lo que se dijo en error estándar otra manera de escribir la formula es así:

\[t = \frac{\bar x - \mu}{sd(means)}\]

Tenga en cuenta que sd(means)es igual a Error estándar y se refiere a la desviación estandar de las medias de las MUESTRAS, osea de las repeticiones (si usted hizo 20 repeticiones de un experimento le debe sacar la media a cada uno, y despues con esas 20 medias debe sacar una media general).

Segundo: hay que plantear las hipotesis

hipotesis nula

\[H_o: \mu \geq \bar x\] \[H_o: \mu \leq \bar x\] \[H_o: \mu = \bar x\] Recuerde que la hipotesis nula siempre va a llevar el signo igual, ya que la hipotesis alterna lo que busca determinar es la diferencia.

hipotesis alterna

\[H_a: \mu > \bar x\] \[H_a: \mu < \bar x\] \[H_a: \mu \neq \bar x\]

\[ejemplo\] ### retomando ejercicio de Error Estandar

para una empresa de papitas fritas se quiere que la cantidad en gramos de papitas en cada paquete sea de 100 gramos. Para comprobarlo se tomaron 120 paquetes de papitas y se tomo el peso de su contenido, obeniendo lo siguientes resultados

En este ejercicio se realizaron 20 replicas computarizadas, cada una con 40 datos, esto para poder hallar una media muestral.

planteamos las hipotesis del ejercicio

hipotesis nula

\[H_o: \mu = 100\] hipotesis alterna \[H_a: \mu \neq 100\]

¿que valores teníamos en el ejercicio anterior?

por si no puede observar el ejercicio de error estándar aqui esta otra vez, pero si tiene dudas es aconsejable que mire el ejercico de error estándar.

set.seed(180915)
cantidad <- rnorm(120,95,5)
library(psych)
 describe.by(cantidad)
## Warning: describe.by is deprecated. Please use the describeBy function
## Warning in describeBy(x = x, group = group, mat = mat, type = type, ...): no
## grouping variable requested
##    vars   n  mean   sd median trimmed  mad   min   max range  skew kurtosis
## X1    1 120 95.42 4.92  95.54   95.47 5.05 83.16 108.9 25.74 -0.05     0.09
##      se
## X1 0.45
repli<- replicate(20,sample(x= cantidad,size = 40, replace = T))
 
repli_means<-colMeans(repli)
repli_means
##  [1] 95.27754 94.89542 95.77483 95.91148 95.36827 95.82040 95.97381 93.73868
##  [9] 95.55633 94.40865 96.33432 96.42818 95.13857 96.87800 94.50591 95.38239
## [17] 95.89087 95.56801 95.57001 97.06300
EE<- sd(repli_means)
EE
## [1] 0.8073686

\[reemplazo~ valores~ en~ la ~ecuacion\] \[t = \frac{\bar x - \mu}{\frac{s}{\sqrt n}}\]

t_calc=(mean(repli_means)-100)/EE; t_calc
## [1] -5.481718
t_calcu<-abs(t_calc)
t_tab<- qt(0.05, 19,lower.tail = F)
t_tab
## [1] 1.729133
x <- seq( -4, 4, by = 0.1)
y <- dnorm( x )
plot( function(x) dt( x, df = 19 ), -5, 7, ylim = c( 0, 0.4 ),
      col = "red", type = "l", lwd = 2,
      main = "Función densidad t - Student" )
abline(v=t_tab,col="blue")
text(2.2,0.2,"t_tab")
abline(v=t_calcu, col = "green")
text(6.1,0.2,"t_cal")

Este resultado lo que nos indica es que la Ho fue rechazada con un nivel de significancia del 95% (dado que, para aceptar la hipotesis nula, el maximo valor que debíamos obtener era el valor de t_cal, pero como nuestro valor fue mayor, este se encuentra en la zona de rechazo de la Ho ). Decimos que las dos medias no son iguales estadisticamente y las papitas estan siendo empacadas con un gramaje inadecuado, debe revisarse todo el proceso de producción