\[t-student\]
la prueba T_student es muy util cuando queremos COMPARAR 2 medias con cierto nivel de confianza.
por ejemplo, si usted necesita realizar deporte 40 minutos todos los días por recomendación médica y necesita saber si está cumpliendo el tiempo propuesto, puede hacer el ejercicio de tomar el tiempo destinado para esta actividad en cierta cantidad de días y mirar si está cumpliendo o no la meta. Entonces en este caso decimos que su media poblacional es una media que usted quiere comprobar y es de cierta manera es teórica.
La formula general es la siguiente
\[t = \frac{\bar x - \mu}{\frac{s}{\sqrt n}}\] donde
\[\bar x= media~muestral\\ \mu=media~ poblacional\\ s=desviacion~ estandar \\ n= numero~ total~ datos\]
pero hay que tener en cuenta lo que significa el error estandar así que podemos describir los terminos de la siguiente manera \[\bar x= media ~ muestral\\ mu=media~ poblacional\\ \frac{s}{\sqrt n}=Error~Estandar\\\]
y retomando un poco lo que se dijo en error estándar otra manera de escribir la formula es así:
\[t = \frac{\bar x - \mu}{sd(means)}\]
Tenga en cuenta que sd(means)es igual a Error estándar y se refiere a la desviación estandar de las medias de las MUESTRAS, osea de las repeticiones (si usted hizo 20 repeticiones de un experimento le debe sacar la media a cada uno, y despues con esas 20 medias debe sacar una media general).
\[H_o: \mu \geq \bar x\] \[H_o: \mu \leq \bar x\] \[H_o: \mu = \bar x\] Recuerde que la hipotesis nula siempre va a llevar el signo igual, ya que la hipotesis alterna lo que busca determinar es la diferencia.
\[H_a: \mu > \bar x\] \[H_a: \mu < \bar x\] \[H_a: \mu \neq \bar x\]
\[ejemplo\] ### retomando ejercicio de Error Estandar
para una empresa de papitas fritas se quiere que la cantidad en gramos de papitas en cada paquete sea de 100 gramos. Para comprobarlo se tomaron 120 paquetes de papitas y se tomo el peso de su contenido, obeniendo lo siguientes resultados
En este ejercicio se realizaron 20 replicas computarizadas, cada una con 40 datos, esto para poder hallar una media muestral.
hipotesis nula
\[H_o: \mu = 100\] hipotesis alterna \[H_a: \mu \neq 100\]
por si no puede observar el ejercicio de error estándar aqui esta otra vez, pero si tiene dudas es aconsejable que mire el ejercico de error estándar.
set.seed(180915)
cantidad <- rnorm(120,95,5)
library(psych)
describe.by(cantidad)
## Warning: describe.by is deprecated. Please use the describeBy function
## Warning in describeBy(x = x, group = group, mat = mat, type = type, ...): no
## grouping variable requested
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 120 95.42 4.92 95.54 95.47 5.05 83.16 108.9 25.74 -0.05 0.09
## se
## X1 0.45
repli<- replicate(20,sample(x= cantidad,size = 40, replace = T))
repli_means<-colMeans(repli)
repli_means
## [1] 95.27754 94.89542 95.77483 95.91148 95.36827 95.82040 95.97381 93.73868
## [9] 95.55633 94.40865 96.33432 96.42818 95.13857 96.87800 94.50591 95.38239
## [17] 95.89087 95.56801 95.57001 97.06300
EE<- sd(repli_means)
EE
## [1] 0.8073686
\[reemplazo~ valores~ en~ la ~ecuacion\] \[t = \frac{\bar x - \mu}{\frac{s}{\sqrt n}}\]
t_calc=(mean(repli_means)-100)/EE; t_calc
## [1] -5.481718
t_calcu<-abs(t_calc)
t_tab<- qt(0.05, 19,lower.tail = F)
t_tab
## [1] 1.729133
x <- seq( -4, 4, by = 0.1)
y <- dnorm( x )
plot( function(x) dt( x, df = 19 ), -5, 7, ylim = c( 0, 0.4 ),
col = "red", type = "l", lwd = 2,
main = "Función densidad t - Student" )
abline(v=t_tab,col="blue")
text(2.2,0.2,"t_tab")
abline(v=t_calcu, col = "green")
text(6.1,0.2,"t_cal")
Este resultado lo que nos indica es que la Ho fue rechazada con un nivel de significancia del 95% (dado que, para aceptar la hipotesis nula, el maximo valor que debíamos obtener era el valor de t_cal, pero como nuestro valor fue mayor, este se encuentra en la zona de rechazo de la Ho ). Decimos que las dos medias no son iguales estadisticamente y las papitas estan siendo empacadas con un gramaje inadecuado, debe revisarse todo el proceso de producción