\[ERROR~ESTANDAR\] El error estandar es la medida de cómo varían los promedios de varias muestras.
\[EEmalo={sd\over\sqrt n}\]
\[EEbueno= sd(means)\]
Es erroneo querer calcular el error estandar con solo un promedio de datos, ejemplo: se tomaron 100 medidas del crecimiento de plantas de banano en una finca.
Aunque con estos datos se pueda determinar un promedio y una desviación estándar muestral, es información insuficiente al momento de querer estimar pruebas de hipotesis con respecto a la poblacio, pruebas tales como la t_student.
\[remuestreo~computacional\]
este remuestreo nos permite a partir de una media muestral obtenida experimentalmente por nosotros obtener un numero de muestras computacionales, y a través de estas podremos obtener otras medias y desviaciones estándar con las cuales será adecuado aplicar las pruebas de hipotesis.
\[ejemplo\] para una empresa de papitas fritas se quiere que la cantidad en gramos de papitas en cada paquete sea de 100 gramos, para comprobarlo se tomaron 120 paquetes de papitas y se tomo el peso de su contenido, obeniendo lo siguientes resultados
set.seed(180915)
cantidad <- rnorm(120,95,5)
library(psych)
describe.by(cantidad)
## Warning: describe.by is deprecated. Please use the describeBy function
## Warning in describeBy(x = x, group = group, mat = mat, type = type, ...): no
## grouping variable requested
## vars n mean sd median trimmed mad min max range skew kurtosis
## X1 1 120 95.42 4.92 95.54 95.47 5.05 83.16 108.9 25.74 -0.05 0.09
## se
## X1 0.45
en este caso queremos saber si la media de los datos obtenidos es igual a 100, pero para comprobar eso necesitamos realizar la prueba t-student y en esta prueba es fundamental saber el ERROR ESTÁNDAR. anteriormente se ha calculado un error estandr (se) de 0.45 PERO CUIDADO, ya que es invalido porque este erro estandar es determinado a partir de una sola muestra, por lo tanto es un dato inservible.
repli<- replicate(20,sample(x= cantidad,size = 40, replace = T))
los que se ha logrado con esta función ha sido simular computacionalmente 20 ensayos, cada uno de 40 datos, pero que mantengas las características estadísticas de nuestra muestra original, en este caso la media y desviación estándar de nuestros datos obtenidos a través del primer muestreo.
a estas muestas podemos sacarles las medias
repli_means<-colMeans(repli)
repli_means
## [1] 95.27754 94.89542 95.77483 95.91148 95.36827 95.82040 95.97381 93.73868
## [9] 95.55633 94.40865 96.33432 96.42818 95.13857 96.87800 94.50591 95.38239
## [17] 95.89087 95.56801 95.57001 97.06300
y ya con estas medias de cada una de nuestras replicas (20 en total porque le pedimos al comutador hacer 20 replicas) podemos calcular el error estándar del experimento a través de la formula antes presentada como EEbueno
EE<- sd(repli_means)
EE
## [1] 0.8073686