Utilizar funciones de una distribución T Student para calcular función de densidad, probabilidades e identificar valores de t e intervalo de
Utilizar funciones de una distribución T Student para calcular función de densidad, probabilidades e identificar valores de t e intervalo de confianza.
x¯=media muestral μ=media poblacional s=desviación estándar de la muestra n=número de elementos de la muestra
Tiene forma de montículo o campana de gauss y es simétrica alrededor de t=0, igual que z la normal estándar.
Es más variable que z, con “colas más pesadas”; esto es, la curva t no aproxima al eje horizontal con la misma rapidez que z. Esto es porque el estadístico t abarca dos cantidades aleatorias, x¯ y s, en tanto que el estadístico z tiene sólo la media muestral, x¯. Ver curvas de T Student y Normal Estándar z.
La forma de la distribución t depende del tamaño muestral n. A medida que n aumenta, la variabilidad de t disminuye porque la estimación s de σ está basada en más y más información.
Cuando n sea infinitamente grande, las distribuciones t y z son idénticas.
El número de grados de libertad es igual al tamaño de la muestra n (número de observaciones independientes) menos 1
gl=df=(n–1) ∴ df=grados de libertad n=total de elementos de la muestra de t
library(readxl)
data_tratada <- read_excel("C:/Users/giang/Downloads/data_tratada.xlsx")
media.m <- mean(data_tratada$matematica)
desv.m <- sd(data_tratada$matematica)
n <- round(length(data_tratada$matematica))
confianza = 0.95
tabla <- data.frame(variables = c("n", "Grados libertad", "Media muestra", "Desv.Std muestra", "Media Pob.","Confianza"), datos = c(n, (n-1), media.m, desv.m, NA, confianza))
tabla
## variables datos
## 1 n 240.000000
## 2 Grados libertad 239.000000
## 3 Media muestra 12.945833
## 4 Desv.Std muestra 3.483551
## 5 Media Pob. NA
## 6 Confianza 0.950000
t <- qt(p = (1 - confianza) / 2, df = n-1) # dos colas
t <- abs(t)
t
## [1] 1.969939
li <- media.m - t * (desv.m /sqrt(n) )
ls <- media.m + t * (desv.m /sqrt(n) )
li
## [1] 12.50287
ls
## [1] 13.3888
intervalo <- c(li, ls)
intervalo
## [1] 12.50287 13.38880
La mejor estimación de una nota de matematica es tenga un valor entre 12.50287 13.38880 con un 95% de confianza.
library(visualize)
visualize.t(stat = c(-t, t), df = n-1, section = "tails") +
text(0, 0.2, expression("95%"), col = "red")
## integer(0)