Considere las dos siguientes mediciones:
X = Pre-Tratamiento,Y = Post-Tratamiento
X = c(95, 111, 97, 132, 144, 100, 120, 110, 131, 154, 105, 119, 107, 101, 118)
Y = c(99, 120, 97, 130, 148, 122, 131, 109, 140, 153, 131, 120, 114, 110, 116)
La hipótesis nula Ho es que el post-tratamiento NO cambia el estado de
las cosas (el tratamiento no funciona)
Como la hipotesis es que el tratamiento no funciona, es
necesario considerar si la diferencia de valores esta alejada
en t-Student del valor teorico con confianza de 95% y 99%
Ho: Z = Y-X = 0 (claim) and H1: Z greater than zero
Obtener el promedio de la diferencia Z = Y - X
y su varianza y desviacion estandar [El valor de la varianza y desv estandar se obtienen con var(Z),
y sd(Z) ya que ambas se obtienen por omisión con 'n-1' en el lenguaje R]
Z = Y - X
Z
## [1] 4 9 0 -2 4 22 11 -1 9 -1 26 1 7 9 -2
n = length(Z)
n
## [1] 15
Zbar = sum(Z)/n
Zbar
## [1] 6.4
varZ = var(Z)
sdZ = sd(Z)
sdZ
## [1] 8.458
NO es igual a la suma de las varianzas individuales
ya que las muestras NO son independientes.
```r
t.95 = qt(0.95, df = (n - 1))
t.95
## [1] 1.761
t.99 = qt(0.99, df = (n - 1))
t.99
## [1] 2.624
La t-Student de la MUESTRA se calcula asi:
t = (Zbar - 0)/(sdZ/(n-1)^(1/2), es decir
la media de las diferencias es cero y la varianza es la de población 'sigma' (a falta de mas informacion)
la suponemos igual a la de la muestra 'sdZ', de ahí resulta el término: (sdZ/(n-1)^1/2)
t = (Zbar - 0)/(sdZ/((n - 1)^(1/2)))
t
## [1] 2.831
t = 2.83. Este valor debe compararse con t.95 = 1.76 [con P = 0.95, one tail]
y con t.99 = 2.145 [con P = 0.99, one tail]
Reject the Hypotheses since the test value t=2.83 falls into the critical region, as shown in the figure [far below].
Por esta razon se rechaza la Hipotesis nula de que 'no pasa nada'. Es decir, el Post-tratamiento SI modifica los valores (que podrían ser los valores de presión sanguinea de un paciente).
if (t > t.95) print("sample t statistic is larger than t.95") else print("sample t statistic is smaller than t.95")
## [1] "sample t statistic is larger than t.95"
if (t > t.99) print("sample t statistic is larger than t.99") else print("sample t statistic is smaller than t.99")
## [1] "sample t statistic is larger than t.99"
par(mfrow = c(1, 1))
inicio = -0.5
Mean = Zbar ## average value
final = +5
Sd = sdZ ## standard deviation
Grafica de la Distribución Student-t (base) [línea azul], [One-tailed] con 'df' grados de libertad (n-1 en nuestro ejercicio), por definición de una variable aleatoria 'T'. [Ref; Kreysig, E., Introductory Mathematical Statistics, pp. 145]
x = seq(inicio, final, 0.01)
y = dt(x, df = n - 1)
plot(x, y, type = "l", col = "blue", xlab = "Distribución Student-t (Ejercicio 2)",
ylab = "", cex = 1.5)
abline(v = t, col = "red")
## Anotar t
library(calibrate)
## Loading required package: MASS
textxy(2.83, 0.02, labs = "t = 2.83", cx = 1)
## Anotar t.95 y t.99
abline(v = t.95, col = "violet")
textxy(t.95 - 0.6, 0, labs = "t.95=1.761", cx = 1)
abline(v = t.99, col = "violet")
textxy(t.99 - 0.6, 0.005, labs = "t.99=2.624", cx = 1)
textxy(t.95 - 0.4, 0.1, labs = "---> Begins critical region (95%)", cx = 1)
textxy(t.99 - 0.4, 0.05, labs = "---> Begins critical region (99%)", cx = 1)