Problema 2-Clase del 3 de octubre 2012-Dr Gerardo Hernandez

Considere las dos siguientes mediciones:

X = Pre-Tratamiento,Y = Post-Tratamiento
X = c(95, 111, 97, 132, 144, 100, 120, 110, 131, 154, 105, 119, 107, 101, 118)
Y = c(99, 120, 97, 130, 148, 122, 131, 109, 140, 153, 131, 120, 114, 110, 116)
La hipótesis nula Ho es que el post-tratamiento NO cambia el estado de 
las cosas (el tratamiento no funciona)

Como la hipotesis es que el tratamiento no funciona, es
necesario considerar si la diferencia de valores esta alejada
en t-Student del valor teorico con confianza de 95% y 99%

STEP 1 - State the hypotheses and identify the claim.

Ho: Z = Y-X = 0 (claim) and H1: Z different from zero

Obtener el promedio de la diferencia Z = Y - X
y su varianza y desviacion estandar [El valor de la varianza y desv estandar se obtienen con var(Z), 
y sd(Z) ya que ambas se obtienen por omisión con 'n-1' en el lenguaje R]
Z = Y - X
Z
##  [1]  4  9  0 -2  4 22 11 -1  9 -1 26  1  7  9 -2
n = length(Z)
n
## [1] 15
Zbar = sum(Z)/n
Zbar
## [1] 6.4
varZ = var(Z)
sdZ = sd(Z)
sdZ
## [1] 8.458
NO es igual a la suma de las varianzas individuales
ya que las muestras NO son independientes.

STEP 2 - Find the critical values.


```r
alpha = 0.05
t.975 = qt(1 - (alpha/2), df = (n - 1))
t.975
## [1] 2.145
## Como es de dos colas, +- 2.144

STEP 3 - Compute the test value of the sample

La t-Student de la MUESTRA se calcula asi:

tm = (Zbar - 0)/(sdZ/(n-1)^(1/2), es decir
la media de las diferencias es cero y la varianza de la de población es la de la muestra (a falta de mas informacion) 
la suponemos igual a la de la muestra 'sdZ', de ahí resulta el término: (sdZ/(n-1)^1/2)
tm = (Zbar - 0)/(sdZ/sqrt(n - 1))
tm
## [1] 2.831
tm = 2.83.   Este valor debe compararse con `2.1448` [con P = 0.975, two tails]

Step 4 Make the decision

Reject the Hypotheses H0 since the test value tm=2.83 falls into the critical region, as shown in the figure [far below].

STEP 5 - Summarize the results

Por esta razon se rechaza la Hipotesis nula de que 'no pasa nada'. Es decir, el Post-tratamiento SI modifica los valores (que podrían ser los valores de presión sanguinea de un paciente). 
if (tm > t.975) print("sample t statistic is larger than t.975") else print("sample t statistic is smaller than t.975")
## [1] "sample t statistic is larger than t.975"

Gráfica

par(mfrow = c(1, 1))
inicio = -5
Mean = Zbar  ## average value
final = +5
Sd = sdZ  ## standard deviation
Grafica de la Distribución Student-t (base) [línea azul], [One-tailed] con 'df' grados de libertad (n-1 en nuestro ejercicio), por definición de una variable aleatoria 'T'. [Ref; Kreysig, E., Introductory Mathematical Statistics, pp. 145]
x = seq(inicio, final, 0.01)
y = dt(x, df = n - 1)
plot(x, y, type = "l", col = "blue", xlab = "Distribución Student-t (Ejercicio 2)", 
    ylab = "", cex = 1.5)
abline(v = tm, col = "violet")
## Anotar t
library(calibrate)
## Loading required package: MASS
text(tm, 0.03, labels = "tm = 2.83", cex = 1, pos = 1)

## Anotar t.975 positive
abline(v = t.975, col = "red")
textxy(t.975 - 0.6, 0, labs = "t.975=2.144", cx = 1)

text(t.975, 0.1, labels = "---> Begins critical region (97.5%)", cex = 1, pos = 4)

## Anotar t.005 negative
abline(v = -t.975, col = "red")
textxy(-(t.975 - 0.6), 0, labs = "t.005 = -2.144", cx = 1)

text(-(t.975 - 0.6) - 0.5, 0.1, labels = "Begins critical region (97.5%) <-----", 
    cex = 1, pos = 2)

plot of chunk unnamed-chunk-8