Problema 2-Clase del 3 de octubre 2012-Dr Gerardo Hernandez

Considere las dos siguientes mediciones:

X = Pre-Tratamiento,Y = Post-Tratamiento

X = c(95, 111, 97, 132, 144, 100, 120, 110, 131, 154, 105, 119, 107, 101, 118)
Y = c(99, 120, 97, 130, 148, 122, 131, 109, 140, 153, 131, 120, 114, 110, 116)

La hipótesis nula Ho es que el post-tratamiento NO cambia el estado de 
las cosas (el tratamiento no funciona)

Como la hipotesis es que el tratamiento no funciona, es
necesario considerar si la diferencia de valores esta alejada
en t-Student del valor teorico con confianza de 95% y 99%

STEP 1 - State the hypotheses and identify the claim.

Ho: Z = Y-X = 0 (claim) and H1: Z greater than zero

Obtener el promedio de la diferencia Z = Y - X
y su varianza y desviacion estandar [El valor de la varianza y desv estandar se obtienen con var(Z), 
y sd(Z) ya que ambas se obtienen por omisión con 'n-1' en el lenguaje R]

Z = Y - X
Z

##  [1]  4  9  0 -2  4 22 11 -1  9 -1 26  1  7  9 -2

n = length(Z)
n

## [1] 15

Zbar = sum(Z)/n
Zbar

## [1] 6.4

varZ = var(Z)
sdZ = sd(Z)
sdZ

## [1] 8.458

NO es igual a la suma de las varianzas individuales
ya que las muestras NO son independientes.

STEP 2 - Find the critical values.


```r
t.95 = qt(0.95, df = (n - 1))
t.95

## [1] 1.761

t.99 = qt(0.99, df = (n - 1))
t.99

## [1] 2.624

STEP 3 - Compute the test value

La t-Student de la MUESTRA se calcula asi:

t = (Zbar - 0)/(sdZ/(n-1)^(1/2), es decir
la media de las diferencias es cero y la varianza es la de población 'sigma' (a falta de mas informacion) 
la suponemos igual a la de la muestra 'sdZ', de ahí resulta el término: (sdZ/(n-1)^1/2)

t = (Zbar - 0)/(sdZ/((n - 1)^(1/2)))
t

## [1] 2.831

t = 2.83.   Este valor debe compararse con t.95 = 1.76 [con P = 0.95, one tail]
y con t.99 = 2.145 [con P = 0.99, one tail]

Step 4 Make the decision

Reject the Hypotheses since the test value t=2.83 falls into the critical region, as shown in the figure [far below].

STEP 5 - Summarize the results

Por esta razon se rechaza la Hipotesis nula de que 'no pasa nada'. Es decir, el Post-tratamiento SI modifica los valores (que podrían ser los valores de presión sanguinea de un paciente).

if (t > t.95) print("sample t statistic is larger than t.95") else print("sample t statistic is smaller than t.95")

## [1] "sample t statistic is larger than t.95"

if (t > t.99) print("sample t statistic is larger than t.99") else print("sample t statistic is smaller than t.99")

## [1] "sample t statistic is larger than t.99"

Gráfica

par(mfrow = c(1, 1))
inicio = -0.5
Mean = Zbar  ## average value
final = +5
Sd = sdZ  ## standard deviation

Grafica de la Distribución Student-t (base) [línea azul], [One-tailed] con 'df' grados de libertad (n-1 en nuestro ejercicio), por definición de una variable aleatoria 'T'. [Ref; Kreysig, E., Introductory Mathematical Statistics, pp. 145]

x = seq(inicio, final, 0.01)
y = dt(x, df = n - 1)

plot(x, y, type = "l", col = "blue", xlab = "Distribución Student-t (Ejercicio 2)", 
    ylab = "", cex = 1.5)
abline(v = t, col = "red")
## Anotar t
library(calibrate)

## Loading required package: MASS

textxy(2.83, 0.02, labs = "t = 2.83", cx = 1)

## Anotar t.95 y t.99
abline(v = t.95, col = "violet")
textxy(t.95 - 0.6, 0, labs = "t.95=1.761", cx = 1)

abline(v = t.99, col = "violet")
textxy(t.99 - 0.6, 0.005, labs = "t.99=2.624", cx = 1)

textxy(t.95 - 0.4, 0.1, labs = "---> Begins critical region (95%)", cx = 1)
textxy(t.99 - 0.4, 0.05, labs = "---> Begins critical region (99%)", cx = 1)

plot of chunk unnamed-chunk-8