Ejercicio

Se pensó que un programa de ejercicios regulares, moderadamente activos, podría beneficiar a los pacientes que habían sufrido previamente un infarto de miocardio por exceso de trabajo. Once individuos participaron en un estudio para comprobar este argumento. Antes de que empezara el programa, se determinó la capacidad de trabajo de cada persona midiendo el tiempo que tardo en alcanzar una frecuencia de 160 latidos por minuto mientras caminaba sobre una cinta sin fin. Después de 25 semanas de ejercicio controlado, se repitieron las medidas en la cienta sin fin y se registró la diferencia en tiempo para cada sujeto. Resultaron los siguientes datos:

SUJETO <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
ANTES <- c(7.6, 9.9, 8.6, 9.5, 8.4, 9.2, 6.4, 9.9, 8.7, 10.3, 8.3)
DESPUÉS <- c(14.7, 14.1, 11.8, 16.1, 14.7, 14.1, 13.2, 14.9, 12.2, 13.4, 14)

Tabla <- matrix(c(SUJETO, ANTES, DESPUÉS),nrow=11 ,ncol=3)
dataframe <- as.data.frame(Tabla)
names(dataframe) <- c("SUJETO","ANTES", "DESPUÉS")
dataframe
##    SUJETO ANTES DESPUÉS
## 1       1   7.6    14.7
## 2       2   9.9    14.1
## 3       3   8.6    11.8
## 4       4   9.5    16.1
## 5       5   8.4    14.7
## 6       6   9.2    14.1
## 7       7   6.4    13.2
## 8       8   9.9    14.9
## 9       9   8.7    12.2
## 10     10  10.3    13.4
## 11     11   8.3    14.0
  • Realice la prueba de normalidad para cada una de las variables.
  • ¿Sostienen estos datos el argumento de los invertigadores?

Solución

Primera pregunta

Para realizar el análisis de normalidad a las variables “ANTES” y “DESPUÉS” se debe identificar la prueba más pertinente. Existen dos tipos de prueba: Shapiro Wilk y Kolmogorov-Smirnov. La diferencia que radica entre ambos es que el primero se utiliza en tamaños muestra pequeños (n<30), mientras segundo es aplicado a muestras grandes(n>=30).

Para determinar el tipo de prueba a utilizar se determina acontinuación el numero de datos de cada variable:

  • “ANTES”:
length(ANTES)
## [1] 11

De acuerdo con lo anterior la variable “ANTES” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk en ambos casos. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.

Para la variable “ANTES” se plantea:

  • H0: La variable ANTES proviene de una población normal.
  • H1: La variable ANTES no proviene de una población normal.
  • Nivel de significancia del 0.05

Aplicando la prueba shapiro se obtiene:

shapiro.test(ANTES) 
## 
##  Shapiro-Wilk normality test
## 
## data:  ANTES
## W = 0.94789, p-value = 0.6171

Con un nivel de significancia del 0.05 y un p-valor 0.6171 se acepta la hipotesis H0 de que la datos provienen de una muestra normal.

A continuación se presenta la representación grafica de la distribución de los datos:

h <- hist(ANTES, breaks = 5, main = "Distribución de los datos para la variable 'ANTES'", 
          xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
         xfit <- seq(min(ANTES), max(ANTES), length = 20)
         yfit <- dnorm(xfit, mean = mean(ANTES), sd = sd(ANTES))
         yfit <- yfit * diff(h$mids[1:2]) * length(ANTES)
         lines(xfit, yfit, col = c("#9932CC"), lwd = 2)

Del anterior grafico se puede extra el promedio de los datos:

mean(ANTES)
## [1] 8.8

Del anterior grafico se puede extraer la desviación estandar de los datos.

sd(ANTES)
## [1] 1.139298

De acuerdo a los datos encontrados se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaba sobre una cinta sin fin es de 8.8 minutos y el 95% de los datos presenta datos esta entre los datos 4.557192 y 11.078596.

  • “DESPUÉS”
length(DESPUÉS)
## [1] 11

De acuerdo con lo anterior la variable “DESPUÉS” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk en ambos casos. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.

Para la variable “DESPUÉS” se plantea:

  • H0: La variable DESPUÉS proviene de una población normal.
  • H1: La variable DESPUÉS no proviene de una población normal.
  • Nivel de significancia del 0.05

Aplicando la prueba shapiro se obtiene:

shapiro.test(DESPUÉS) 
## 
##  Shapiro-Wilk normality test
## 
## data:  DESPUÉS
## W = 0.96514, p-value = 0.8337

Con un nivel de significancia del 0.05 y un p-valor 0.8337 se acepta la hipotesis H0 de que la datos provienen de una población normal.

A continuación se presenta la representación grafica de la distribución de los datos:

h <- hist(DESPUÉS, breaks = 5, main = "Distribución de los datos para la variable 'DESPUÉS'", 
          xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
         xfit <- seq(min(DESPUÉS), max(DESPUÉS), length = 20)
         yfit <- dnorm(xfit, mean = mean(DESPUÉS), sd = sd(DESPUÉS))
         yfit <- yfit * diff(h$mids[1:2]) * length(DESPUÉS)
         lines(xfit, yfit, col = c("#9932CC"), lwd = 2)

Del anterior grafico se puede extra el promedio de los datos:

mean(DESPUÉS)
## [1] 13.92727

Del anterior grafico se puede extraer la desviación estandar de los datos.

sd(DESPUÉS)
## [1] 1.234578

De acuerdo a los datos encontrados se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaba sobre una cinta sin fin es de 13.92727 minutos y el 95% de los datos presenta datos esta entre los datos 11.45811 y 16.39643.

Segunda pregunta

Para determinar la verasidad del supuesto del invertigador se realiza un prueba T para muestras pareadas, por medio de esta herramienta se pueden comparar dos variables que pertenecen a un mismo grupo.

El invertigador plantea la siguiente hipotesis:

  • H0: Los elementos de la muestras ANTES y DESPUES son diferentes entre un grupo y otro.
  • H1: Los elementos de la muestras ANTES y DESPUES estan relacionadas entre un grupo y otro, por lo tanto existe beneficio para los pacientes.
  • Nivel de significancia del 0.05
t.test(ANTES, DESPUÉS, paired = TRUE)
## 
##  Paired t-test
## 
## data:  ANTES and DESPUÉS
## t = -11.475, df = 10, p-value = 4.445e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -6.122862 -4.131684
## sample estimates:
## mean of the differences 
##               -5.127273

Con un nivel de significancia del 0.05 y un p-valor de 0,0000004447 existe suficiente evidencia estadistica para aceptar la hipotesis del investigador H1 de que realizar ejercicios moderadamente de manera regular beneficia a pacientes que han sufrido previamente de un infarto de miocardio por exceso de trabajo.