Ejercicio

Se pensó que un programa de ejercicios regulares, moderadamente activos, podría beneficiar a los pacientes que habían sufrido previamente un infarto de miocardio por exceso de trabajo. Once individuos participaron en un estudio para comprobar este argumento. Antes de que empezara el programa, se determinó la capacidad de trabajo de cada persona midiendo el tiempo que tardó en alcanzar una frecuencia de 160 latidos por minuto mientras caminaba sobre una cinta sin fin. Después de 25 semanas de ejercicio controlado, se repitieron las medidas en la cienta sin fin y se registró la diferencia en tiempo para cada sujeto. Resultaron los siguientes datos:

SUJETO <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
ANTES <- c(7.6, 9.9, 8.6, 9.5, 8.4, 9.2, 6.4, 9.9, 8.7, 10.3, 8.3)
DESPUÉS <- c(14.7, 14.1, 11.8, 16.1, 14.7, 14.1, 13.2, 14.9, 12.2, 13.4, 14)

Tabla <- matrix(c(SUJETO, ANTES, DESPUÉS),nrow=11 ,ncol=3)
dataframe <- as.data.frame(Tabla)
names(dataframe) <- c("SUJETO","ANTES", "DESPUÉS")
dataframe
##    SUJETO ANTES DESPUÉS
## 1       1   7.6    14.7
## 2       2   9.9    14.1
## 3       3   8.6    11.8
## 4       4   9.5    16.1
## 5       5   8.4    14.7
## 6       6   9.2    14.1
## 7       7   6.4    13.2
## 8       8   9.9    14.9
## 9       9   8.7    12.2
## 10     10  10.3    13.4
## 11     11   8.3    14.0
  • Realice la prueba de normalidad para cada una de las variables.
  • ¿Sostienen estos datos el argumento de los invertigadores?

Solución

Primera pregunta

Para realizar el análisis de normalidad a las variables “ANTES” y “DESPUÉS” se debe identificar la prueba más pertinente. Existen dos tipos de prueba: Shapiro Wilk y Kolmogorov-Smirnov. La diferencia que radica entre ambos es que el primero se utiliza en tamaños de muestras pequeñas (n<30), mientras segundo es aplicado a muestras grandes(n>=30).

Para determinar el tipo de prueba a utilizar se determina a continuación el número de datos de cada variable:

  • “ANTES”:
length(ANTES)
## [1] 11

De acuerdo con lo anterior, la variable “ANTES” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.

Para la variable “ANTES” se plantea:

  • H0: La variable ANTES proviene de una población normal.
  • H1: La variable ANTES no proviene de una población normal.
  • Nivel de significancia del 0.05

Aplicando la prueba shapiro se obtiene:

shapiro.test(ANTES) 
## 
##  Shapiro-Wilk normality test
## 
## data:  ANTES
## W = 0.94789, p-value = 0.6171

Con un nivel de significancia del 0.05 y un p-valor de 0.6171 se acepta la hipótesis H0 de que la datos provienen de una muestra normal.

A continuación, se presenta la representación gráfica de la distribución de los datos:

h <- hist(ANTES, breaks = 5, main = "Distribución de los datos para la variable 'ANTES'", 
          xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
         xfit <- seq(min(ANTES), max(ANTES), length = 20)
         yfit <- dnorm(xfit, mean = mean(ANTES), sd = sd(ANTES))
         yfit <- yfit * diff(h$mids[1:2]) * length(ANTES)
         lines(xfit, yfit, col = c("#9932CC"), lwd = 2)

Del anterior gráfico se puede extraer el promedio de los datos:

mean(ANTES)
## [1] 8.8

Del anterior gráfico se puede extraer la desviación estándar de los datos.

sd(ANTES)
## [1] 1.139298

De acuerdo a los datos encontrados, se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaban sobre una cinta sin fin es de 8.8 minutos y el 95% de la muestra presenta datos entre 4.557192 y 11.078596.

  • “DESPUÉS”
length(DESPUÉS)
## [1] 11

De acuerdo con lo anterior, la variable “DESPUÉS” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.

Para la variable “DESPUÉS” se plantea:

  • H0: La variable DESPUÉS proviene de una población normal.
  • H1: La variable DESPUÉS no proviene de una población normal.
  • Nivel de significancia del 0.05

Aplicando la prueba shapiro se obtiene:

shapiro.test(DESPUÉS) 
## 
##  Shapiro-Wilk normality test
## 
## data:  DESPUÉS
## W = 0.96514, p-value = 0.8337

Con un nivel de significancia del 0.05 y un p-valor de 0.8337 se acepta la hipótesis H0 de que la datos provienen de una población normal.

A continuación, se presenta la representación gráfica de la distribución de los datos:

h <- hist(DESPUÉS, breaks = 5, main = "Distribución de los datos para la variable 'DESPUÉS'", 
          xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
         xfit <- seq(min(DESPUÉS), max(DESPUÉS), length = 20)
         yfit <- dnorm(xfit, mean = mean(DESPUÉS), sd = sd(DESPUÉS))
         yfit <- yfit * diff(h$mids[1:2]) * length(DESPUÉS)
         lines(xfit, yfit, col = c("#9932CC"), lwd = 2)

Del anterior gráfico se puede extra el promedio de los datos:

mean(DESPUÉS)
## [1] 13.92727

Del anterior gráfico se puede extraer la desviación estándar de los datos.

sd(DESPUÉS)
## [1] 1.234578

De acuerdo a los datos encontrados, se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaban sobre una cinta sin fin es de 13.92727 minutos y el 95% de la muestra presenta datos entre 11.45811 y 16.39643.

Segunda pregunta

Para determinar la veracidad del supuesto del invertigador se realiza un prueba T para muestras pareadas, por medio de esta herramienta se pueden comparar dos variables que pertenecen a un mismo grupo.

El invertigador plantea la siguiente hipótesis:

  • H0: Los elementos de la muestras ANTES y DESPUES son diferentes entre un grupo y otro.
  • H1: Los elementos de la muestras ANTES y DESPUES están relacionadas entre un grupo y otro, por lo tanto existe beneficio para los pacientes.
  • Nivel de significancia del 0.05
t.test(ANTES, DESPUÉS, paired = TRUE)
## 
##  Paired t-test
## 
## data:  ANTES and DESPUÉS
## t = -11.475, df = 10, p-value = 4.445e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -6.122862 -4.131684
## sample estimates:
## mean of the differences 
##               -5.127273

Con un nivel de significancia del 0.05 y un p-valor de 0,0000004445, existe suficiente evidencia estadística para aceptar la hipótesis del investigador H1 de que realizar ejercicios moderadamente de manera regular beneficia a pacientes que han sufrido previamente de un infarto de miocardio por exceso de trabajo.