Se pensó que un programa de ejercicios regulares, moderadamente activos, podría beneficiar a los pacientes que habían sufrido previamente un infarto de miocardio por exceso de trabajo. Once individuos participaron en un estudio para comprobar este argumento. Antes de que empezara el programa, se determinó la capacidad de trabajo de cada persona midiendo el tiempo que tardó en alcanzar una frecuencia de 160 latidos por minuto mientras caminaba sobre una cinta sin fin. Después de 25 semanas de ejercicio controlado, se repitieron las medidas en la cienta sin fin y se registró la diferencia en tiempo para cada sujeto. Resultaron los siguientes datos:
SUJETO <- c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
ANTES <- c(7.6, 9.9, 8.6, 9.5, 8.4, 9.2, 6.4, 9.9, 8.7, 10.3, 8.3)
DESPUÉS <- c(14.7, 14.1, 11.8, 16.1, 14.7, 14.1, 13.2, 14.9, 12.2, 13.4, 14)
Tabla <- matrix(c(SUJETO, ANTES, DESPUÉS),nrow=11 ,ncol=3)
dataframe <- as.data.frame(Tabla)
names(dataframe) <- c("SUJETO","ANTES", "DESPUÉS")
dataframe## SUJETO ANTES DESPUÉS
## 1 1 7.6 14.7
## 2 2 9.9 14.1
## 3 3 8.6 11.8
## 4 4 9.5 16.1
## 5 5 8.4 14.7
## 6 6 9.2 14.1
## 7 7 6.4 13.2
## 8 8 9.9 14.9
## 9 9 8.7 12.2
## 10 10 10.3 13.4
## 11 11 8.3 14.0
Para realizar el análisis de normalidad a las variables “ANTES” y “DESPUÉS” se debe identificar la prueba más pertinente. Existen dos tipos de prueba: Shapiro Wilk y Kolmogorov-Smirnov. La diferencia que radica entre ambos es que el primero se utiliza en tamaños de muestras pequeñas (n<30), mientras segundo es aplicado a muestras grandes(n>=30).
Para determinar el tipo de prueba a utilizar se determina a continuación el número de datos de cada variable:
length(ANTES)## [1] 11
De acuerdo con lo anterior, la variable “ANTES” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.
Para la variable “ANTES” se plantea:
Aplicando la prueba shapiro se obtiene:
shapiro.test(ANTES) ##
## Shapiro-Wilk normality test
##
## data: ANTES
## W = 0.94789, p-value = 0.6171
Con un nivel de significancia del 0.05 y un p-valor de 0.6171 se acepta la hipótesis H0 de que la datos provienen de una muestra normal.
A continuación, se presenta la representación gráfica de la distribución de los datos:
h <- hist(ANTES, breaks = 5, main = "Distribución de los datos para la variable 'ANTES'",
xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
xfit <- seq(min(ANTES), max(ANTES), length = 20)
yfit <- dnorm(xfit, mean = mean(ANTES), sd = sd(ANTES))
yfit <- yfit * diff(h$mids[1:2]) * length(ANTES)
lines(xfit, yfit, col = c("#9932CC"), lwd = 2)Del anterior gráfico se puede extraer el promedio de los datos:
mean(ANTES)## [1] 8.8
Del anterior gráfico se puede extraer la desviación estándar de los datos.
sd(ANTES)## [1] 1.139298
De acuerdo a los datos encontrados, se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaban sobre una cinta sin fin es de 8.8 minutos y el 95% de la muestra presenta datos entre 4.557192 y 11.078596.
length(DESPUÉS)## [1] 11
De acuerdo con lo anterior, la variable “DESPUÉS” cuenta con 11 elementos, por lo tanto, se debe aplicar la prueba Shapiro Wilk. Para realizar dicha prueba en el software Rstudio se debe usar el codigo shapiro.test() junto con la variable que se busca estudiar.
Para la variable “DESPUÉS” se plantea:
Aplicando la prueba shapiro se obtiene:
shapiro.test(DESPUÉS) ##
## Shapiro-Wilk normality test
##
## data: DESPUÉS
## W = 0.96514, p-value = 0.8337
Con un nivel de significancia del 0.05 y un p-valor de 0.8337 se acepta la hipótesis H0 de que la datos provienen de una población normal.
A continuación, se presenta la representación gráfica de la distribución de los datos:
h <- hist(DESPUÉS, breaks = 5, main = "Distribución de los datos para la variable 'DESPUÉS'",
xlab = "Tiempo para alcanzar una frecuencia de 160 latidos por minuto", ylab = "Frecuencia", col="#E0FFFF")
xfit <- seq(min(DESPUÉS), max(DESPUÉS), length = 20)
yfit <- dnorm(xfit, mean = mean(DESPUÉS), sd = sd(DESPUÉS))
yfit <- yfit * diff(h$mids[1:2]) * length(DESPUÉS)
lines(xfit, yfit, col = c("#9932CC"), lwd = 2)Del anterior gráfico se puede extra el promedio de los datos:
mean(DESPUÉS)## [1] 13.92727
Del anterior gráfico se puede extraer la desviación estándar de los datos.
sd(DESPUÉS)## [1] 1.234578
De acuerdo a los datos encontrados, se puede decir que el tiempo promedio de los participantes para llegar a 160 latidos por minuto mientras caminaban sobre una cinta sin fin es de 13.92727 minutos y el 95% de la muestra presenta datos entre 11.45811 y 16.39643.
Para determinar la veracidad del supuesto del invertigador se realiza un prueba T para muestras pareadas, por medio de esta herramienta se pueden comparar dos variables que pertenecen a un mismo grupo.
El invertigador plantea la siguiente hipótesis:
t.test(ANTES, DESPUÉS, paired = TRUE)##
## Paired t-test
##
## data: ANTES and DESPUÉS
## t = -11.475, df = 10, p-value = 4.445e-07
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -6.122862 -4.131684
## sample estimates:
## mean of the differences
## -5.127273
Con un nivel de significancia del 0.05 y un p-valor de 0,0000004445, existe suficiente evidencia estadística para aceptar la hipótesis del investigador H1 de que realizar ejercicios moderadamente de manera regular beneficia a pacientes que han sufrido previamente de un infarto de miocardio por exceso de trabajo.