1. Determinar y justificar si las siguientes afirmaciones son Falsas o Verdaderas.
  • La mitad de las observaciones de una muestra es menor o igual que la media.
  • La media de un conjunto de datos es el valor que ocurre con más frecuencia.
  • La media de una muestra es igual a una de las observaciones de la muestra.
  • Es preferible utilizar un instrumento de medición que genere observaciones con una desviación estándar grande.
  • Por lo general, la media y la mediana de un conjunto de datos son valores muy similares.
  1. El archivo capacidad_aerobica.csv contiene los datos de un grupo de 31 pacientes que pertenecen a un programa de pacientes de enfermedades crónicas. Durante una prueba de esfuerzo, se midieron sus pulsaciones (antes, durante y después), edad, tiempo de la prueba, peso y oxigenación. Considere la oxigenación (porcentaje de saturación arterial de oxígeno) de los pacientes con menos de 50 años, y la oxigenación de los pacientes con 50 años o más.
  • Completar la siguiente tabla:
Grupo \(n\) Mín. Cuar. 1 Cuar. 2 Cuar. 3 Máx. Media DE CV
Menos de 50 años 19
50 años o más 12

DE: Desviación Estándar. CV: Coeficiente de Variación.

  • Comparar los resultados para determinar si los datos indican que la oxigenación es superior para los pacientes con menos de 50 años.

A continuación, se presenta el procedimiento importar este conjunto de datos en R.

# establecer el directorio de trabajo
setwd(dir = "C:/Users/Juan Camilo/Dropbox/UN/Talleres/")

# Los datos vienen un archivo tipo csv, separado por ";", para leerlos:
c_aerobica<-read.table("capacidad_aerobica.csv",h=T, sep=";")

# datos grupo 1: menos de 50 años
x_1 <- c_aerobica$Oxig[c_aerobica$edad <  50]

# datos grupo 2: 50 años o más
x_2 <- c_aerobica$Oxig[c_aerobica$edad >= 50]

# tamaños de muestra
n_1 <- length(x_1)
n_2 <- length(x_2)

Observe que para importar la base de datos exitosamente en R por medio de la rutina read.table, hay que proporcionar la ruta de acceso estableciendo el directorio de trabajo con setwd. ¡No olvide actualizar esta ruta!

  1. El artículo Prevalencia de la práctica de actividad física y estado nutricional en adolescentes de la subregión los Santanderes Colombia: resultados de la ENSIN 2015 (Poveda Acelas, C. A., & Poveda Acelas, D. C., RESPYN Revista Salud Pública y Nutrición, 20(2), 13–21, 2021) analiza, entre otras cosas, el número de días a la semana que un grupo de adolescentes hacen ejercicios con pesas. Con base en la tabla 3 de este artículo:
  • Completar la distribución de frecuencias para cada uno de los sexos (frecuencia relativa y frecuencias acumuladas).

  • Elabore una gráfica que represente la distribución, por sexo, del número de días a la semana que los adolescentes hacen ejercicios con pesas.

  • Calcular la media, la mediana, el rango intercuartílico y el coeficiente de variación, para cada uno de los sexos.

  • Comentar los resultados de los numerales anteriores, ¿qué diferencias hay entre los adolescentes de sexo masculino y femenino?.

  1. Una muestra de temperaturas para iniciar una cierta reacción química dio un promedio muestral (C) de 87.3 y una desviación estándar muestral de (C) 1.04. ¿Cuáles son el promedio muestral y la desviación estándar medidos en F?

Sugerencia: recuerde que F = \(\tfrac95\)C + 32 y utilice las propiedades de la media y de la varianza.

  1. Sean \(X\) y \(Y\) dos variables tales que: \[ \sum_{i=1}^{10} x_i = 110, \quad \sum_{i=1}^{10} y_i = 60, \quad \sum_{i=1}^{10} x_i^2 = 3156 \quad \text{y}\quad \sum_{i=1}^{10} y_i^2 = 1138. \] Para cada variable calcular el coeficiente de variación. Interpretar y comparar los resultados obtenidos.

Sugerencia: recuerde que \(\sum_{i=1}^n(x_i-\bar{x})^2 = \sum_{i=1}^n x_i^2 - n\bar{x}^2\).

  1. Sean \(X\) y \(Y\) dos variables tales que: \[ \sum_{i=1}^{10} x_i = 110, \quad \sum_{i=1}^{10} y_i = 60, \quad \sum_{i=1}^{10} x_i^2 = 3156 \quad \text{y}\quad \sum_{i=1}^{10} y_i^2 = 1138. \] Para cada variable calcular el coeficiente de variación. Interpretar y comparar los resultados obtenidos.

  2. En cierta población la distribución del peso de tiene una media de 95.41 kg y una desviación típica de 2.33 kg, mientras que la distribución del índice de masa corporal tiene una media de 22.1 kg/m\(^2\) y una desviación de 2.33 kg/m\(^2\). ¿Cuál de las dos distribuciones tiene mayor variabilidad? ¿Por qué?