Taller 3 - parte 2
Estadística Inferencial
Fecha de entrega: miércoles 22 de mayo, 2024
Regresión lineal y pruebas de bondadde ajuste

Autor

Roberto Trespalacios

Observaciones

  • El taller puede hacerse en grupo de tres estudiantes.
  • Se debe subir a SAVIO un archivo pdf con la solución de los problemas a mano y un archivo html con la solución en R.
  • Solo un estudiante debe subir el taller y en el encabezado de cada archivo deben estar los nombres y apellidos de los integrantes del grupo.
  • El archivo debe tener el nombre siguiente:

Nombre_Apellido_estudiante1_Nombre_Apellido_Estudiante2_Nombre_Apellido_Estudiante3_taller_3_codigo_curso.pdf

Regresión lineal (en R y a mano)

  1. La siguiente tabla incluye información acerca del peso(Y) (kg) y la altura(X) (cm) de 12 individuos:
Peso 74 92 63 72 58 78 85 85 73 62 80 72
Altura 168 196 170 175 162 169 190 186 176 170 176 179
  1. Construya la gráfica de los puntos.
  2. Calcular la correlación que existe entre el peso y la altura.
  3. Encuentre los estimadores del intercepto y la pendiente
  4. Grafique la recta de regresión y los puntos.
  5. Si un individuo mide 170 cm, ¿cuál será su peso en kg?.
  1. Se llevó a cabo un estudio para determinar la relación entre el número de años de experiencia y laboral el salario(millones) mensual percibido por los ingenieros de varias carreras (eléctrica, mecánica e industrial). Para ellos se tomó una muestra aleatoria de 17 ingenieros la cual arrojo los siguientes resultados:
Años de Experiencia Laboral Salario(millones)
13 2.61
16 3.32
30 3.61
2 1.65
8 2.64
6 1.91
31 3.64
19 3.38
20 3.65
1 1.69
4 1.98
10 2.46
27 3.60
25 3.65
7 2.14
15 3.10
13 3.14
9 2.05
  1. Calcular la correlación que existe entre el peso y la altura. interprete.
  2. Encuentre los estimadores del intercepto \(\beta_0\) y la pendiente \(\beta_1\).
  3. Grafique la recta de regresión y los puntos.
  4. Si un individuo tiene una experiencia de 5 años, ¿cuál será su salario?.

Pruebas de bondad de ajuste (en R y a mano)

  1. Los maestros quieren saber qué noche de la semana sus estudiantes hacen la mayor parte de las tareas para la casa. La mayoría de los maestros piensan que los estudiantes hacen las tareas para la casa por igual a lo largo de la semana. Supongamos que se pregunta a una muestra aleatoria de 56 estudiantes en qué noche de la semana hacen más tareas para la casa. Los resultados se distribuyeron como en la tabla
Domingo Lunes Martes Miércoles Jueves Viernes Sábado
Número de estudiantes 11 8 10
7
10 5 5

De la población de estudiantes, ¿las noches en las que el mayor número de estudiantes hace la mayoría de sus tareas para la casa ocurren con igual frecuencia durante una semana? ¿Qué tipo de prueba de hipótesis debe utilizar?

  1. Una moneda fue lanzada al aire 1000 series, de 5 veces cada serie y se observó el número de caras de cada serie. El número de series en los que se presentaron 0, 1, 1, 3, 4 y 5 caras se muestra en la siguiente tabla.
Número de caras Número de series (frecuencia observada)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000

Probar que los datos tienen una distribución binomial, usando un \(\alpha= 0.05\).

  1. El número de alumnos por semana que sufren algún tipo de accidente en un colegio durante 36 semanas del periodo escolar es la siguiente:
\(N^o\) de alumnos accidentados 0 1 2 3 4 ó más
\(N^o\) de semanas con \(X\) accidentes 5 8 10 6 6

Probar si la muestra de datos se ajusta a una distribución de Poisson con intensidad λ , con un nivel de significación de 5%.

  1. En una ciudad la distribución habitual del grupo sanguíneo es de un 35%, 10%, 6% y un 49% para los grupos A, B, AB y O respectivamente. En Antofagasta, se realizó el estudio en una muestra de 200 individuos obteniéndose una distribución de 100, 60, 36, y 20 individuos para los grupos A, B AB y O respectivamente. Verifique si la muestra de datos de la ciudad de Antofagasta se ajusta a la distribución habitual del grupo sanguíneo en dicha ciudad usando un nivel de significancia de 0.01.

  2. Con el fin de conocer si un cierto tipo de bacterias se distribuyen al azar en un determinado cultivo o si, por el contrario, lo hacen con algún tipo de preferencia (el centro, los extremos, etc…), se divide un cultivo en 576 áreas iguales y se cuenta el número de bacterias en cada área. Los resultados son los siguientes:

\(N^o\) de bacterias 0 1 2 3 4 ó más
\(N^o\) de áreas 229 211 93 35 8

¿Se ajustan los datos a una distribución de Poisson de intensidad \(\lambda\)? Use un nivel de significancia de 0.05

  1. La siguiente tabla recoge la distribución de los triglicéridos en suero, expresados en mg/dl en 90 niños de 6 años:
Nivel de triglicéridos Frecuencias
Menos de 20 5
(20, 30] 11
(30, 40] 15
(40, 50] 24
(50, 60] 18
(60, 70] 12
[70, 0] 5

Contrastar la hipótesis de que los datos se ajustan a una distribución Normal de media \(\mu\) y varianza \(\sigma^2\) con un nivel de significancia del 0.05.