Para este punto utilizaremos la base de datos wage1, para responder las siguentes preguntas:
mean(wage1$educ)
## [1] 12.56274
max(wage1$educ)
## [1] 18
min(wage1$educ)
## [1] 0
Se observa que el nivel educativo promedio de la base de datos wage1, la cual cuenta con 526 observaciones, es de 12.5 años.
El nivel máximo de educación fue de 18 años.
El nivel más bajo de educación fue de 0 años.
mean(wage1$wage)
## [1] 5.896103
El salario promedio por hora es de $5.8
La Semana laboral en Estados Unidos hoy en día, es de 40 horas. Si pagaran $6 por hora, serían $240 a la semana y $960 al mes, cifra que actualmente se consideraría muy baja.
Pero en 1976, cuando se recolectaron los datos, se puede decir que era un salario promedio.
sum(wage1$female)
## [1] 252
El número de mujeres de la muestra es de 252
En cuanto al número de Hombres de la muestra, es de 274
En este punto se nos pide utlizar la libreria bwght, y responder lo siguiente:
dim(bwght)
## [1] 1388 14
sum(bwght$male)
## [1] 723
sum(bwght$male == 0)
## [1] 665
De las 1388 observaciones, se pudo estimar que 723 de estas son Hombres y 665 son Mujeres
bfc <- subset( bwght_female, cigs > 0 )
dim( bfc )
## [1] 112 14
Para averiguar el número de mujeres que fumaron mientras se encontraban en embarazo, se creó un subconjunto (bwght_female) que solo contenga las mujeres de la muestra.
Para en seguida crear el subconjunto (bfc) del se sacan todas las mujeres del (bwght_female) que hayan fumado 1 o más cigarrillos mientras estaban embarazadas.
mean(bwght$cigs)
## [1] 2.087176
El promedio de cigarrillos que se consumen al día, según la muestra, es de 2.08
Ya que este promedio tiene en cuenta a todas las observaciones de la muestra la cual incluye a los hombres
bfc <- subset( bwght_female, cigs > 0 )
mean( bfc$cigs )
## [1] 12.41071
Para encontrar la media de mujeres que fumaron durante el embarazo se utilizó el subconjunto creado, (bfc), y al llevarse a cabo, se encontró que en promedio, una mujer embarazada que fuma, consume 12 cigarrillos al día
Esta medida podría ser más adecuada para representar la “mujer típica”, ya que se toma en cuenta solo a las mujeres de la muestra
mean(bwght$fatheduc, na.rm=TRUE)
## [1] 13.18624
La media de años de educación de los padres en la muestra es de 13 años.
Solo se emplean 1192 observaciones para este cálculo, ya que son de las de que se tiene una respuesta, las 196 observaciones faltantes están identificadas como NA (no answer).
-Dé el ingreso familiar promedio (famine) y su desviación estándar en dólares.
mean(bwght$faminc)
## [1] 29.02666
sd( bwght$faminc)
## [1] 18.73928
Se encontró que el ingreso familiar promedio fue de $29,026
Con una desviación estándar de $18,7339
Para este punto utlizaremos la base de datos meap01, para contestar las preguntas siguientes.
max(meap01$math4)
## [1] 100
min(meap01$math4)
## [1] 0
La tasa máxima de aprobación de estudiantes de examen de matemáticas (math4) es del 100%.
La tasa mínima de aprobación del examen de matemáticas es del 0%.
Este intervalo es lógico, ya que lo que nos está diciendo es que hubo escuelas en donde todos los estudiantes aprobaron el examen de matemáticas mientras que en otras ningún estudiante aprobó.
meap01_100m <- subset(meap01, math4 == 100 )
dim(meap01_100m)
## [1] 38 11
De las 1823 escuelas de la muestra, 38 tuvieron una tasa perfecta de aprobados en el examen de matemáticas.
Estas 38 escuelas representan el 2.08% del total de la muestra.
meap01_50m <- subset(meap01, math4 == 50)
dim(meap01_50m)
## [1] 17 11
17 escuelas tuvieron una tasa de aprobados en matemáticas de exactamente 50%.
mean(meap01$math4)
## [1] 71.909
mean(meap01$read4)
## [1] 60.06188
El promedio de la tasa de aprobados en matemáticas fue de 71%.
La promedio de la tasa de aprobados en lectura fue de 60%
Al ser menor la tasa de aprobación del examen de lectura, se puede concluir que esta es la prueba más difícil de aprobar.
La tasa de aprobados en matemáticas y la tasa de aprobados en lectura tienen una correlación de 0.84, la cual es una relación lineal positiva, en otras palabras cuando una de las tasas aumenta la otra aumenta también. Esto se podría explicar con un cambio favorable de la forma de enseñanza en las escuelas.
mean(meap01$exppp)
## [1] 5194.865
sd(meap01$exppp)
## [1] 1091.89
El promedio de gasto de un alumno es de $5194, con una desviación estándar de $1091.
Sí existe una variación en el gasto por alumno considerable de $1091