Punto 1

Para este punto utilizaremos la base de datos wage1, para responder las siguentes preguntas:

Determine el nivel educativo promedio de la muestra
- ¿Cuáles son los niveles de educación menor y mayor?

mean(wage1$educ)

## [1] 12.56274

max(wage1$educ)

## [1] 18

min(wage1$educ)

## [1] 0

Se observa que el nivel educativo promedio de la base de datos wage1, la cual cuenta con 526 observaciones, es de 12.5 años.

El nivel máximo de educación fue de 18 años.

El nivel más bajo de educación fue de 0 años.

Determine el salario promedio por hora (wage) en la muestra.
- ¿Parece ser alto o bajo?

mean(wage1$wage)

## [1] 5.896103

El salario promedio por hora es de $5.8

La Semana laboral en Estados Unidos hoy en día, es de 40 horas. Si pagaran $6 por hora, serían $240 a la semana y $960 al mes, cifra que actualmente se consideraría muy baja.

Pero en 1976, cuando se recolectaron los datos, se puede decir que era un salario promedio.

Cuántas mujeres (females) hay en la muestra?
- ¿Cuántos hombres?

sum(wage1$female)

## [1] 252

El número de mujeres de la muestra es de 252

En cuanto al número de Hombres de la muestra, es de 274

Punto 2

En este punto se nos pide utlizar la libreria bwght, y responder lo siguiente:

Cuántas mujeres hay en la muestra (male = 0)?
- cuántas de las informantes fumaron durante un embarazo?

dim(bwght)

## [1] 1388   14

sum(bwght$male)

## [1] 723

sum(bwght$male == 0)

## [1] 665

De las 1388 observaciones, se pudo estimar que 723 de estas son Hombres y 665 son Mujeres

bfc <- subset( bwght_female, cigs > 0 )
dim( bfc )

## [1] 112  14

Para averiguar el número de mujeres que fumaron mientras se encontraban en embarazo, se creó un subconjunto (bwght_female) que solo contenga las mujeres de la muestra.

Para en seguida crear el subconjunto (bfc) del se sacan todas las mujeres del (bwght_female) que hayan fumado 1 o más cigarrillos mientras estaban embarazadas.

¿Cuál es la cantidad promedio de cigarros consumidos por día (cigs)?
- ¿Es el promedio, en este caso, una medida representativa de la mujer “típica”?

mean(bwght$cigs)

## [1] 2.087176

El promedio de cigarrillos que se consumen al día, según la muestra, es de 2.08

Ya que este promedio tiene en cuenta a todas las observaciones de la muestra la cual incluye a los hombres

Entre las mujeres que fumaron durante el embarazo, ¿cuál es la cantidad promedio de cigarros consumidos por día?
- ¿Cuál es la relación de esto con su respuesta al inciso ii) y por qué?

bfc <- subset( bwght_female, cigs > 0 )
mean( bfc$cigs )

## [1] 12.41071

Para encontrar la media de mujeres que fumaron durante el embarazo se utilizó el subconjunto creado, (bfc), y al llevarse a cabo, se encontró que en promedio, una mujer embarazada que fuma, consume 12 cigarrillos al día

Esta medida podría ser más adecuada para representar la “mujer típica”, ya que se toma en cuenta solo a las mujeres de la muestra

Determine el promedio de años de educación del padre en la muestra.
- ¿Por qué se emplean sólo 1 192 observaciones para calcular este promedio?

mean(bwght$fatheduc, na.rm=TRUE)

## [1] 13.18624

La media de años de educación de los padres en la muestra es de 13 años.

Solo se emplean 1192 observaciones para este cálculo, ya que son de las de que se tiene una respuesta, las 196 observaciones faltantes están identificadas como NA (no answer).

-Dé el ingreso familiar promedio (famine) y su desviación estándar en dólares.

 mean(bwght$faminc)

## [1] 29.02666

 sd( bwght$faminc)

## [1] 18.73928

Se encontró que el ingreso familiar promedio fue de $29,026

Con una desviación estándar de $18,7339

Punto 3

Para este punto utlizaremos la base de datos meap01, para contestar las preguntas siguientes.

Determine los valores mayor y menor de math4
- ¿Es lógico este intervalo? Explique

max(meap01$math4)

## [1] 100

min(meap01$math4)

## [1] 0

La tasa máxima de aprobación de estudiantes de examen de matemáticas (math4) es del 100%.

La tasa mínima de aprobación del examen de matemáticas es del 0%.

Este intervalo es lógico, ya que lo que nos está diciendo es que hubo escuelas en donde todos los estudiantes aprobaron el examen de matemáticas mientras que en otras ningún estudiante aprobó.

¿Cuántas escuelas tienen una tasa perfecta de aprobados en el examen de matemáticas?4
- ¿A qué porcentaje del total de la muestra corresponde esta cantidad?

meap01_100m <- subset(meap01, math4 == 100 )

dim(meap01_100m)

## [1] 38 11

De las 1823 escuelas de la muestra, 38 tuvieron una tasa perfecta de aprobados en el examen de matemáticas.

Estas 38 escuelas representan el 2.08% del total de la muestra.

¿En cuántas escuelas la tasa de aprobados en matemáticas es exactamente 50%?

meap01_50m <- subset(meap01, math4 == 50)
dim(meap01_50m)

## [1] 17 11

17 escuelas tuvieron una tasa de aprobados en matemáticas de exactamente 50%.

Compare el promedio de las tasas de aprobados en matemáticas y en lectura.
- ¿Cuál de estas pruebas es más difícil de aprobar?

mean(meap01$math4)

## [1] 71.909

mean(meap01$read4)

## [1] 60.06188

El promedio de la tasa de aprobados en matemáticas fue de 71%.

La promedio de la tasa de aprobados en lectura fue de 60%

Al ser menor la tasa de aprobación del examen de lectura, se puede concluir que esta es la prueba más difícil de aprobar.

Encuentre la correlación entre math4 y read4. ¿Qué concluye?

La tasa de aprobados en matemáticas y la tasa de aprobados en lectura tienen una correlación de 0.84, la cual es una relación lineal positiva, en otras palabras cuando una de las tasas aumenta la otra aumenta también. Esto se podría explicar con un cambio favorable de la forma de enseñanza en las escuelas.

La variable exppp es gasto por alumno. Determine el promedio y la desviación estándar de exppp
- ¿Parece haber una gran variación en el gasto por alumno?

 mean(meap01$exppp)

## [1] 5194.865

 sd(meap01$exppp)

## [1] 1091.89

El promedio de gasto de un alumno es de $5194, con una desviación estándar de $1091.

Sí existe una variación en el gasto por alumno considerable de $1091

Actividad 2

library(wooldridge)r

Valeria Duque, Nicolas Muños y Daniel Victoria

Punto 1

Punto 2

Punto 3