Cargar las librerías:

#install.packages("ggplot2")
library(dplyr)
library(tidyr)
library(ggplot2)

Cargamos los datos

Set de Datos que contiene la distribución conjunta de la edad (Age) y el ingreso promedio por hora (AHE) para trabajadores de tiempo completo de entre 25 y 34 años en 2012, con un nivel educativo superior al de educación media superior.

datos_matriz <- read.csv("Age_HourlyEarnings.csv", header = TRUE)

data <- pivot_longer(datos_matriz, cols = starts_with("Age"), names_to = "Age", values_to = "Probability") 

data$Age <- as.numeric(gsub("Age_", "", data$Age)) #probabilidad conjunta entre salario y edad. 

Completa los siguientes ejercicios

  1. Calcula la distribución marginal de la edad (Age).Osea la prob de que me salga alguien de 24, 25, 26 y así hasta 34.
data %>% head() #me estoy ahorrando el paso de especificar todo, con esto le pongo la condicion de que siempre como que se vayan ligando las instrucciones. 

##forma tradicional 
sum(datos_matriz$Age_25)
[1] 0.08488994
## y asi con cada uno pero vamos a optimizar con el dplyr 
marginal_age <- data%>% #"marginal_age <-" es para que salga en el environment 
  group_by(Age) %>% 
  summarise(Marginal_Probability = sum(Probability)) #le digo que me de las sumas de las probabilidades y me las enseñe en resumen en una nueva columna llamada Marginal_Probability. 
  1. Calcula la media de AHE para cada valor de la edad; es decir, calcula \(E(AHE∣Age=25)\), y así sucesivamente.Osea la probabilidad condicioneada
conditional_mean <- data %>%
  group_by(Age) %>%
  summarise(E_AHE_given_Age = sum(AHE * Probability)/sum(Probability))
conditional_mean 
  1. Calcula y grafica la media de AHE en función de la edad (Age). ¿Existe una relación entre el ingreso promedio por hora y la edad? Explica.
ggplot(conditional_mean,aes(x= Age, y=E_AHE_given_Age))+
  geom_point()

  1. Utiliza la ley de la esperanza iterada para calcular la media de AHE; es decir, calcula \(E(AHE)\).

\[ E(AHE)=\sum_{age}​E(AHE∣Age)⋅P(Age) \]

# Tomas la media condicional de cada edad y la pesas por la probabilidad de que ocurra esa edad. 
E_AHE <- conditional_mean %>% 
  left_join(marginal_age, by = "Age") %>%    #une ambas tablas por Age
  summarise(E_AHE = sum(E_AHE_given_Age*Marginal_Probability))  #pondera y suma
  1. Calcula la varianza de AHE. \[var(Y)= E[(Y-E(Y))^2]\]
# Primero extraemos E(AHE) como número simple
media_AHE <- E_AHE$E_AHE  

var_AHE <- data %>%
  summarise(Var_AHE = sum((AHE - media_AHE)^2 * Probability))
  1. Calcula la covarianza entre AHE y la edad (Age).

\[Cov(AHE,Age)=E(AHE⋅Age)−E(AHE)E(Age)\]

# E(Age) desde la marginal
E_Age <- marginal_age %>%
  summarise(E_Age = sum(Age * Marginal_Probability)) %>%
  pull(E_Age)

# E(AHE * Age): producto de cada combinación ponderado por prob conjunta
E_AHE_Age <- data %>%
  summarise(E_AHE_Age = sum(AHE * Age * Probability)) %>%
  pull(E_AHE_Age)

# Covarianza
cov_AHE_Age <- E_AHE_Age - media_AHE * E_Age
  1. Calcula la correlación entre AHE y la edad (Age).

\[Corr(AHE,Age)=\frac{Cov(AHE,Age)}{Var(AHE)Var(Age)}\]

# Varianza de Age (igual que la de AHE pero con Age)
var_Age <- marginal_age %>%
  summarise(Var_Age = sum((Age - E_Age)^2 * Marginal_Probability)) %>%
  pull(Var_Age)

var_AHE_val <- var_AHE$Var_AHE

# Correlación
corr_AHE_Age <- cov_AHE_Age/sqrt(var_AHE_val*var_Age) 
  1. Relaciona tus respuestas de los incisos (f) y (g) con la gráfica que construiste en el inciso (c).

La covarianza de 5.72 es positiva, lo que indica que AHE y Age se mueven en la misma dirección: conforme aumenta la edad, el ingreso promedio por hora tiende a aumentar. Sin embargo, la covarianza no es fácil de interpretar directamente porque depende de las unidades de cada variable y para ello usamos la correlación de 0.156. Aunque es positiva y confirma la dirección que vemos en la gráfica del inciso (c), es un valor relativamente débil (cercano a 0). Esto sugiere que si bien existe una tendencia creciente entre edad e ingreso, la relación no es muy fuerte, hay mucha dispersión en los ingresos dentro de cada grupo de edad, y la edad por sí sola explica poco de la variación en AHE.

LS0tDQp0aXRsZTogIkVqZXJjaWNpbyBSZXBhc28gUHJvYmFiaWxpZGFkIg0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KYGBge3IgZWNobz1GQUxTRX0NCmtuaXRyOjpvcHRzX2NodW5rJHNldChlY2hvID0gRkFMU0UpDQpgYGANCg0KQ2FyZ2FyIGxhcyBsaWJyZXLDrWFzOg0KDQpgYGB7cn0NCiNpbnN0YWxsLnBhY2thZ2VzKCJnZ3Bsb3QyIikNCmxpYnJhcnkoZHBseXIpDQpsaWJyYXJ5KHRpZHlyKQ0KbGlicmFyeShnZ3Bsb3QyKQ0KYGBgDQoNCiMgQ2FyZ2Ftb3MgbG9zIGRhdG9zDQoNClNldCBkZSBEYXRvcyBxdWUgY29udGllbmUgbGEgZGlzdHJpYnVjacOzbiBjb25qdW50YSBkZSBsYSBlZGFkIChBZ2UpIHkgZWwgaW5ncmVzbyBwcm9tZWRpbyBwb3IgaG9yYSAoQUhFKSBwYXJhIHRyYWJhamFkb3JlcyBkZSB0aWVtcG8gY29tcGxldG8gZGUgZW50cmUgMjUgeSAzNCBhw7FvcyBlbiAyMDEyLCBjb24gdW4gbml2ZWwgZWR1Y2F0aXZvIHN1cGVyaW9yIGFsIGRlIGVkdWNhY2nDs24gbWVkaWEgc3VwZXJpb3IuDQoNCmBgYHtyfQ0KZGF0b3NfbWF0cml6IDwtIHJlYWQuY3N2KCJBZ2VfSG91cmx5RWFybmluZ3MuY3N2IiwgaGVhZGVyID0gVFJVRSkNCg0KZGF0YSA8LSBwaXZvdF9sb25nZXIoZGF0b3NfbWF0cml6LCBjb2xzID0gc3RhcnRzX3dpdGgoIkFnZSIpLCBuYW1lc190byA9ICJBZ2UiLCB2YWx1ZXNfdG8gPSAiUHJvYmFiaWxpdHkiKSANCg0KZGF0YSRBZ2UgPC0gYXMubnVtZXJpYyhnc3ViKCJBZ2VfIiwgIiIsIGRhdGEkQWdlKSkgI3Byb2JhYmlsaWRhZCBjb25qdW50YSBlbnRyZSBzYWxhcmlvIHkgZWRhZC4gDQoNCmBgYA0KDQoNCiMgQ29tcGxldGEgbG9zIHNpZ3VpZW50ZXMgZWplcmNpY2lvcw0KDQphLiBDYWxjdWxhIGxhIGRpc3RyaWJ1Y2nDs24gbWFyZ2luYWwgZGUgbGEgZWRhZCAoQWdlKS5Pc2VhIGxhIHByb2IgZGUgcXVlIG1lIHNhbGdhIGFsZ3VpZW4gZGUgMjQsIDI1LCAyNiB5IGFzw60gaGFzdGEgMzQuIA0KYGBge3J9IA0KZGF0YSAlPiUgaGVhZCgpICNtZSBlc3RveSBhaG9ycmFuZG8gZWwgcGFzbyBkZSBlc3BlY2lmaWNhciB0b2RvLCBjb24gZXN0byBsZSBwb25nbyBsYSBjb25kaWNpb24gZGUgcXVlIHNpZW1wcmUgY29tbyBxdWUgc2UgdmF5YW4gbGlnYW5kbyBsYXMgaW5zdHJ1Y2Npb25lcy4gDQoNCiMjZm9ybWEgdHJhZGljaW9uYWwgDQpzdW0oZGF0b3NfbWF0cml6JEFnZV8yNSkNCiMjIHkgYXNpIGNvbiBjYWRhIHVubyBwZXJvIHZhbW9zIGEgb3B0aW1pemFyIGNvbiBlbCBkcGx5ciANCm1hcmdpbmFsX2FnZSA8LSBkYXRhJT4lICMibWFyZ2luYWxfYWdlIDwtIiBlcyBwYXJhIHF1ZSBzYWxnYSBlbiBlbCBlbnZpcm9ubWVudCANCiAgZ3JvdXBfYnkoQWdlKSAlPiUgDQogIHN1bW1hcmlzZShNYXJnaW5hbF9Qcm9iYWJpbGl0eSA9IHN1bShQcm9iYWJpbGl0eSkpICNsZSBkaWdvIHF1ZSBtZSBkZSBsYXMgc3VtYXMgZGUgbGFzIHByb2JhYmlsaWRhZGVzIHkgbWUgbGFzIGVuc2XDsWUgZW4gcmVzdW1lbiBlbiB1bmEgbnVldmEgY29sdW1uYSBsbGFtYWRhIE1hcmdpbmFsX1Byb2JhYmlsaXR5LiANCmBgYA0KDQpiLiBDYWxjdWxhIGxhIG1lZGlhIGRlIEFIRSBwYXJhIGNhZGEgdmFsb3IgZGUgbGEgZWRhZDsgZXMgZGVjaXIsIGNhbGN1bGEgDQokRShBSEXiiKNBZ2U9MjUpJCwgeSBhc8OtIHN1Y2VzaXZhbWVudGUuT3NlYSBsYSBwcm9iYWJpbGlkYWQgY29uZGljaW9uZWFkYSANCg0KYGBge3J9DQpjb25kaXRpb25hbF9tZWFuIDwtIGRhdGEgJT4lDQogIGdyb3VwX2J5KEFnZSkgJT4lDQogIHN1bW1hcmlzZShFX0FIRV9naXZlbl9BZ2UgPSBzdW0oQUhFICogUHJvYmFiaWxpdHkpL3N1bShQcm9iYWJpbGl0eSkpDQpjb25kaXRpb25hbF9tZWFuIA0KYGBgDQoNCg0KYy4gQ2FsY3VsYSB5IGdyYWZpY2EgbGEgbWVkaWEgZGUgQUhFIGVuIGZ1bmNpw7NuIGRlIGxhIGVkYWQgKEFnZSkuIMK/RXhpc3RlIHVuYSByZWxhY2nDs24gZW50cmUgZWwgaW5ncmVzbyBwcm9tZWRpbyBwb3IgaG9yYSB5IGxhIGVkYWQ/IEV4cGxpY2EuDQoNCmBgYHtyfQ0KZ2dwbG90KGNvbmRpdGlvbmFsX21lYW4sYWVzKHg9IEFnZSwgeT1FX0FIRV9naXZlbl9BZ2UpKSsNCiAgZ2VvbV9wb2ludCgpDQpgYGANCg0KDQpkLiBVdGlsaXphIGxhIGxleSBkZSBsYSBlc3BlcmFuemEgaXRlcmFkYSBwYXJhIGNhbGN1bGFyIGxhIG1lZGlhIGRlIEFIRTsgZXMgZGVjaXIsIGNhbGN1bGENCiRFKEFIRSkkLg0KDQokJCBFKEFIRSk9XHN1bV97YWdlfeKAi0UoQUhF4oijQWdlKeKLhVAoQWdlKSAkJA0KDQoNCmBgYHtyfQ0KIyBUb21hcyBsYSBtZWRpYSBjb25kaWNpb25hbCBkZSBjYWRhIGVkYWQgeSBsYSBwZXNhcyBwb3IgbGEgcHJvYmFiaWxpZGFkIGRlIHF1ZSBvY3VycmEgZXNhIGVkYWQuIA0KRV9BSEUgPC0gY29uZGl0aW9uYWxfbWVhbiAlPiUgDQogIGxlZnRfam9pbihtYXJnaW5hbF9hZ2UsIGJ5ID0gIkFnZSIpICU+JSAgICAjdW5lIGFtYmFzIHRhYmxhcyBwb3IgQWdlDQogIHN1bW1hcmlzZShFX0FIRSA9IHN1bShFX0FIRV9naXZlbl9BZ2UqTWFyZ2luYWxfUHJvYmFiaWxpdHkpKSAgI3BvbmRlcmEgeSBzdW1hDQpgYGANCg0KDQplLiBDYWxjdWxhIGxhIHZhcmlhbnphIGRlIEFIRS4NCiQkdmFyKFkpPSBFWyhZLUUoWSkpXjJdJCQNCg0KYGBge3J9DQojIFByaW1lcm8gZXh0cmFlbW9zIEUoQUhFKSBjb21vIG7Dum1lcm8gc2ltcGxlDQptZWRpYV9BSEUgPC0gRV9BSEUkRV9BSEUgIA0KDQp2YXJfQUhFIDwtIGRhdGEgJT4lDQogIHN1bW1hcmlzZShWYXJfQUhFID0gc3VtKChBSEUgLSBtZWRpYV9BSEUpXjIgKiBQcm9iYWJpbGl0eSkpDQpgYGANCg0KDQpmLiBDYWxjdWxhIGxhIGNvdmFyaWFuemEgZW50cmUgQUhFIHkgbGEgZWRhZCAoQWdlKS4NCg0KJCRDb3YoQUhFLEFnZSk9RShBSEXii4VBZ2Up4oiSRShBSEUpRShBZ2UpJCQNCg0KYGBge3J9DQojIEUoQWdlKSBkZXNkZSBsYSBtYXJnaW5hbA0KRV9BZ2UgPC0gbWFyZ2luYWxfYWdlICU+JQ0KICBzdW1tYXJpc2UoRV9BZ2UgPSBzdW0oQWdlICogTWFyZ2luYWxfUHJvYmFiaWxpdHkpKSAlPiUNCiAgcHVsbChFX0FnZSkNCg0KIyBFKEFIRSAqIEFnZSk6IHByb2R1Y3RvIGRlIGNhZGEgY29tYmluYWNpw7NuIHBvbmRlcmFkbyBwb3IgcHJvYiBjb25qdW50YQ0KRV9BSEVfQWdlIDwtIGRhdGEgJT4lDQogIHN1bW1hcmlzZShFX0FIRV9BZ2UgPSBzdW0oQUhFICogQWdlICogUHJvYmFiaWxpdHkpKSAlPiUNCiAgcHVsbChFX0FIRV9BZ2UpDQoNCiMgQ292YXJpYW56YQ0KY292X0FIRV9BZ2UgPC0gRV9BSEVfQWdlIC0gbWVkaWFfQUhFICogRV9BZ2UNCmBgYA0KDQpnLiBDYWxjdWxhIGxhIGNvcnJlbGFjacOzbiBlbnRyZSBBSEUgeSBsYSBlZGFkIChBZ2UpLg0KDQokJENvcnIoQUhFLEFnZSk9XGZyYWN7Q292KEFIRSxBZ2UpfXtWYXIoQUhFKVZhcihBZ2UpfSQkDQoNCmBgYHtyfQ0KIyBWYXJpYW56YSBkZSBBZ2UgKGlndWFsIHF1ZSBsYSBkZSBBSEUgcGVybyBjb24gQWdlKQ0KdmFyX0FnZSA8LSBtYXJnaW5hbF9hZ2UgJT4lDQogIHN1bW1hcmlzZShWYXJfQWdlID0gc3VtKChBZ2UgLSBFX0FnZSleMiAqIE1hcmdpbmFsX1Byb2JhYmlsaXR5KSkgJT4lDQogIHB1bGwoVmFyX0FnZSkNCg0KdmFyX0FIRV92YWwgPC0gdmFyX0FIRSRWYXJfQUhFDQoNCiMgQ29ycmVsYWNpw7NuDQpjb3JyX0FIRV9BZ2UgPC0gY292X0FIRV9BZ2Uvc3FydCh2YXJfQUhFX3ZhbCp2YXJfQWdlKSANCmBgYA0KDQpoLiBSZWxhY2lvbmEgdHVzIHJlc3B1ZXN0YXMgZGUgbG9zIGluY2lzb3MgKGYpIHkgKGcpIGNvbiBsYSBncsOhZmljYSBxdWUgY29uc3RydWlzdGUgZW4gZWwgaW5jaXNvIChjKS4NCg0KKkxhIGNvdmFyaWFuemEgZGUgNS43MiBlcyBwb3NpdGl2YSwgbG8gcXVlIGluZGljYSBxdWUgQUhFIHkgQWdlIHNlIG11ZXZlbiBlbiBsYSBtaXNtYSBkaXJlY2Npw7NuOiBjb25mb3JtZSBhdW1lbnRhIGxhIGVkYWQsIGVsIGluZ3Jlc28gcHJvbWVkaW8gcG9yIGhvcmEgdGllbmRlIGEgYXVtZW50YXIuIFNpbiBlbWJhcmdvLCBsYSBjb3ZhcmlhbnphIG5vIGVzIGbDoWNpbCBkZSBpbnRlcnByZXRhciBkaXJlY3RhbWVudGUgcG9ycXVlIGRlcGVuZGUgZGUgbGFzIHVuaWRhZGVzIGRlIGNhZGEgdmFyaWFibGUgeSBwYXJhIGVsbG8gdXNhbW9zIGxhIGNvcnJlbGFjacOzbiBkZSAwLjE1Ni4gQXVucXVlIGVzIHBvc2l0aXZhIHkgY29uZmlybWEgbGEgZGlyZWNjacOzbiBxdWUgdmVtb3MgZW4gbGEgZ3LDoWZpY2EgZGVsIGluY2lzbyAoYyksIGVzIHVuIHZhbG9yIHJlbGF0aXZhbWVudGUgZMOpYmlsIChjZXJjYW5vIGEgMCkuIEVzdG8gc3VnaWVyZSBxdWUgc2kgYmllbiBleGlzdGUgdW5hIHRlbmRlbmNpYSBjcmVjaWVudGUgZW50cmUgZWRhZCBlIGluZ3Jlc28sIGxhIHJlbGFjacOzbiBubyBlcyBtdXkgZnVlcnRlLCBoYXkgbXVjaGEgZGlzcGVyc2nDs24gZW4gbG9zIGluZ3Jlc29zIGRlbnRybyBkZSBjYWRhIGdydXBvIGRlIGVkYWQsIHkgbGEgZWRhZCBwb3Igc8OtIHNvbGEgZXhwbGljYSBwb2NvIGRlIGxhIHZhcmlhY2nDs24gZW4gQUhFLioNCg0KDQo=