getwd()
## [1] "D:/CursoR_UAM_X_25O"
setwd("D:/CursoR_UAM_X_25O")

datos_enigh <- read_csv("conjunto_de_datos_concentradohogar_enigh2022_ns.csv")
datos_covid <- read_csv("COVID19MEXICO_25.csv")

TRABAJO PARA CONSTANCIA UAM-X 25O

CURSO RStudio

Carolina Soto Ventura

Introducción

En este trabajo realizamos un analisis visual de los datos ENIGH y COVID. Los datos ENIGH son del año 2024 y los datos de COVID-19 son el año *2025**. Estos datos se trabajaron con la paquetería tidyverse. Además se integran una serie de graficas donde se visualizan los datos.

Histograma de sexo edad simulado

Inicialmente se realizó un histograma simulado a partir de dos vectores de edad y sexo,estos datos se recabo de la base de datos ENIGH depués se convirtio en un dat frame y se finalizó con un grafica de histograma.

sexo <- rep(c("Hombre", "Mujer"),40)
# 1) Crear una semilla set.seed()
set.seed(123)
# 2) crear la simulacion copn rnorm()
edad <- rnorm(80,30,10)

hist(edad,
     main = "Histograma de edad",
     xlab = "Edad",
     ylab = "Frecuencia",
     col = "blue")
Fuente: elaboración propia

Fuente: elaboración propia

Gráfica de tabla de contingencia

Creamos una tabla de contingencia para educación del jefe del hogar y estatus socieconómico……

# Para establecer etiquetas en el eje x creamos un vector de referencia

Edu <- c("Sin", "Preesc", "Prim-inc", "Prim-comp", "Secu-inc","Secu-com",
         "Prep-inc", "Prep-com", "Profe-inc", "Profe-com","Posg")
# Para establecer una leyemda creamos un vector de referencia

esta_socio <- c("Bajo", "Medio bajo", "Medio alto", "Alto")

# Asignar nombres a las filas y columnas

edu_socio2 <- table(datos_enigh$educa_jefe, datos_enigh$est_socio)

rownames(edu_socio2) <- Edu
colnames(edu_socio2) <- esta_socio

# Gráfica de mosaico plot() 

plot(edu_socio2,
     xlab = "Nivel educativo del jefe del hogar ",
     ylab = "Estatus socieconómico",
     main= "Relación entre nivel educativo del jefe del hogar y estatus socieconómico",
     col= 1:4)
legend("bottomright", esta_socio, cex = 0.2, fill = 1:4, title = "Nivel socioeconómico")
Fuente elaboración propia con datos del ENIGH 2024

Fuente elaboración propia con datos del ENIGH 2024

Histograma de edad del jefe del hogar

Descripción ….

# Convertimos datos  a tipo factor las variables de sexo_jefe 
datos_enigh$sexo_jefe <- factor(datos_enigh$sexo_jefe,
                              levels   = c(1,2),
                              labels = c("Hombre", "Mujer"))


histograma_sexo_edad <- 
  ggplot(datos_enigh, aes(x=edad_jefe, fill = sexo_jefe)) +
  geom_histogram(position = "identity",alpha=0.5,binwidth = 1, col="red") + # stack, dodge
  #facet_wrap(~sexo_jefe) +
  labs(x=" Edad jefe del hogar", y="Frecuencia", title = "Histograma jefe del hogar por sexo", fill="Sexo del jefe del hogar") +
  scale_fill_manual(values = c("Hombre" = "blue", "Mujer" = "pink")) +
  theme(plot.title = element_text(hjust = 0.5))

ggplotly(histograma_sexo_edad) %>% 
  layout(hovermode="x unified")

Gráfica de fallecidos diarios

fallecidos_por_fecha <- datos_covid %>%
  filter(!is.na(FECHA_DEF)) %>%          #filter(FECHA_DEF != "9999-99-99")
                                         # mutate(FECHA_DEF = as_date(FECHA_DEF))
  count(FECHA_DEF, name = "Fallecidos_diarios") %>%
  arrange(FECHA_DEF) %>%
  mutate(Acumulado = cumsum(Fallecidos_diarios))



grafica_falle_diar <-  ggplot(fallecidos_por_fecha, aes(x=FECHA_DEF, y=Fallecidos_diarios)) +
  geom_line( col="blue", size=1, linetype = 1, alpha=1) +
  geom_point( col="green", size=1, shape=2, alpha=1) +
  labs(title = "Total fallecidos diarios en México",
       subtitle = " del 01-01-2025 al 31-08-2025",
       x="Fechas",
       y="Número de fallecidos") +
  theme(plot.title = element_text(hjust = 0.01))
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Gráfica dinámica

ggplotly(grafica_falle_diar) %>% 
  layout(hovermode="x unified")

Modelos Lineales

Descripción

modelo_1_graf <- ggplot(wage1, aes(x=educ, y=lwage)) +
  geom_point(color="blue") +
  geom_smooth(method = "lm", se= TRUE, col="red", linetype=1, linewidth=1) +
  labs(title = "Gráfica de dispersión educación vs salario",
       x= "Años de educación",
       y= "log(salario por hora") +
  theme(plot.title = element_text(hjust = 0.5))

ggplotly(modelo_1_graf)
## `geom_smooth()` using formula = 'y ~ x'
modelo_1 <- lm(lwage ~ educ, data = wage1)
#summary(modelo_1)

# library(knitr)

coefficients(summary(modelo_1)) %>% 
  kable()
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.5837727 0.0973358 5.99751 0
educ 0.0827444 0.0075667 10.93534 0

Pruebas diagnosticas

Descripción

autoplot(modelo_1, which = 1:3,
         nrow = 3,
         ncol = 1)
## Warning: `fortify(<lm>)` was deprecated in ggplot2 4.0.0.
## ℹ Please use `broom::augment(<lm>)` instead.
## ℹ The deprecated feature was likely used in the ggfortify package.
##   Please report the issue at <https://github.com/sinhrks/ggfortify/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: `aes_string()` was deprecated in ggplot2 3.0.0.
## ℹ Please use tidy evaluation idioms with `aes()`.
## ℹ See also `vignette("ggplot2-in-packages")` for more information.
## ℹ The deprecated feature was likely used in the ggfortify package.
##   Please report the issue at <https://github.com/sinhrks/ggfortify/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.