getwd()
## [1] "C:/Users/cscs415/Downloads/Rstudio"
setwd("C:/Users/cscs415/Downloads/Rstudio")

datos_enigh <- read_csv("conjunto_de_datos_concentradohogar_enigh2022_ns.csv")
datos_covid <- read_csv("COVID19MEXICO_25.csv")

Título 1

Título 2

Título 3

En este trabajo realizamos un analisis visual de los datos ENIGH y COVID. Los datos ENIGH son del año 2024 y los datos de COVID-19 son el año *2025**. Estos datos se trabajaron con la paquetería tidyverse.

Histograma de sexo edad simulado

Realizamos un hitograma simulado a partir de dos vectores de edad y sexo, depués se convirtio en un dat frame y se finalizó con un grafica de histograma.

sexo <- rep(c("Hombre", "Mujer"),40)
# 1) Crear una semilla set.seed()
set.seed(123)
# 2) crear la simulacion copn rnorm()
edad <- rnorm(80,30,10)

hist(edad,
     main = "Histograma de edad",
     xlab = "Edad",
     ylab = "Frecuencia",
     col = "red")
Fuente: elaboración propia

Fuente: elaboración propia

Gráfica de tabla de contingencia

Creamos una tabla de contingencia para educación del jefe del hogar y estatus socieconómico……

Fuente elaboración propia con datos del ENIGH 2024

Fuente elaboración propia con datos del ENIGH 2024

Histograma de edad del jefe del hogar

Descripción ….

# Convertimos datos  a tipo factor las variables de sexo_jefe 
datos_enigh$sexo_jefe <- factor(datos_enigh$sexo_jefe,
                                levels   = c(1,2),
                                labels = c("Hombre", "Mujer"))


histograma_sexo_edad <- 
  ggplot(datos_enigh, aes(x=edad_jefe, fill = sexo_jefe)) +
  geom_histogram(position = "identity",alpha=0.5,binwidth = 1, col="red") + # stack, dodge
  #facet_wrap(~sexo_jefe) +
  labs(x=" Edad jefe del hogar", y="Frecuencia", title = "Histograma jefe del hogar por sexo", fill="Sexo del jefe del hogar") +
  scale_fill_manual(values = c("Hombre" = "blue", "Mujer" = "pink")) +
  theme(plot.title = element_text(hjust = 0.5))

ggplotly(histograma_sexo_edad) %>% 
  layout(hovermode="x unified")

Gráfica 3

Gráfica de fallecidos diarios

descripción de la gráfica

fallecidos_por_fecha <-datos_covid %>%
  filter(!is.na(FECHA_DEF)) %>%          #filter(fecha_def != "9999-99-99")
  # mutate(fecha_def = as_date(fecha_def))
  count(FECHA_DEF, name = "Fallecidos_diarios") %>%
  arrange(FECHA_DEF) %>%
  mutate(Acumulado = cumsum(Fallecidos_diarios))



grafica_falle_diar <-  ggplot(fallecidos_por_fecha, aes(x=FECHA_DEF, y=Fallecidos_diarios)) +
  geom_line( col="red", size=1, linetype = 1, alpha=1) +
  geom_point( col="green", size=1, shape=2, alpha=1) +
  labs(title = "Total fallecidos diarios en México",
       subtitle = " del 01-01-2025 al 31-08-2025",
       x="Fechas",
       y="Número de fallecidos") +
  theme(plot.title = element_text(hjust = 0.5))
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Gráfica dinámica

ggplotly(grafica_falle_diar) %>% 
  layout(hovermode="x unified")

Modelos lineales

descrpcion

modelo_1_graf <- ggplot(wage1, aes(x=educ, y=lwage)) +
  geom_point(color="blue") +
  geom_smooth(method = "lm", se= TRUE, col="red", linetype=1, linewidth=1) +
  labs(title = "Gráfica de dispersión educación vs salario",
       x= "Años de educación",
       y= "log(salario por hora") +
  theme(plot.title = element_text(hjust = 0.5))

ggplotly(modelo_1_graf)
## `geom_smooth()` using formula = 'y ~ x'
modelo_1 <- lm(lwage ~ educ, data = wage1)
#summary(modelo_1)

# library(knitr)

coefficients(summary(modelo_1)) %>% 
  kable()
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.5837727 0.0973358 5.99751 0
educ 0.0827444 0.0075667 10.93534 0

Pruebas diagnosticas

Descripción

autoplot(modelo_1, which = 1:3,
         nrow = 3,
         ncol = 1)