mibase <- read.csv("C:/Users/heler/Onedrive/Escritorio/Actividades - Estadistica/Casos_de_Bajo_peso_al_nacer_en_el_municipio_de_Bucaramanga_20240830.csv")
#A
#Creación de variables
V1 <- mibase$SEXO
V2 <- mibase$PESO.AL.NACER
#Creacion de grafica de cajas
library(ggplot2)
ggplot(mibase, aes(x = V1, y = V2, fill = V1)) +
geom_boxplot() +
labs(title = "Figura 1: Grafico de cajas
Sexo vs Peso al nacer", x = "Sexo", y = "Peso al nacer") +
theme_minimal()
En el grafico podemos observar algunos datos atipicos por debajo de los 2000g.
Las mujeres presentan más concentración de datos atipicos que los hombres.
La concentración de datos para ambos sexos es muy similar entre el cuartil 2 y el caurtil 3.
Los hombres presentan un poco mas de datos que las mujeres dentro de estos dos cuartiles.
#B
#Creación de variables
V3 <- mibase$TALLA.AL.NACER
V4 <- mibase$SEMANAS.DE.GESTACION
#Creación de grafica de poligonos de frecuencia comparativos
library(ggplot2)
ggplot(mibase, aes(x = V3, color = V4, group = V4)) +
geom_freqpoly(binwidth = 1) +
labs(tittle = "Figura 2: Grafico de poligonos de frecuencia
Talla al nacer vs Semanas de Gestación", x = "Semanas de Gestación", y = "Talla") +
theme_minimal()
Se puede observar que cerca de la semana de gestación 48 estan los bebes con tallas mas grandes.
Entre la semana 40 y 50, estan concentrados la mayoria de datos.
Hay algunos datos atipicos antes de la semana 40.
#C
#Creación de variables
V2 <- mibase$PESO.AL.NACER
V5 <- mibase$GRUPO.ETARIO
#Creación de grafico de frecuencia acumulada
ggplot(mibase, aes(x = V2, color = V5)) +
stat_ecdf(geom = "step") +
labs(title = "Figura 3: Grafico de frecuencia acumulada
Peso al nacer vs Frecuencia acumulada",x = "Peso al nacer", y = "Frecuencia acumulada") +
theme_minimal()
Se puede observar que cerca de la semana de gestación 48 estan los bebes con tallas mas grandes.
Entre la semana 40 y 50, estan concentrados la mayoria de datos.
Hay algunos datos atipicos antes de la semana 40.
#A
#Creación de variables
V1 <- mibase$SEXO
V2 <- mibase$PESO.AL.NACER
V6 <- mibase$AÑO
#Crear el gráfico de barras compuesto
ggplot(mibase, aes(x = V6, y = V2, fill = V1)) +
geom_bar(stat = "identity", position = "dodge") +
labs(title = "Figura 4: Grafico de Barras Compuesto",
x = "Año", y = "Peso al nacer (g)") +
theme_minimal()
Podemos observar que para el año 2017 el sexo masculino presento su promedio de peso máss bajo.
Las mujeres siempre tuvieron un promedio estable de peso.
Durante los años 2018, 2019, 2021 y 2022 los promedio de peso entre hombres y mujeres fueron similares.
Los hombres tuvieron su mayor promedio de peso en el año 2020.
C)Realicé la tabla de contingencia para los datos anteriores el codigo respectivo se presenta acontinuacion:
#c
#Tabla de contingencia
tabla <- table(mibase$SEXO, mibase$PESO.AL.NACER)
print(tabla)
1230 1495 1655 1685 1690 1700 1725 1750 1765 1800 1810 1825 1850 1855 1865
F 0 1 0 1 1 1 1 0 1 0 1 0 1 1 0
M 1 0 1 0 0 1 0 1 0 1 0 1 0 0 1
1890 1930 1935 1945 1960 1980 1990 1995 2000 2005 2007 2010 2015 2025 2035
F 0 1 1 1 1 1 1 1 1 1 1 2 3 1 0
M 1 1 0 1 1 0 0 1 1 0 0 0 0 0 3
2040 2045 2050 2055 2065 2070 2071 2075 2080 2085 2100 2105 2110 2115 2120
F 1 1 1 1 2 2 1 1 1 1 6 1 2 2 6
M 0 1 2 0 0 0 0 2 0 0 2 1 2 1 1
2130 2135 2140 2145 2150 2160 2165 2170 2175 2180 2185 2190 2195 2200 2205
F 1 3 2 1 2 0 3 4 0 3 0 6 0 6 1
M 1 1 2 0 3 2 1 1 2 2 4 6 1 4 1
2210 2215 2220 2225 2230 2235 2240 2245 2250 2255 2260 2265 2270 2275 2277
F 2 3 1 1 2 4 5 1 2 1 7 1 2 3 1
M 3 2 2 3 4 1 3 2 5 2 1 4 3 4 0
2280 2285 2290 2295 2300 2305 2310 2315 2320 2325 2330 2335 2338 2340 2345
F 2 0 7 3 9 2 8 7 9 4 2 6 1 10 4
M 5 3 3 0 8 1 0 5 8 2 1 4 0 4 2
2350 2355 2360 2365 2370 2375 2380 2385 2390 2395 2400 2405 2410 2415 2420
F 6 7 12 1 8 7 14 6 7 5 6 7 7 6 8
M 2 4 1 1 7 5 6 6 6 3 11 4 5 3 7
2425 2430 2435 2440 2445 2450 2455 2460 2461 2465 2470 2475 2480 2485 2490
F 5 9 6 9 5 17 7 9 0 8 11 9 10 5 14
M 3 3 5 8 5 4 6 11 1 6 16 7 8 3 7
2495
F 8
M 5
En este apartado realicé una tabla donde se clasifican algunas variables.
#Elaboracion Tabla n4
V1 <- mibase$SEXO
V2 <- mibase$PESO.AL.NACER
V3 <- mibase$TALLA.AL.NACER
Titulo <- c("Sexo", "Peso al nacer", "Talla al nacer")
Descripcion <- c("Genero de la persona (Masculino/Femenino)",
"Peso de nacimiento",
"Talla de nacimientto")
Clasificacion <- c("Cualitativa Nominal", "Cuantitativa continua", "Cuantitativa Continua")
Tabla4 <- data.frame(
Titulo = Titulo,
Descripcion = Descripcion,
Clasificacion = Clasificacion)
print(Tabla4)
Titulo Descripcion
1 Sexo Genero de la persona (Masculino/Femenino)
2 Peso al nacer Peso de nacimiento
3 Talla al nacer Talla de nacimientto
Clasificacion
1 Cualitativa Nominal
2 Cuantitativa continua
3 Cuantitativa Continua
Para la elaboración del grafico de disperción que hay que analizar en este apartado tomé las variables “Peso al nacer” y “Semanas de Gestacíón”.
#Creación de variables
V2 <- mibase$PESO.AL.NACER
V4 <- mibase$SEMANAS.DE.GESTACION
plot(mibase$PESO.AL.NACER, mibase$SEMANAS.DE.GESTACION,
main = "Figura 5: Grafico de disperción
Peso al nacer vs Semanas de gestación",
xlab = "Peso al nacer", ylab = "Semanas de Gestación",
pch = 19, col = "blue")