Usar un conjunto de datos de natalidad en un programa en R y elija cuatro atributos para analizar

#Resultados

Haga un R markdown en word, muestre el codigo, conclusiones y observaciones de lo que haya realizado.

#Muestre

Conclusiones donde generalice lo observado y proponga un producto, sugerencia o desicion que ayude a mejorar alguna problematica o interes

print("Este es mi primer proyecto en RStudio usando R markdown")
## [1] "Este es mi primer proyecto en RStudio usando R markdown"

Leyendo el archivo de excel descargado de la pagina de INEGI

library(readxl)
nat<-read_excel('C:/Users/chupa/OneDrive/Escritorio/CURSOS/curso estadistica con R julio 2024/Natalidad_02.xlsx')

La informacion es la siguiente Muestra el porcentaje de nacimientos registrados de madres adolescentes (menores de 20 años) por entidad federativa de residencia habitual de la madre, serie anual solo del 2019 a 2022 , teniendo un total de datos de 132 datos para analizar.

nat

conociendo la cantidad de filas y columnas que tiene

dim(nat)
## [1] 44  6

El nombre de las columnas

names(nat)
## [1] "numero" "Estado" "2019"   "2020"   "2021"   "2022"

Mostrando solo las seis primeras filas correspondientes a los 5 primeros estados

head(nat)

Mostrando los datos correspondientes a el año 2019 de menor a mayor

n=table(nat["2019"])
n
## 2019
## 12.3 13.9 14.2   15 15.2 15.3 15.5 15.7   16 16.3 16.5 16.6 16.7 16.8   17 17.1 
##    1    1    1    1    1    1    1    1    1    1    1    1    2    2    1    1 
## 17.2 17.3 17.5 17.6 17.8 17.9 18.4 18.6 18.8   19 19.7 19.8 
##    1    1    1    1    2    1    1    3    1    1    1    1

obteniendo el proomedio del año 2019 de acuerdo a la entidad

f=mean(n,trim=0 ,na.rm=FALSE )
f
## [1] 1.178571

Mostrando los datos correspondientes a el año 2019 por estado en orden alfabetico dentro de una tabla.

Estado 2019
1 17.0
2 17.2
3 17.3
4 13.9
5 16.8
6 19.0
7 15.3
8 18.8
9 19.8
10 12.3
11 18.6
12 16.7
13 19.7
14 17.8
15 15.5
16 17.1
17 17.6
18 16.7
19 17.5
20 15.2
21 16.5
22 18.4
23 14.2
24 15.0
25 16.3
26 16.6
27 17.8
28 17.9
29 15.7
30 18.6
31 18.6
32 16.0
33 16.8
Graficando en columnas por estado en el año 2019
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
ggplot(nat)+geom_col(aes(x = factor(numero), y = 2019), color="blue")

Agregando titulos y leyendas al gráfico
ggplot(nat) +geom_col(aes(x =factor (numero), y = 2019))+labs(title="Porcentaje de nacimientos registrados de madres adolescentes (menores de 20 años) por entidad federativa de residencia habitual de la madre",subtitle= "Año 2019",y="Porcentaje")

conclusion

De acuerdo a los datos analizados en el año 2019 hubo mayor porcentaje de natalidad en madres adolescentes en contraste con el año 2022 manteniendose en cada uno de los estados.

Mi conclusion del curso.

Conclusiones Rstudio es un gran y potente lenguaje de programacion, realmente cada que trabajo en Rstudio me genera más dudas y necesidad de saber, contestar cada una de mis preguntas no fue facil, estuve buscando en linea incrementando lo que vimos en clase, pero hay muchas formas de desarrollar y crear proyectos increibles.

El ultimo gráfico es obtenido en excel, que es realmente lo que queria obtener en R, sin embargo mi conocimiento es muy corto.

Espero en otros cursos poder aprender más y llegar al objetivo.

Gracias profesor, por los conocimientos impartidos.