Determinar la frecuencia de nombres de personas a partir de importar datos.
Importar los datos: <https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/nombres%20y%20apellidos.csv> que contiene nombres de alumnos.
Cargar los datos en R y Rstudio
Crear un documento markdown para analizar los datos
Interpretar los datos con un diagrama de barra y dsecribir su analisis personal
Se leen los datos con read.csv()
nombres <- read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")
## Determinar Frecuencias
Se determina la frecuencia con la función *table()* y se convierte a un data frame con la función *data.frame()*
La variable o columna de interés es nombre y se accede a ella como un vector a través de la expresión *nombres\$nombre.*.
Solo se observan los primeros diez registros de frecuencias con *head()*.
```r
frecuencias <- data.frame(table(nombres$nombre))
head(frecuencias )
## Var1 Freq
## 1 #¡VALOR! 8
## 2 Ã\201NGEL DYDIER 1
## 3 AARON 7
## 4 AARON ADOLFO 1
## 5 AARON ALEJANDRO 1
## 6 AARON EDUARDO 1
Se ordena por medio de la función order().
frecuencias.ordenada <- frecuencias[order(frecuencias$Freq, decreasing = TRUE),]
head(frecuencias.ordenada, 5)
## Var1 Freq
## 2762 MARIA FERNANDA 36
## 138 ALEJANDRO 32
## 930 DANIEL 31
## 2189 JOSE MANUEL 28
## 2241 JUAN CARLOS 27
barplot(height = head(frecuencias.ordenada$Freq, 5)
, names.arg = head(frecuencias.ordenada$Var1, 5), main = "Frecuencia de nombres del ITD", xlab = "Nombres de estudiantes", ylab = "Frecuencias")
Analizando el caso nos dimos cuenta que los nombres que se repitieron con mas frecuencia fueron: Maria Fernanda, Daniel, José Manuel y Juan Carlos. Por ende, aparecen en el histograma de frecuencias. Decidi buscar mi nombre en la tabla y analizando me di cuenta que soy la unica persona con ambos nombres. Maria Fernanda tuvo 36 repeticiones como tambien hay bastantes que no se repiten y solo tienen 1. La mayoría de los nombres obtuvieron frecuencia 1. Me gustaria agregar que jamas imagine que el nombre Maria Fernanda sería el de mayor frecuencia. Realizar la frecuencia de los nombres de los estudiantes del ITD me pareció muy interesante y relevante para conocer un poco sobre los alumnos.