Elaborar un análisis descriptivo de la frecuencia de nombres de alumnos
Importar los datos de de la dirección: <https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv> que contiene nombres de alumnos.
¿Cómo se hace el caso o como se desarrolla?
Se leen los datos con read.csv()
nombres <- read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")
Se visualizan los 10 primeros y los 10 últimos registros:
head(nombres, 10)
## no patreno materno nombre
## 1 1 ALDABA VELAZQUEZ LUIS MANUEL
## 2 2 ALMONTE CHAVEZ DANIEL ADRIAN
## 3 3 ALVARADO MORENO NANCY ALONDRA
## 4 4 BAYONA MARRUFO CESAR YAHIR
## 5 5 CALVO QUEZADA ARIANNA ELISA
## 6 6 CASTRO SANTOS JESSICA SARAHI
## 7 7 CASTRUITA ARCINIEGA RICARDO
## 8 8 CORDERO RIVERA ANDREA FATIMA
## 9 9 DERAS CHAVEZ DIEGO ALEXANDER
## 10 10 DIAZ CARRILLO ANDREA PAULINA
tail(nombres, 10)
## no patreno materno nombre
## 5725 5734 VARGAS VIOLANTE BRICIA ESMERALDA
## 5726 5735 VAZQUEZ VERDIN GABRIELA
## 5727 5736 VEGA SALINAS EMMANUEL
## 5728 5737 VELAZQUEZ RODRIGUEZ JESUS MANUEL
## 5729 5738 VELOZ GAMIZ OMAR
## 5730 5739 VILLA ORTEGA DAVID GEOVANNI
## 5731 5740 VILLA VAZQUEZ OSWALDO ALEJANDRO
## 5732 5741 VILLARREAL ASTORGA VANESSA GABRIELA
## 5733 5742 VILLEGAS ORTEGA ALEXANDER RAFAEL
## 5734 5743 VITELA GUTIERREZ LUIS RENE
Se determina la frecuencia con la función table() y se convierte a un data frame con la función data frame() La variable o columna de interés es nombre y se accede a ella como un vector a través de la expresión nombres$nombre Solo se obervan los primeros 10 registros de frecuencia con head()
frecuencias <- data.frame(table(nombres$nombre))
head(frecuencias)
## Var1 Freq
## 1 #¡VALOR! 8
## 2 Ã\201NGEL DYDIER 1
## 3 AARON 7
## 4 AARON ADOLFO 1
## 5 AARON ALEJANDRO 1
## 6 AARON EDUARDO 1
Se ordena por medio de la función order()
frecuencias.ordenada <- frecuencias[order(frecuencias$Freq, decreasing = TRUE),]
head(frecuencias.ordenada, 5)
## Var1 Freq
## 2762 MARIA FERNANDA 36
## 138 ALEJANDRO 32
## 930 DANIEL 31
## 2189 JOSE MANUEL 28
## 2241 JUAN CARLOS 27
barplot(height = head(frecuencias.ordenada$Freq,5), names.arg = head(frecuencias.ordenada$Var1,5), main = "Frecuencia de nombres", xlab = "Nombres", ylab = "Frecuencias")
En este nuevo documento Markdown se realizo un análisis descriptivo en el cual se obtendría la frecuencia de nombres de alumnos pero para eso primero se realizó la importacion de datos desde la dirección que fue proporcionada por el profesor, luego procedimos hacer el siguiente paso, se visualizó los primeros diez y últimos diez registros, despues determinamos la frecuencia con la función data.frame(), posteriormente ordenamos las frecuencias con la función order() para ver que nombres son los mas frecuentes , y por ultimo realizamos un diagrama de barra para verificar de forma gráfica la representación de la frecuencia de nombres.