Elaborar un análisis descriptivo de la frecuencia de nombres de alumnos.
Importar los datos de nombre y apellidos de la dirección: <https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv> que contiene nombres de alumnos.
La variable de interés es el nombre
Se utiliza la función table () para determinar la frecuencia.
Se utiliza la función order () para ordenar los valores.
Ya con los valores ordenados se genera un diagrama de barra por medio de la función codebar ().
Interpretación del caso
Visualizar los primeros diez y últimos diez registros u observaciones de los alumnos.
Nombres <- read.csv ("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv",encoding = "UTF-8")
Se visualizan los primeros diez y últimos diez registros.
head(Nombres ,10)
## no patreno materno nombre
## 1 1 ALDABA VELAZQUEZ LUIS MANUEL
## 2 2 ALMONTE CHAVEZ DANIEL ADRIAN
## 3 3 ALVARADO MORENO NANCY ALONDRA
## 4 4 BAYONA MARRUFO CESAR YAHIR
## 5 5 CALVO QUEZADA ARIANNA ELISA
## 6 6 CASTRO SANTOS JESSICA SARAHI
## 7 7 CASTRUITA ARCINIEGA RICARDO
## 8 8 CORDERO RIVERA ANDREA FATIMA
## 9 9 DERAS CHAVEZ DIEGO ALEXANDER
## 10 10 DIAZ CARRILLO ANDREA PAULINA
tail(Nombres ,10)
## no patreno materno nombre
## 5725 5734 VARGAS VIOLANTE BRICIA ESMERALDA
## 5726 5735 VAZQUEZ VERDIN GABRIELA
## 5727 5736 VEGA SALINAS EMMANUEL
## 5728 5737 VELAZQUEZ RODRIGUEZ JESUS MANUEL
## 5729 5738 VELOZ GAMIZ OMAR
## 5730 5739 VILLA ORTEGA DAVID GEOVANNI
## 5731 5740 VILLA VAZQUEZ OSWALDO ALEJANDRO
## 5732 5741 VILLARREAL ASTORGA VANESSA GABRIELA
## 5733 5742 VILLEGAS ORTEGA ALEXANDER RAFAEL
## 5734 5743 VITELA GUTIERREZ LUIS RENE
La frecuencia se determina con la función table () y se convierte a un data frame con la función data.frame ().
La variable o columna de interés es Nombres.personas y se accede a ella como un vector a través de la expresión Nombres.personas\$Nombre.personas.
Solo se observan los primeros diez registros de frecuencia con head ().
Frecuencias <- data.frame( table(Nombres$nombre))
head(Frecuencias,10)
## Var1 Freq
## 1 #¡VALOR! 8
## 2 Ã\201NGEL DYDIER 1
## 3 AARON 7
## 4 AARON ADOLFO 1
## 5 AARON ALEJANDRO 1
## 6 AARON EDUARDO 1
## 7 AARON ISAI 1
## 8 AARÓN ISAÍAS 1
## 9 AARON MANUEL 1
## 10 AARON MISAEL 1
Se ordena por medio de la frecuencia order ().
frecuencias.ordenada <- Frecuencias[order(Frecuencias$Freq, decreasing = TRUE),]
head(frecuencias.ordenada ,5)
## Var1 Freq
## 2762 MARIA FERNANDA 36
## 138 ALEJANDRO 32
## 930 DANIEL 31
## 2189 JOSE MANUEL 28
## 2241 JUAN CARLOS 27
barplot(height = head(frecuencias.ordenada$Freq, 5), names.arg = head(frecuencias.ordenada$Var1, 5), main = "Frecuencia de nombres" , xlab = "Nombres", ylab = "Frecuencias" )
El caso extrae a partir de un archivo que se encuentra en una dirección ,extrae o importa para poder trabajarlos en Rstudio.
En este caso se hace un análisis descriptivo de la frecuencia de nombres de alumnos que son alrededor de 5734 del cual se va a visualizar las observaciónes de los primeros diez y ultimos diez la variable nombres ,se determinara la frecuencia de los nombre que mas se repiten y se ordena la frecuencia de los primeros 5 nombres ,finalizando con un diagrama de barra donde se muestren tanto frecuencias ordenada ,como los primero 5 nombres que se pidieron.