Objetivo

Elaborar un análisis descriptivo de la frecuencia de nombres de alumnos

Descripción

Desarrollo

Cargar los datos

Se leen los datos con read.csv()

nombres <- read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")

Visualizar datos

Se visualizan los 10 primeros y los 10 últimos registros:

head(nombres, 10)
##    no    patreno    materno          nombre
## 1   1    ALDABA  VELAZQUEZ      LUIS MANUEL
## 2   2   ALMONTE     CHAVEZ    DANIEL ADRIAN
## 3   3  ALVARADO     MORENO    NANCY ALONDRA
## 4   4    BAYONA    MARRUFO      CESAR YAHIR
## 5   5     CALVO    QUEZADA    ARIANNA ELISA
## 6   6    CASTRO     SANTOS   JESSICA SARAHI
## 7   7 CASTRUITA  ARCINIEGA          RICARDO
## 8   8   CORDERO     RIVERA    ANDREA FATIMA
## 9   9     DERAS     CHAVEZ  DIEGO ALEXANDER
## 10 10      DIAZ   CARRILLO   ANDREA PAULINA
tail(nombres, 10)
##        no     patreno    materno            nombre
## 5725 5734     VARGAS   VIOLANTE   BRICIA ESMERALDA
## 5726 5735    VAZQUEZ     VERDIN           GABRIELA
## 5727 5736       VEGA    SALINAS           EMMANUEL
## 5728 5737  VELAZQUEZ  RODRIGUEZ       JESUS MANUEL
## 5729 5738      VELOZ      GAMIZ               OMAR
## 5730 5739      VILLA     ORTEGA     DAVID GEOVANNI
## 5731 5740      VILLA    VAZQUEZ  OSWALDO ALEJANDRO
## 5732 5741 VILLARREAL    ASTORGA   VANESSA GABRIELA
## 5733 5742   VILLEGAS     ORTEGA   ALEXANDER RAFAEL
## 5734 5743     VITELA  GUTIERREZ          LUIS RENE

Determinar frecuencias

Se determina la frecuencia con la función table() y se convierte a un data frame con la función data frame() La variable o columna de interés es nombre y se accede a ella como un vector a través de la expresión nombres$nombre Solo se obervan los primeros 10 registros de frecuencia con head()

frecuencias <- data.frame(table(nombres$nombre))
head(frecuencias)
##              Var1 Freq
## 1        #¡VALOR!    8
## 2   Ã\201NGEL DYDIER    1
## 3           AARON    7
## 4    AARON ADOLFO    1
## 5 AARON ALEJANDRO    1
## 6   AARON EDUARDO    1

Ordenar las frecuencias

Se ordena por medio de la función order()

frecuencias.ordenada <- frecuencias[order(frecuencias$Freq, decreasing = TRUE),]
head(frecuencias.ordenada, 5)
##                Var1 Freq
## 2762 MARIA FERNANDA   36
## 138       ALEJANDRO   32
## 930          DANIEL   31
## 2189    JOSE MANUEL   28
## 2241    JUAN CARLOS   27

Diagrama de barra

barplot(height = head(frecuencias.ordenada$Freq,5), names.arg = head(frecuencias.ordenada$Var1,5), main = "Frecuencia de nombres", xlab = "Nombres", ylab = "Frecuencias")

Interpretación

En este nuevo documento Markdown se realizo un análisis descriptivo en el cual se obtendría la frecuencia de nombres de alumnos pero para eso primero se realizó la importacion de datos desde la dirección que fue proporcionada por el profesor, luego procedimos hacer el siguiente paso, se visualizó los primeros diez y últimos diez registros, despues determinamos la frecuencia con la función data.frame(), posteriormente ordenamos las frecuencias con la función order() para ver que nombres son los mas frecuentes , y por ultimo realizamos un diagrama de barra para verificar de forma gráfica la representación de la frecuencia de nombres.