Objetivo

Determinar la frecuencia de nombres de personas a partir de importar datos.

Descripción

Desarrollo

Importar datos

Se leen los datos con read.scv().

nombres<-read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")

Visualizar observaciones

Se visualizan los primeros 10 y los últimos 10 registros.

head(nombres,10)
##    no    patreno    materno          nombre
## 1   1    ALDABA  VELAZQUEZ      LUIS MANUEL
## 2   2   ALMONTE     CHAVEZ    DANIEL ADRIAN
## 3   3  ALVARADO     MORENO    NANCY ALONDRA
## 4   4    BAYONA    MARRUFO      CESAR YAHIR
## 5   5     CALVO    QUEZADA    ARIANNA ELISA
## 6   6    CASTRO     SANTOS   JESSICA SARAHI
## 7   7 CASTRUITA  ARCINIEGA          RICARDO
## 8   8   CORDERO     RIVERA    ANDREA FATIMA
## 9   9     DERAS     CHAVEZ  DIEGO ALEXANDER
## 10 10      DIAZ   CARRILLO   ANDREA PAULINA
tail(nombres,10)
##        no     patreno    materno            nombre
## 5725 5734     VARGAS   VIOLANTE   BRICIA ESMERALDA
## 5726 5735    VAZQUEZ     VERDIN           GABRIELA
## 5727 5736       VEGA    SALINAS           EMMANUEL
## 5728 5737  VELAZQUEZ  RODRIGUEZ       JESUS MANUEL
## 5729 5738      VELOZ      GAMIZ               OMAR
## 5730 5739      VILLA     ORTEGA     DAVID GEOVANNI
## 5731 5740      VILLA    VAZQUEZ  OSWALDO ALEJANDRO
## 5732 5741 VILLARREAL    ASTORGA   VANESSA GABRIELA
## 5733 5742   VILLEGAS     ORTEGA   ALEXANDER RAFAEL
## 5734 5743     VITELA  GUTIERREZ          LUIS RENE

Determinar frecuencia

Se determina la frecuencia con la función table() y se convierte a un data frame con la función data.frame().

La variable o columna de interes es nombre y se accede a ella a través de la expresión nombre$nombre.

Solo se observan los primeros diez registros de frecuencias con head().

frecuencias<-data.frame(table(nombres$nombre))
head(frecuencias,10)
##               Var1 Freq
## 1         #¡VALOR!    8
## 2    Ã\201NGEL DYDIER    1
## 3            AARON    7
## 4     AARON ADOLFO    1
## 5  AARON ALEJANDRO    1
## 6    AARON EDUARDO    1
## 7       AARON ISAI    1
## 8     AARÓN ISAÍAS    1
## 9     AARON MANUEL    1
## 10    AARON MISAEL    1

Ordenar las frecuencias

Ordenar por medio de la función order()

frecuencias.ordenada<-frecuencias[order(frecuencias$Freq, decreasing=TRUE),]
head(frecuencias.ordenada, 5)
##                Var1 Freq
## 2762 MARIA FERNANDA   36
## 138       ALEJANDRO   32
## 930          DANIEL   31
## 2189    JOSE MANUEL   28
## 2241    JUAN CARLOS   27

Diagrama de barra

barplot(height = head(frecuencias.ordenada$Freq, 5)
, names.arg = head(frecuencias.ordenada$Var1, 5), main = "Frecuencia de nombres", xlab = "Nombres", ylab = "Frecuencias")

Interpretación

Al momento de importar los datos se encontró que hay 3735 observaciones y tomando en cuenta los registros se determinó la variable de interés que consiste en adquirir los 5 nombres más frecuentes, de los cuales, el que obtuvo una mayor frecuencia fue Maria Fernanda, con un total de 36 veces como se observa en la tabla de barra.