Desarrollo

Importar los datos

Se leen los datos con read.csv()

nombres <- read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")

Visualizar observaciones

Se visualizan los primeros diez y últimos diez registros

head(nombres, 10)

##    no    patreno    materno          nombre
## 1   1    ALDABA  VELAZQUEZ      LUIS MANUEL
## 2   2   ALMONTE     CHAVEZ    DANIEL ADRIAN
## 3   3  ALVARADO     MORENO    NANCY ALONDRA
## 4   4    BAYONA    MARRUFO      CESAR YAHIR
## 5   5     CALVO    QUEZADA    ARIANNA ELISA
## 6   6    CASTRO     SANTOS   JESSICA SARAHI
## 7   7 CASTRUITA  ARCINIEGA          RICARDO
## 8   8   CORDERO     RIVERA    ANDREA FATIMA
## 9   9     DERAS     CHAVEZ  DIEGO ALEXANDER
## 10 10      DIAZ   CARRILLO   ANDREA PAULINA

tail(nombres, 10)

##        no     patreno    materno            nombre
## 5725 5734     VARGAS   VIOLANTE   BRICIA ESMERALDA
## 5726 5735    VAZQUEZ     VERDIN           GABRIELA
## 5727 5736       VEGA    SALINAS           EMMANUEL
## 5728 5737  VELAZQUEZ  RODRIGUEZ       JESUS MANUEL
## 5729 5738      VELOZ      GAMIZ               OMAR
## 5730 5739      VILLA     ORTEGA     DAVID GEOVANNI
## 5731 5740      VILLA    VAZQUEZ  OSWALDO ALEJANDRO
## 5732 5741 VILLARREAL    ASTORGA   VANESSA GABRIELA
## 5733 5742   VILLEGAS     ORTEGA   ALEXANDER RAFAEL
## 5734 5743     VITELA  GUTIERREZ          LUIS RENE

Determinar Frecuencia

Se determina la frecuencia con la función table() y se convierte a un data frame con la función data.frame()

La variable o columna de interés es nombre y se accede a ella como un vector a través de la expresión nombres$nombre..

Solo se observan los primeros diez registros de frecuencias con head().

frecuencias <- data.frame(table(nombres$nombre))
head(frecuencias )

##              Var1 Freq
## 1        #¡VALOR!    8
## 2   Ã\201NGEL DYDIER    1
## 3           AARON    7
## 4    AARON ADOLFO    1
## 5 AARON ALEJANDRO    1
## 6   AARON EDUARDO    1

Ordenar las frecuencias

frecuencias.ordenada <- frecuencias[order(frecuencias$Freq, decreasing = TRUE),]

head(frecuencias.ordenada, 5)

##                Var1 Freq
## 2762 MARIA FERNANDA   36
## 138       ALEJANDRO   32
## 930          DANIEL   31
## 2189    JOSE MANUEL   28
## 2241    JUAN CARLOS   27

tail(frecuencias.ordenada, 5)

##                 Var1 Freq
## 3731    ZILKA JOHARI    1
## 3732 ZINGAZKUK YADIR    1
## 3733  ZUEIZEN OLIVIA    1
## 3734          ZWETYA    1
## 3735    ZYANYA SOFIA    1

Diagrama de barras

A través de esta practica pude comprender con mayor facilidad los archivos de tipo R markdown, escribiendo códigos en bloques R; yendo mas a lo propio de la practica determinar la frecuencia de los nombres y me fijé que el nombre más frecuente fue María Fernanda y al parecer un pequeño error de datos tal vez por la codificación y los nombres con z los menos repetidos como Zyanya Zwetya entre otros son los menos repetidos.

Logre acomodar las frecuencias en orden decreciente desde María Fernanda hasta Zyanya obteniendo los primeros 5 e igualmente genere una grafica de barras para determinar de manera grafica estas frecuencias y mediante un poco de investigación, pude personalizar mi documento con bastante facilidad con simples códigos.

barplot(height = head(frecuencias.ordenada$Freq, 5)
, names.arg = head(frecuencias.ordenada$Var1, 5), main = "Frecuencia de nombres", xlab = "Nombres", ylab = "Frecuencias", col="white", border = "blue")

Caso1. Frecuencia de Nombres

Ivan Moreno Galindo

9/9/2021

Objetivo

Descripción