Determinar la frecuencia de nombres de personas a partir de importar datos
##Se creara un markdown para analizar los datos ## Se importan los datos de la direcion: <https://raw.githubusercontent.com/rpizarrog/Trabajos-en-R-AD2021/main/datos/nombres%20y%20apellidos.csv> que contiene nombres de alumnos.
La variable de interés es el nombre.
Se utiliza la función table() para determinar la frecuencia
Se utiliza la función order() para ordenar los valores
Ya con los valores ordenados se genera un diagrama de barra por medio de la función codebar().
Se hace una interpretación del caso.
Se visualizan los primeros diez y últimos diez registros u observaciones de los alumnos.
Se leen los datos con read.csv()
nombres <- read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")
Se ordena por medio de la función order().
##Se utiliza la función table() para determinar la frecuencia
##Se utiliza la función order() para ordenar los valores
##Ya con los valores ordenados se genera un diagrama de barra por medio de la función codebar().
##Se hace una interpretación del caso.
##Se visualizan los primeros diez y últimos diez registros u observaciones de los alumnos.
##Importar los datos ##Se leen los datos con read.csv()
nombres<-read.csv("https://raw.githubusercontent.com/rpizarrog/datos/main/nombres%20y%20apellidos.csv", encoding = "UTF-8")
#Solo se observan los primeros diez registros de frecuencias con head().
frecuencias <-data.frame(table(nombres$nombre))
head(frecuencias, 10)
## Var1 Freq
## 1 #¡VALOR! 8
## 2 Ã\201NGEL DYDIER 1
## 3 AARON 7
## 4 AARON ADOLFO 1
## 5 AARON ALEJANDRO 1
## 6 AARON EDUARDO 1
## 7 AARON ISAI 1
## 8 AARÓN ISAÍAS 1
## 9 AARON MANUEL 1
## 10 AARON MISAEL 1
##Se ordena por medio de la función order().
frecuencias.ordenada<-frecuencias[order(frecuencias$Freq, decreasing = TRUE),]
head(frecuencias.ordenada, 10)
## Var1 Freq
## 2762 MARIA FERNANDA 36
## 138 ALEJANDRO 32
## 930 DANIEL 31
## 2189 JOSE MANUEL 28
## 2241 JUAN CARLOS 27
## 1429 FERNANDO 24
## 2637 LUIS FERNANDO 24
## 285 ANDREA 23
## 977 DAVID 22
## 2186 JOSE LUIS 22
Grafica de nombres que más se repiten
barplot(height = head(frecuencias.ordenada$Freq, 10)
, names.arg = head(frecuencias.ordenada$Var1, 10), main = "Nombres que más se repiten", xlab = "Nombres", ylab = "Frecuencias")
En este caso aprendimos a utilizar algunos elementos como lo es table O para determinar con qué frecuencia se registraba el nombre de una persona, ademas utilizamos order O para, como su mismo nombre lo dice ordenar los datos que se fueron ingresando y registrando en el caso