Gráfico de barra

El gráfico de barra visualiza normalmente datos categóricos y representa la frecuencia de los mismos.

Cargar los datos

library(readr)
## Warning: package 'readr' was built under R version 4.0.3
datos.personas <- read.csv("https://raw.githubusercontent.com/rpizarrog/FundamentosMachineLearning/master/datos/personas.2.csv", encoding = "iso-8859-1", stringsAsFactors = TRUE)
datos.personas 

Summary de los datos

summary(datos.personas)
##        id        nombres      edades      generos   feliz        
##  Min.   : 1   Aracely:2   Min.   :23.00   F:7     Mode :logical  
##  1st Qu.: 4   Luis   :2   1st Qu.:30.00   M:6     FALSE:6        
##  Median : 7   Brenda :1   Median :34.00           TRUE :7        
##  Mean   : 7   Gabriel:1   Mean   :37.85                          
##  3rd Qu.:10   Jimena :1   3rd Qu.:45.00                          
##  Max.   :13   Juan   :1   Max.   :54.00                          
##               (Other):5                                          
##    estaturas         pesos            zonas  
##  Min.   :1.540   Min.   :50.00   CENTRO  :4  
##  1st Qu.:1.650   1st Qu.:65.00   NORTE   :1  
##  Median :1.720   Median :75.00   ORIENTE :1  
##  Mean   :1.728   Mean   :73.38   PONIENTE:2  
##  3rd Qu.:1.780   3rd Qu.:80.00   SUR     :5  
##  Max.   :1.900   Max.   :90.00               
## 

Generar gráficos

El ejercicio consiste en diagrama de barra

El gráfico de barra visualiza normalmente datos categóricos y representa la frecuencia de los mismos.

Se utiliza un conjunto de datos existente llamado datos.personas.

Gráfica de barra por género

Se debe generar primero la frecuencia de la variable categórica genero del conjunto de datos

frec.generos <- table(datos.personas$generos)
frec.generos
## 
## F M 
## 7 6
frec.generos[1]
## F 
## 7
frec.generos[2]
## M 
## 6
names(frec.generos)
## [1] "F" "M"
as.numeric(frec.generos)
## [1] 7 6
generos <- names(frec.generos)
frecuencias <-as.numeric(frec.generos)
barplot(height = frecuencias, names.arg = generos, main = "Frecuencias por Género", col = c("pink", "blue"))

Frecuencias de zonas

Con la función levels(datos.personas$zonas) se identifica los factores de una variable cualitativa.

levels(datos.personas$zonas)
## [1] "CENTRO"   "NORTE"    "ORIENTE"  "PONIENTE" "SUR"
zonas <- levels(datos.personas$zonas)

Ahora se determina la frecuencia de la variable zonas

source("../funciones/misfunciones.r")
frecuencias <-ffrecuencias(datos.personas$zonas)
frecuencias
## [1] 4 1 1 2 5
barplot(height = frecuencias, names.arg = zonas, main = "Frecuencias por Zonas")