Objetivo

Analizar Datos de personas

Cargar Datos

Se cargan los datos de la direccion https://raw.githubusercontent.com/rpizarrog/CIIT.-Diplomado-en-Ciencia-de-los-Datos-e-IoT/main/M%C3%B3dulo%20I/SESI%C3%93N%206/scripts/generar%20personas.r

source("https://raw.githubusercontent.com/rpizarrog/CIIT.-Diplomado-en-Ciencia-de-los-Datos-e-IoT/main/M%C3%B3dulo%20I/SESI%C3%93N%206/scripts/generar%20personas.r" , encoding = "UTF-8")

mostrar los primero y ultimos datos

head(datos.personas,10)
##    edad    genero              estado    feliz
## 1    21  FEMENINO     BAJA CALIFORNIA NO FELIZ
## 2    18  FEMENINO          NUEVO LEÓN NO FELIZ
## 3    30  FEMENINO          TAMAULIPAS    FELIZ
## 4    23  FEMENINO          NUEVO LEÓN NO FELIZ
## 5    47 MASCULINO          TAMAULIPAS    FELIZ
## 6    38  FEMENINO             DURANGO NO FELIZ
## 7    63  FEMENINO BAJA CALIFORNIA SUR    FELIZ
## 8    56 MASCULINO     BAJA CALIFORNIA    FELIZ
## 9    30  FEMENINO            COAHUILA NO FELIZ
## 10   54 MASCULINO           CHIHUAHUA    FELIZ
tail(datos.personas,10)
##       edad    genero          estado    feliz
## 9991    30  FEMENINO         DURANGO NO FELIZ
## 9992    48  FEMENINO      TAMAULIPAS NO FELIZ
## 9993    34  FEMENINO       CHIHUAHUA NO FELIZ
## 9994    55  FEMENINO          SONORA    FELIZ
## 9995    28  FEMENINO BAJA CALIFORNIA    FELIZ
## 9996    58 MASCULINO BAJA CALIFORNIA NO FELIZ
## 9997    44  FEMENINO          SONORA    FELIZ
## 9998    23  FEMENINO        COAHUILA NO FELIZ
## 9999    23  FEMENINO          SONORA NO FELIZ
## 10000   39 MASCULINO      NUEVO LEÓN    FELIZ

##Describir los datos

summary(datos.personas)
##       edad         genero             estado             feliz          
##  Min.   :18.0   Length:10000       Length:10000       Length:10000      
##  1st Qu.:30.0   Class :character   Class :character   Class :character  
##  Median :41.0   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :41.5                                                           
##  3rd Qu.:53.0                                                           
##  Max.   :65.0

Histograma de edades

hist(datos.personas$edad)

generar frecuencia de genero

frecuencia.genero <- data.frame(table(datos.personas$genero))
frecuencia.genero
##        Var1 Freq
## 1  FEMENINO 5215
## 2 MASCULINO 4785