Caso 2: Tabla de Frecuencias

Objetivo:

Generar tablas de frecuencias con un conjunto de datos de 100 registros

Descripcion:

Crear un conjunto de datos de 100 registros con cuatro variables: nombre, genero, edad y deporte favorito de cada persona. Una vez construido el conjunto de datos elaborar tablas de frecuencias de los nombres, géneros (sexo) y deporte favorito; de igual forma determinar la tabla de frecuencia de las edades de las personas.

Paso 1: Cargar una libreria fdth.

library(fdth)

Paso 2: Crear conjunto de datos llamado personas.

Sembrar una semilla:
set.seed(2020) # Año 2020
losnombres <- c("JOSE","MARIA","JUAN","MARIO","ALONDRA","ESMERALDA","FERNANDA","MISTY","BULMA","KARINA","VICTORIA","ALFREDO","PINA","IBAN","OSCAR","DANIEL","LUNA","JONATHAN","ALEXIS","AGUSTIN")

nombres <- sample(losnombres, 100, replace = TRUE)



generos <- sample(c("Femenino", "Masculino"), 100, replace = TRUE)


edades <- sample(15:60, 100, replace = TRUE)


losdeportes <- c("FUTBOL","BASKETBOL","TENIS","AJEDRES","ATLETISMO","NATACION","KARATE","BEISBOL","FUTBOL AMERICANO","VOLEIBOL")
deportes <- sample(losdeportes, 100, replace = TRUE)


personal <- data.frame(nombres, generos, edades, deportes)
personal
##       nombres   generos edades         deportes
## 1     ALFREDO  Femenino     15           KARATE
## 2        JOSE Masculino     53         NATACION
## 3        LUNA  Femenino     58           FUTBOL
## 4       MARIO  Femenino     58         NATACION
## 5      KARINA  Femenino     36 FUTBOL AMERICANO
## 6   ESMERALDA Masculino     26        BASKETBOL
## 7        LUNA Masculino     26           KARATE
## 8        PINA Masculino     24           KARATE
## 9       MISTY  Femenino     27         VOLEIBOL
## 10     KARINA Masculino     41         NATACION
## 11   JONATHAN  Femenino     59         NATACION
## 12     DANIEL Masculino     56         VOLEIBOL
## 13      MARIA Masculino     55          AJEDRES
## 14     DANIEL Masculino     58           KARATE
## 15       JUAN Masculino     43         VOLEIBOL
## 16      MARIA Masculino     39         VOLEIBOL
## 17      MISTY  Femenino     33          AJEDRES
## 18      MARIO  Femenino     16            TENIS
## 19   JONATHAN  Femenino     58         VOLEIBOL
## 20       IBAN Masculino     18        BASKETBOL
## 21       IBAN  Femenino     25           KARATE
## 22    ALFREDO  Femenino     33          AJEDRES
## 23     DANIEL  Femenino     43           KARATE
## 24      OSCAR  Femenino     55        BASKETBOL
## 25       IBAN  Femenino     16           KARATE
## 26   FERNANDA  Femenino     34          BEISBOL
## 27    AGUSTIN  Femenino     21           KARATE
## 28   JONATHAN Masculino     22        BASKETBOL
## 29    AGUSTIN Masculino     28          BEISBOL
## 30    AGUSTIN  Femenino     58          AJEDRES
## 31     DANIEL Masculino     39 FUTBOL AMERICANO
## 32    ALFREDO  Femenino     50         VOLEIBOL
## 33   JONATHAN Masculino     37           FUTBOL
## 34     KARINA  Femenino     24            TENIS
## 35  ESMERALDA  Femenino     27         NATACION
## 36      OSCAR Masculino     41        ATLETISMO
## 37   VICTORIA  Femenino     49         NATACION
## 38       PINA  Femenino     41          BEISBOL
## 39       PINA  Femenino     41            TENIS
## 40       PINA Masculino     34          BEISBOL
## 41      MARIA  Femenino     37        ATLETISMO
## 42     DANIEL  Femenino     21            TENIS
## 43       PINA  Femenino     42        ATLETISMO
## 44       JOSE  Femenino     19         NATACION
## 45  ESMERALDA Masculino     41        ATLETISMO
## 46       JUAN Masculino     53          BEISBOL
## 47       PINA  Femenino     36         NATACION
## 48   VICTORIA Masculino     35 FUTBOL AMERICANO
## 49    ALONDRA  Femenino     39          AJEDRES
## 50   VICTORIA  Femenino     59         NATACION
## 51  ESMERALDA  Femenino     40            TENIS
## 52      MARIA Masculino     30            TENIS
## 53       JUAN Masculino     33         NATACION
## 54   JONATHAN  Femenino     46           KARATE
## 55       JOSE  Femenino     40 FUTBOL AMERICANO
## 56   FERNANDA Masculino     56        ATLETISMO
## 57      MISTY Masculino     50         VOLEIBOL
## 58       PINA Masculino     50           FUTBOL
## 59      MARIA  Femenino     23        BASKETBOL
## 60    ALONDRA  Femenino     42        BASKETBOL
## 61      MARIO Masculino     15        ATLETISMO
## 62     ALEXIS Masculino     59          BEISBOL
## 63     DANIEL  Femenino     56            TENIS
## 64      MARIO  Femenino     48          BEISBOL
## 65    AGUSTIN Masculino     59        ATLETISMO
## 66   JONATHAN Masculino     20        ATLETISMO
## 67     KARINA  Femenino     55        ATLETISMO
## 68       JOSE  Femenino     38        ATLETISMO
## 69      OSCAR Masculino     17           FUTBOL
## 70      BULMA Masculino     40        ATLETISMO
## 71     DANIEL Masculino     52         VOLEIBOL
## 72  ESMERALDA Masculino     48         NATACION
## 73     KARINA Masculino     48            TENIS
## 74       JOSE  Femenino     18         NATACION
## 75       JOSE Masculino     54           FUTBOL
## 76       LUNA  Femenino     23          BEISBOL
## 77      MISTY  Femenino     57           KARATE
## 78      OSCAR Masculino     24            TENIS
## 79    ALFREDO  Femenino     57         VOLEIBOL
## 80   JONATHAN  Femenino     56          AJEDRES
## 81       PINA  Femenino     26          AJEDRES
## 82    ALONDRA Masculino     55            TENIS
## 83     DANIEL  Femenino     44          AJEDRES
## 84    AGUSTIN Masculino     46           FUTBOL
## 85    AGUSTIN  Femenino     45           FUTBOL
## 86    AGUSTIN  Femenino     52           KARATE
## 87       IBAN Masculino     41          BEISBOL
## 88       PINA  Femenino     25          AJEDRES
## 89       LUNA  Femenino     46        ATLETISMO
## 90       PINA  Femenino     16            TENIS
## 91   FERNANDA Masculino     25 FUTBOL AMERICANO
## 92      BULMA  Femenino     15          AJEDRES
## 93      MISTY Masculino     28            TENIS
## 94       JUAN  Femenino     21         VOLEIBOL
## 95       JUAN Masculino     33            TENIS
## 96      MARIA  Femenino     20        ATLETISMO
## 97       PINA Masculino     44            TENIS
## 98      MISTY Masculino     31            TENIS
## 99      MARIO Masculino     59        ATLETISMO
## 100  FERNANDA  Femenino     24            TENIS

Paso 3:Crear tabla de frecuencias con table() de la variable nombres.

Total de elementos N
N <- nrow(personal)
N
## [1] 100
  • Determinar frecuencia absoluta
tabla_frec.nombres <- data.frame(transform(table(personal$nombres)))
names(tabla_frec.nombres) <- c("Nombres", "Frecuencia.Abso") 
tabla_frec.nombres
##      Nombres Frecuencia.Abso
## 1    AGUSTIN               7
## 2     ALEXIS               1
## 3    ALFREDO               4
## 4    ALONDRA               3
## 5      BULMA               2
## 6     DANIEL               8
## 7  ESMERALDA               5
## 8   FERNANDA               4
## 9       IBAN               4
## 10  JONATHAN               7
## 11      JOSE               6
## 12      JUAN               5
## 13    KARINA               5
## 14      LUNA               4
## 15     MARIA               6
## 16     MARIO               5
## 17     MISTY               6
## 18     OSCAR               4
## 19      PINA              11
## 20  VICTORIA               3
  • Determinar frecuencia relativa
Freq.relativa <- tabla_frec.nombres$Frecuencia / N

Freq.relativa
##  [1] 0.07 0.01 0.04 0.03 0.02 0.08 0.05 0.04 0.04 0.07 0.06 0.05 0.05 0.04 0.06
## [16] 0.05 0.06 0.04 0.11 0.03
  • Determinar frecuencia porcentual
Freq.Porcentual <- Freq.relativa * 100
Freq.Porcentual
##  [1]  7  1  4  3  2  8  5  4  4  7  6  5  5  4  6  5  6  4 11  3
  • Construyendo tabla de distribucion
tabla_frec.nombres <- cbind(tabla_frec.nombres, Freq.relativa, Freq.Porcentual)

tabla_frec.nombres
##      Nombres Frecuencia.Abso Freq.relativa Freq.Porcentual
## 1    AGUSTIN               7          0.07               7
## 2     ALEXIS               1          0.01               1
## 3    ALFREDO               4          0.04               4
## 4    ALONDRA               3          0.03               3
## 5      BULMA               2          0.02               2
## 6     DANIEL               8          0.08               8
## 7  ESMERALDA               5          0.05               5
## 8   FERNANDA               4          0.04               4
## 9       IBAN               4          0.04               4
## 10  JONATHAN               7          0.07               7
## 11      JOSE               6          0.06               6
## 12      JUAN               5          0.05               5
## 13    KARINA               5          0.05               5
## 14      LUNA               4          0.04               4
## 15     MARIA               6          0.06               6
## 16     MARIO               5          0.05               5
## 17     MISTY               6          0.06               6
## 18     OSCAR               4          0.04               4
## 19      PINA              11          0.11              11
## 20  VICTORIA               3          0.03               3

Paso 4: Crear tabla de frecuencias con fdt_cat() de la variable nombres.

  • Determinar frecuencia absoluta
  • Determinar frecuencia relativa
  • Determinar frecuencia porcentual
  • Determinar frecuencia acumulada
  • Determinar frecuencia porcentual acumulada
tabla_frec.nombres.2 <- data.frame(fdt_cat(personal$nombres))
names(tabla_frec.nombres.2) <- c("nombres", "Freq Abso.", "Freq Rela.", "Freq Porce.", "Freq Acum.", "Freq Porce.Acum")
tabla_frec.nombres.2
##      nombres Freq Abso. Freq Rela. Freq Porce. Freq Acum. Freq Porce.Acum
## 1       PINA         11       0.11          11         11              11
## 2     DANIEL          8       0.08           8         19              19
## 3    AGUSTIN          7       0.07           7         26              26
## 4   JONATHAN          7       0.07           7         33              33
## 5       JOSE          6       0.06           6         39              39
## 6      MARIA          6       0.06           6         45              45
## 7      MISTY          6       0.06           6         51              51
## 8  ESMERALDA          5       0.05           5         56              56
## 9       JUAN          5       0.05           5         61              61
## 10    KARINA          5       0.05           5         66              66
## 11     MARIO          5       0.05           5         71              71
## 12   ALFREDO          4       0.04           4         75              75
## 13  FERNANDA          4       0.04           4         79              79
## 14      IBAN          4       0.04           4         83              83
## 15      LUNA          4       0.04           4         87              87
## 16     OSCAR          4       0.04           4         91              91
## 17   ALONDRA          3       0.03           3         94              94
## 18  VICTORIA          3       0.03           3         97              97
## 19     BULMA          2       0.02           2         99              99
## 20    ALEXIS          1       0.01           1        100             100

Paso 5: Visualizar tabla de frecuencias de nombres (Barra).

barplot(height = tabla_frec.nombres$Frecuencia, names.arg = tabla_frec.nombres.2$nombres)

Paso 6: Visualizar un histograma de la variable edades

hist(personal$edades, main = "Frecuencia de edades", xlab = "Edades", ylab = "Frecuencias")

Paso 7: Crear tabla de frecuencias con table() de la variable edades

tabla.frec.edades <- data.frame(transform(table(personal$edades)))
names(tabla.frec.edades) <- c("edades", "Frecuencia")

barplot(height = tabla.frec.edades$Frecuencia, names.arg = tabla.frec.edades$edades,main = "Frecuencias de Edades",xlab = "Edades", ylab = "Frecuencias")

Paso 8: Crear tabla de frecuencias con fdt() de la variable edades.

tabla.frec.edades_2 <- fdt(personal$edades)
tabla.frec.edades_2 <- data.frame(tabla.frec.edades_2$table)

names(tabla.frec.edades_2) <- c('clases', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acumu') 
tabla.frec.edades_2
##            clases Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1  [14.85,20.442)         12            0.12               12              12
## 2 [20.442,26.035)         16            0.16               16              28
## 3 [26.035,31.627)          6            0.06                6              34
## 4  [31.627,37.22)         11            0.11               11              45
## 5  [37.22,42.812)         15            0.15               15              60
## 6 [42.812,48.405)         11            0.11               11              71
## 7 [48.405,53.998)          8            0.08                8              79
## 8  [53.998,59.59)         21            0.21               21             100
##   Frecuencia.Porce.Acumu
## 1                     12
## 2                     28
## 3                     34
## 4                     45
## 5                     60
## 6                     71
## 7                     79
## 8                    100

Paso 9: Visualizar tabla de frecuencias de edades (Barra).

barplot(height = tabla.frec.edades_2$Frecuencia, 
        names.arg = tabla.frec.edades_2$clases,
        main = "Frecuencias de Clases",
        xlab = "Clases de edades", ylab = "Frecuencias")

Paso 10: Crear tabla de frecuencias con fdt_cat() de la variable genero.

tabla_frec.genero <- data.frame(fdt_cat(personal$generos))
names(tabla_frec.genero) <- c('generos', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acum')
tabla_frec.genero
##     generos Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1  Femenino         55            0.55               55              55
## 2 Masculino         45            0.45               45             100
##   Frecuencia.Porce.Acum
## 1                    55
## 2                   100

Paso 11: Visualizar tabla de frecuencias de generos (Barra).

barplot(height = tabla_frec.genero$Frecuencia, 
        names.arg = tabla_frec.genero$generos,
        main = "Frecuencias de Géneros",
        xlab = "Géneros", ylab = "Frecuencias")

Grafica de pastel:

pie(x = tabla_frec.genero$Frecuencia, 
    labels = tabla_frec.genero$generos,
    col = c(110,100))

Paso 12: Crear tabla de frecuencias con fdt_cat() de a variable deportes.

tabla_frec.deporte <- data.frame(fdt_cat(personal$deportes))
names(tabla_frec.deporte) <- c('deportes', 'Frecuencia', 'Frecuencia.Rela', 'Frecuencia.Porce', 'Frecuencia.Acum', 'Frecuencia.Porce.Acum')
tabla_frec.deporte
##            deportes Frecuencia Frecuencia.Rela Frecuencia.Porce Frecuencia.Acum
## 1             TENIS         16            0.16               16              16
## 2         ATLETISMO         14            0.14               14              30
## 3          NATACION         12            0.12               12              42
## 4            KARATE         11            0.11               11              53
## 5           AJEDRES         10            0.10               10              63
## 6          VOLEIBOL         10            0.10               10              73
## 7           BEISBOL          9            0.09                9              82
## 8            FUTBOL          7            0.07                7              89
## 9         BASKETBOL          6            0.06                6              95
## 10 FUTBOL AMERICANO          5            0.05                5             100
##    Frecuencia.Porce.Acum
## 1                     16
## 2                     30
## 3                     42
## 4                     53
## 5                     63
## 6                     73
## 7                     82
## 8                     89
## 9                     95
## 10                   100

PAso 13: Visualizar tabla de frecuencias de deportes (Barra).

barplot(height = tabla_frec.deporte$Frecuencia, 
        names.arg = tabla_frec.deporte$deportes,
        main = "Frecuencias de deportes",
        xlab = "Deportes", ylab = "Frecuencias")

Grafica de pastel de Deportes:
pie(x = tabla_frec.deporte$Frecuencia, 
    labels = tabla_frec.deporte$deportes,
    col = rainbow(length(tabla_frec.deporte$deportes)))

Paso 14: Describir el caso. Por medio de 80 a 100 palabras describir el CASO 2

Descripcion:

En el caso 2, se aprendio el como generar datos de maneria aleatoria y que cantidad se quiera generar, tambien cuenta ya sea para generar deportes, generos, edades, etc., de manera aleatoria, tambien el familiarizarce con la creacion de tablas y frecuencias, y usando un nuevo comando el cual, nos ayuda a separar cada elementos que nosotros le demos.

Ahora, viendo los resultados que arrojan las tablas, frecuencias y graficas:

  • En la grafica de deportes, se puede observar que la mayoria de las personas les gusta el deporte de tenis, despues natacion, siguiendo de ajedres, pero en la grafica de pastel, atletismo, karate, tambien hay personas que les gusta estos deportes, mientras que futbol, basketbol, y futbol americano, son deportes que lo juegan muy pocas personas.

  • En la grafica de barras, son las mujeres, las cuales les gusta mas los deportes, alcanzando mas de 50 personas femeninas, mientras que los hombres, llegan a 40 personas.

  • En la frecuencia de edades, se muestra que las personas con edades de 24, 31, 41, 55, 58 años, son las que practican deportes.

En conclusion:

Las personas de 21 y 58 años, son las que mas practican deporte. Y gracias a este caso, se puede saber cuantas les gusta el deporte.