Ejercicio_R_Big

Instrucciones

De forma individual utilizando Lenguaje R y RStudio:

Por Auditoría Interna se necesita analizar la información de los últimos 1.500 resultados del juego de azar Kino de Lotería, para ello se cuenta con el siguiente CSV:

https://eduudlamy.sharepoint.com/:x:/g/personal/131030614_academicos_uamericas_cl/EZcK2TmD6QtNll9G8rRwGesBFmuhqLizP0S-68niTYsQ6Q?e=j7BqqO

Con la información anterior se solicita realizar en Lenguaje R utilizando RStudio lo siguiente:

Teniendo en cuenta que el archivo está separado por “;”, leer el archivo CSV y transformar en una matriz utilizando las sentencias adecuadas en R. Sólo debe considerar desde la 3° columna inclusive.
Determinar el número que menos y más veces se sortea, considerando la información del archivo CSV.
Responder a la consulta. ¿Cuáles son los 14 números que más se sortean?.
Calcular la Frecuencia Absoluta de cada número dentro de los 25 sorteados.
Graficar la Frecuencia Absoluta:

Utilizar 1 sólo color para las barras.
Agregar al gráfico: título principal, nombre del eje x y nombre del eje.

Generar el Histograma de la Frecuencia Absoluta de los 1500 sorteos.

Utilizar 1 sólo color para las barras.
Agregar al gráfico: título principal, nombre del eje x y nombre del eje.

Desarrollo

Se carga el archivo con los datos a utilizar.

library(readxl)
Numeros_de_kino <- read_excel("kino.xlsx")

## New names:
## * `` -> ...1
## * `` -> ...2

Numeros_de_kino

Se eliminan las primeras dos columnas del archivo importado y se traspasan a una matriz.

Matriz.Kino <- Numeros_de_kino[ , -c(1,2)]
Matriz.Kino

Se determina el número que más veces se repite en sorteos.

fabs <- table(unlist(Matriz.Kino))
sort(fabs, decreasing = TRUE)

## 
##  10   5  15  12   4   7   8   2   3   6  13   9  25  20   1  11  21  22  14  18 
## 887 880 856 851 850 847 847 841 841 841 841 840 839 838 837 837 837 835 831 829 
##  23  17  24  16  19 
## 826 824 821 819 819

Se calculó la frecuencia absoluta de cada número en los sorteos, y se ordenó el listado de manera decreciente para mostrar el número mas repetido primero; así se concluye que el número 10, es el que más se presenta en los sorteos.

Se determina el número que menos veces se repite en sorteos.

sort(fabs, decreasing = FALSE)

## 
##  16  19  24  17  23  18  14  22   1  11  21  20  25   9   2   3   6  13   7   8 
## 819 819 821 824 826 829 831 835 837 837 837 838 839 840 841 841 841 841 847 847 
##   4  12  15   5  10 
## 850 851 856 880 887

Se calculó la frecuencia absoluta de cada número en los sorteos, y ahora se ordenó el listado de manera creciente para mostrar el/los número/s menos repetido/s primero; así se concluye que los números 16 y 19, son los que menos se presentan en los sorteos.

En base a la información que entregó la tabla de frecuencias absolutas mostrada anteriormente, los 14 que más se repiten son los siguientes:

10, 7, 13, 5, 8, 9, 15, 2, 25, 12, 3, 20, 4, 6

Se genera una tabla con la frecuencia absoluta de cada número.

Tablafrec <- as.data.frame(table(unlist(Matriz.Kino)))
Tablafrec

Se crea el grafico correspondiente a las frecuencias absolutas de cada número.

plot(fabs, xlab ="Número", main = "Frecuencia de aparición de los numeros en los sorteos", ylab = "Frecuencia",col = "blue")

Se crea un histograma correspondiente a la frecuencia absoluta de los 1500 sorteos.

hist(fabs, xlab ="Sorteo", main = "Frecuencia de aparición de los numeros en los sorteos", ylab = "Número",col = "brown")

Ejercicio_R_Big_Data

Ignacio Andrés Pérez Flores

27-10-2020

Instrucciones

Desarrollo