Instrucciones

De forma individual utilizando Lenguaje R y RStudio:

Por Auditoría Interna se necesita analizar la información de los últimos 1.500 resultados del juego de azar Kino de Lotería, para ello se cuenta con el siguiente CSV:

https://eduudlamy.sharepoint.com/:x:/g/personal/131030614_academicos_uamericas_cl/EZcK2TmD6QtNll9G8rRwGesBFmuhqLizP0S-68niTYsQ6Q?e=j7BqqO

Con la información anterior se solicita realizar en Lenguaje R utilizando RStudio lo siguiente:

  1. Teniendo en cuenta que el archivo está separado por “;”, leer el archivo CSV y transformar en una matriz utilizando las sentencias adecuadas en R. Sólo debe considerar desde la 3° columna inclusive.

  2. Determinar el número que menos y más veces se sortea, considerando la información del archivo CSV.

  3. Responder a la consulta. ¿Cuáles son los 14 números que más se sortean?.

  4. Calcular la Frecuencia Absoluta de cada número dentro de los 25 sorteados.

  5. Graficar la Frecuencia Absoluta:

  1. Utilizar 1 sólo color para las barras.

  2. Agregar al gráfico: título principal, nombre del eje x y nombre del eje.

  1. Generar el Histograma de la Frecuencia Absoluta de los 1500 sorteos.
  1. Utilizar 1 sólo color para las barras.

  2. Agregar al gráfico: título principal, nombre del eje x y nombre del eje.

Desarrollo

  1. Se carga el archivo con los datos a utilizar.
library(readxl)
Numeros_de_kino <- read_excel("kino.xlsx")
## New names:
## * `` -> ...1
## * `` -> ...2
Numeros_de_kino

Se eliminan las primeras dos columnas del archivo importado y se traspasan a una matriz.

Matriz.Kino <- Numeros_de_kino[ , -c(1,2)]
Matriz.Kino
  1. Se determina el número que más veces se repite en sorteos.
fabs <- table(unlist(Matriz.Kino))
sort(fabs, decreasing = TRUE)
## 
##  10   5  15  12   4   7   8   2   3   6  13   9  25  20   1  11  21  22  14  18 
## 887 880 856 851 850 847 847 841 841 841 841 840 839 838 837 837 837 835 831 829 
##  23  17  24  16  19 
## 826 824 821 819 819

Se calculó la frecuencia absoluta de cada número en los sorteos, y se ordenó el listado de manera decreciente para mostrar el número mas repetido primero; así se concluye que el número 10, es el que más se presenta en los sorteos.

Se determina el número que menos veces se repite en sorteos.

sort(fabs, decreasing = FALSE)
## 
##  16  19  24  17  23  18  14  22   1  11  21  20  25   9   2   3   6  13   7   8 
## 819 819 821 824 826 829 831 835 837 837 837 838 839 840 841 841 841 841 847 847 
##   4  12  15   5  10 
## 850 851 856 880 887

Se calculó la frecuencia absoluta de cada número en los sorteos, y ahora se ordenó el listado de manera creciente para mostrar el/los número/s menos repetido/s primero; así se concluye que los números 16 y 19, son los que menos se presentan en los sorteos.

  1. En base a la información que entregó la tabla de frecuencias absolutas mostrada anteriormente, los 14 que más se repiten son los siguientes:

10, 7, 13, 5, 8, 9, 15, 2, 25, 12, 3, 20, 4, 6

  1. Se genera una tabla con la frecuencia absoluta de cada número.
Tablafrec <- as.data.frame(table(unlist(Matriz.Kino)))
Tablafrec
  1. Se crea el grafico correspondiente a las frecuencias absolutas de cada número.
plot(fabs, xlab ="Número", main = "Frecuencia de aparición de los numeros en los sorteos", ylab = "Frecuencia",col = "blue")

  1. Se crea un histograma correspondiente a la frecuencia absoluta de los 1500 sorteos.
hist(fabs, xlab ="Sorteo", main = "Frecuencia de aparición de los numeros en los sorteos", ylab = "Número",col = "brown")