Para leer datos de un archivo csv utilizamos la funcion read.csv() y entre el parentesis indicamos la ruta donde se encuentra el archivo que vamos a leer como se muestra a continuacion:
datos <- read.csv("c:/R/Melate.csv", header = TRUE, sep=",")
head(datos)
## R1 R2 R3 R4 R5 R6 R7 FECHA
## 1 11 28 41 44 47 55 52 13/02/2022
## 2 3 8 10 11 14 56 18 11/02/2022
## 3 29 36 38 39 42 49 48 09/02/2022
## 4 5 20 35 48 53 56 23 06/02/2022
## 5 10 14 34 37 42 54 1 04/02/2022
## 6 4 5 34 38 46 55 29 02/02/2022
Como podemos notar, la función read.csv() presenta 3 argumentos principales:
"c:/R/Melate.csv" es la ruta donde se encuentra el archivo csv.
header = TRUE Indica que tambien se extraigan los nombres de los encabezados.
sep="," se refiere a la separacion de los datos.
Tambien se utiliza la funcion head() que sirve para imprimir solo las primeras 6 filas del dataset (ya que tiene mas de 3500).
Podemos acceder a una sola columna de la siguiente forma:
r1 <- datos$R1
head(r1)
## [1] 11 3 29 5 10 4
Utilizamos la funcion hist() para la generacion de una grafica de los datos del dataset y la frecuencia con la que estos aparecen, en la siguiente grafica vemos la frecuencia con la que aparecen los datos de la columna R1.
hist(datos$R1, breaks = 100)
breaks = 100 nos indica la cantidad total de barras en la grafica.
La funcion fivenum() nos indica los 5 numeros que mas se repiten, en el siguiente ejemplo nos muestra los 5 numeros que mas se repiten en la columna R7.
fivenum(datos$R7)
## [1] 1 13 25 37 56
La funcion median() nos permite obtener la mediana de un rango de numeros.
median(datos$R1)
## [1] 5
Implementando la funcion fivenum() podemos obtener los numeros que mas se repiten en cada columna y asi apostar a esos numeros para tener mas probabilidades de ganar, los cuales son los siguientes:
R1: 1
R2: 2
R3: 4
R4: 5
R5: 12
R6: 20
R7: 1