Lectura de dataset

Leer datos de un csv

Para leer datos de un archivo csv utilizamos la funcion read.csv() y entre el parentesis indicamos la ruta donde se encuentra el archivo que vamos a leer como se muestra a continuacion:

datos <- read.csv("c:/R/Melate.csv", header = TRUE, sep=",")
head(datos)

##   R1 R2 R3 R4 R5 R6 R7      FECHA
## 1 11 28 41 44 47 55 52 13/02/2022
## 2  3  8 10 11 14 56 18 11/02/2022
## 3 29 36 38 39 42 49 48 09/02/2022
## 4  5 20 35 48 53 56 23 06/02/2022
## 5 10 14 34 37 42 54  1 04/02/2022
## 6  4  5 34 38 46 55 29 02/02/2022

Como podemos notar, la función read.csv() presenta 3 argumentos principales:

"c:/R/Melate.csv" es la ruta donde se encuentra el archivo csv.
header = TRUE Indica que tambien se extraigan los nombres de los encabezados.
sep="," se refiere a la separacion de los datos.

Tambien se utiliza la funcion head() que sirve para imprimir solo las primeras 6 filas del dataset (ya que tiene mas de 3500).

Podemos acceder a una sola columna de la siguiente forma:

r1 <- datos$R1
head(r1)

## [1] 11  3 29  5 10  4

Utilizamos la funcion hist() para la generacion de una grafica de los datos del dataset y la frecuencia con la que estos aparecen, en la siguiente grafica vemos la frecuencia con la que aparecen los datos de la columna R1.

hist(datos$R1, breaks = 100)

breaks = 100 nos indica la cantidad total de barras en la grafica.

La funcion fivenum() nos indica los 5 numeros que mas se repiten, en el siguiente ejemplo nos muestra los 5 numeros que mas se repiten en la columna R7.

fivenum(datos$R7)

## [1]  1 13 25 37 56

La funcion median() nos permite obtener la mediana de un rango de numeros.

median(datos$R1)

## [1] 5

Implementando la funcion fivenum() podemos obtener los numeros que mas se repiten en cada columna y asi apostar a esos numeros para tener mas probabilidades de ganar, los cuales son los siguientes:
R1: 1
R2: 2
R3: 4
R4: 5
R5: 12
R6: 20
R7: 1

Lectura de dataset - Melate

DIEGO

29/3/2023

Leer datos de un csv