---
title: "Análisis de Datos de Melate"
author: "Vicente Nevarez"
date: "2024-05-09"
output: html_document
---

# Introducción
Este informe presenta un análisis de un conjunto de datos de Melate. Incluye la generación de histogramas para visualizar la distribución de los datos, el cálculo de las medianas para cada columna y la obtención de cinco números representativos de cada conjunto de datos.

# Carga de datos

```r
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)

## 
## Attaching package: 'dplyr'

## The following objects are masked from 'package:stats':
## 
##     filter, lag

## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

# Leer datos desde un archivo CSV
datos <- read.csv("C:/R/Melate.csv", header = TRUE, sep = ",")

# Breve descripción de los datos
str(datos)

## 'data.frame':    3548 obs. of  8 variables:
##  $ R1   : int  11 3 29 5 10 4 15 21 3 3 ...
##  $ R2   : int  28 8 36 20 14 5 16 27 18 8 ...
##  $ R3   : int  41 10 38 35 34 34 40 40 19 19 ...
##  $ R4   : int  44 11 39 48 37 38 41 44 45 25 ...
##  $ R5   : int  47 14 42 53 42 46 51 45 49 34 ...
##  $ R6   : int  55 56 49 56 54 55 52 53 50 51 ...
##  $ R7   : int  52 18 48 23 1 29 25 37 54 10 ...
##  $ FECHA: chr  "13/02/2022" "11/02/2022" "09/02/2022" "06/02/2022" ...

summary(datos)

##        R1               R2              R3              R4       
##  Min.   : 1.000   Min.   : 2.00   Min.   : 3.00   Min.   : 4.00  
##  1st Qu.: 3.000   1st Qu.: 8.00   1st Qu.:15.00   1st Qu.:22.00  
##  Median : 5.000   Median :13.00   Median :20.00   Median :28.00  
##  Mean   : 7.103   Mean   :14.01   Mean   :21.37   Mean   :28.59  
##  3rd Qu.:10.000   3rd Qu.:19.00   3rd Qu.:27.00   3rd Qu.:35.00  
##  Max.   :42.000   Max.   :45.00   Max.   :52.00   Max.   :54.00  
##        R5              R6              R7          FECHA          
##  Min.   :10.00   Min.   :14.00   Min.   : 1.0   Length:3548       
##  1st Qu.:30.00   1st Qu.:37.00   1st Qu.:13.0   Class :character  
##  Median :36.00   Median :43.00   Median :25.0   Mode  :character  
##  Mean   :35.74   Mean   :42.91   Mean   :25.3                     
##  3rd Qu.:42.00   3rd Qu.:50.00   3rd Qu.:37.0                     
##  Max.   :55.00   Max.   :56.00   Max.   :56.0

En este bloque de código, cargamos las librerías necesarias para el análisis y leemos los datos desde un archivo CSV. Se muestra la estructura y un resumen básico del conjunto de datos para obtener una visión general.

Histogramas para la distribución de datos

# Histogramas de las primeras 1037 filas
par(mfrow = c(2, 4))
hist(datos$R1[1:1037], breaks = 100, main = "Histograma de R1", xlab = "R1", col = "lightblue")
hist(datos$R2[1:1037], breaks = 100, main = "Histograma de R2", xlab = "R2", col = "lightblue")
hist(datos$R3[1:1037], breaks = 100, main = "Histograma de R3", xlab = "R3", col = "lightblue")
hist(datos$R4[1:1037], breaks = 100, main = "Histograma de R4", xlab = "R4", col = "lightblue")
hist(datos$R5[1:1037], breaks = 100, main = "Histograma de R5", xlab = "R5", col = "lightblue")
hist(datos$R6[1:1037], breaks = 100, main = "Histograma de R6", xlab = "R6", col = "lightblue")
hist(datos$R7[1:1037], breaks = 100, main = "Histograma de R7", xlab = "R7", col = "lightblue")

Los histogramas muestran la distribución de cada columna (R1 a R7) para las primeras 1037 filas. Usamos par(mfrow = c(2, 4)) para mostrar múltiples histogramas en un solo gráfico. Se ajustan los parámetros como el número de divisiones y el color para facilitar la interpretación visual.

Medianas de cada columna

# Medianas de cada columna
medianas <- data.frame(
  R1 = median(datos$R1[1:1037]),
  R2 = median(datos$R2[1:1037]),
  R3 = median(datos$R3[1:1037]),
  R4 = median(datos$R4[1:1037]),
  R5 = median(datos$R5[1:1037]),
  R6 = median(datos$R6[1:1037]),
  R7 = median(datos$R7[1:1037])
)

medianas

##   R1 R2 R3 R4 R5 R6 R7
## 1  6 15 24 33 42 51 29

En este bloque, calculamos las medianas para cada una de las columnas R1 a R7 para las primeras 1037 filas. La mediana es un valor estadístico que ayuda a comprender el centro de una distribución, especialmente cuando hay valores atípicos que pueden sesgar la media.

Cinco números con mayor frecuencia para cada conjunto

# Cinco números representativos para cada columna
r1 <- c(fivenum(datos$R1[1:1037]))
r2 <- c(fivenum(datos$R2[1:1037]))
r3 <- c(fivenum(datos$R3[1:1037]))
r4 <- c(fivenum(datos$R4[1:1037]))
r5 <- c(fivenum(datos$R5[1:1037]))
r6 <- c(fivenum(datos$R6[1:1037]))
r7 <- c(fivenum(datos$R7[1:1037]))

# Tabla de resultados
datos2 <- data.frame(r1 = r1, r2 = r2, r3 = r3, r4 = r4, r5 = r5, r6 = r6, r7 = r7)
datos2

##   r1 r2 r3 r4 r5 r6 r7
## 1  1  2  4  5 12 20  1
## 2  3  9 17 25 35 46 16
## 3  6 15 24 33 42 51 29
## 4 11 21 31 39 47 54 44
## 5 42 45 51 53 55 56 56

Aquí usamos la función fivenum para obtener cinco valores clave que describen cada conjunto de datos. Los cinco valores son el mínimo, el primer cuartil, la mediana, el tercer cuartil y el máximo. Al presentarlos en forma de tabla, podemos comparar visualmente las diferencias entre las columnas R1 a R7 y obtener información sobre el rango de valores y las tendencias generales.

Conclusiones

En este informe se han presentado diversos análisis para el conjunto de datos de Melate. Los histogramas ofrecen una visión gráfica de la distribución de valores, las medianas aportan un punto de referencia estadístico, y los cinco números clave proporcionan un resumen rápido de cada conjunto de datos. Estos análisis constituyen un buen punto de partida para entender el comportamiento y las tendencias dentro de los datos de Melate. ```