---
title: "Análisis de Datos de Melate"
author: "Vicente Nevarez"
date: "2024-05-09"
output: html_document
---
# Introducción
Este informe presenta un análisis de un conjunto de datos de Melate. Incluye la generación de histogramas para visualizar la distribución de los datos, el cálculo de las medianas para cada columna y la obtención de cinco números representativos de cada conjunto de datos.
# Carga de datos
```r
# Cargar librerías necesarias
library(ggplot2)
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# Leer datos desde un archivo CSV
datos <- read.csv("C:/R/Melate.csv", header = TRUE, sep = ",")
# Breve descripción de los datos
str(datos)
## 'data.frame': 3548 obs. of 8 variables:
## $ R1 : int 11 3 29 5 10 4 15 21 3 3 ...
## $ R2 : int 28 8 36 20 14 5 16 27 18 8 ...
## $ R3 : int 41 10 38 35 34 34 40 40 19 19 ...
## $ R4 : int 44 11 39 48 37 38 41 44 45 25 ...
## $ R5 : int 47 14 42 53 42 46 51 45 49 34 ...
## $ R6 : int 55 56 49 56 54 55 52 53 50 51 ...
## $ R7 : int 52 18 48 23 1 29 25 37 54 10 ...
## $ FECHA: chr "13/02/2022" "11/02/2022" "09/02/2022" "06/02/2022" ...
summary(datos)
## R1 R2 R3 R4
## Min. : 1.000 Min. : 2.00 Min. : 3.00 Min. : 4.00
## 1st Qu.: 3.000 1st Qu.: 8.00 1st Qu.:15.00 1st Qu.:22.00
## Median : 5.000 Median :13.00 Median :20.00 Median :28.00
## Mean : 7.103 Mean :14.01 Mean :21.37 Mean :28.59
## 3rd Qu.:10.000 3rd Qu.:19.00 3rd Qu.:27.00 3rd Qu.:35.00
## Max. :42.000 Max. :45.00 Max. :52.00 Max. :54.00
## R5 R6 R7 FECHA
## Min. :10.00 Min. :14.00 Min. : 1.0 Length:3548
## 1st Qu.:30.00 1st Qu.:37.00 1st Qu.:13.0 Class :character
## Median :36.00 Median :43.00 Median :25.0 Mode :character
## Mean :35.74 Mean :42.91 Mean :25.3
## 3rd Qu.:42.00 3rd Qu.:50.00 3rd Qu.:37.0
## Max. :55.00 Max. :56.00 Max. :56.0
En este bloque de código, cargamos las librerías necesarias para el análisis y leemos los datos desde un archivo CSV. Se muestra la estructura y un resumen básico del conjunto de datos para obtener una visión general.
# Histogramas de las primeras 1037 filas
par(mfrow = c(2, 4))
hist(datos$R1[1:1037], breaks = 100, main = "Histograma de R1", xlab = "R1", col = "lightblue")
hist(datos$R2[1:1037], breaks = 100, main = "Histograma de R2", xlab = "R2", col = "lightblue")
hist(datos$R3[1:1037], breaks = 100, main = "Histograma de R3", xlab = "R3", col = "lightblue")
hist(datos$R4[1:1037], breaks = 100, main = "Histograma de R4", xlab = "R4", col = "lightblue")
hist(datos$R5[1:1037], breaks = 100, main = "Histograma de R5", xlab = "R5", col = "lightblue")
hist(datos$R6[1:1037], breaks = 100, main = "Histograma de R6", xlab = "R6", col = "lightblue")
hist(datos$R7[1:1037], breaks = 100, main = "Histograma de R7", xlab = "R7", col = "lightblue")
Los histogramas muestran la distribución de cada columna (R1 a R7) para
las primeras 1037 filas. Usamos
par(mfrow = c(2, 4)) para
mostrar múltiples histogramas en un solo gráfico. Se ajustan los
parámetros como el número de divisiones y el color para facilitar la
interpretación visual.
# Medianas de cada columna
medianas <- data.frame(
R1 = median(datos$R1[1:1037]),
R2 = median(datos$R2[1:1037]),
R3 = median(datos$R3[1:1037]),
R4 = median(datos$R4[1:1037]),
R5 = median(datos$R5[1:1037]),
R6 = median(datos$R6[1:1037]),
R7 = median(datos$R7[1:1037])
)
medianas
## R1 R2 R3 R4 R5 R6 R7
## 1 6 15 24 33 42 51 29
En este bloque, calculamos las medianas para cada una de las columnas R1 a R7 para las primeras 1037 filas. La mediana es un valor estadístico que ayuda a comprender el centro de una distribución, especialmente cuando hay valores atípicos que pueden sesgar la media.
# Cinco números representativos para cada columna
r1 <- c(fivenum(datos$R1[1:1037]))
r2 <- c(fivenum(datos$R2[1:1037]))
r3 <- c(fivenum(datos$R3[1:1037]))
r4 <- c(fivenum(datos$R4[1:1037]))
r5 <- c(fivenum(datos$R5[1:1037]))
r6 <- c(fivenum(datos$R6[1:1037]))
r7 <- c(fivenum(datos$R7[1:1037]))
# Tabla de resultados
datos2 <- data.frame(r1 = r1, r2 = r2, r3 = r3, r4 = r4, r5 = r5, r6 = r6, r7 = r7)
datos2
## r1 r2 r3 r4 r5 r6 r7
## 1 1 2 4 5 12 20 1
## 2 3 9 17 25 35 46 16
## 3 6 15 24 33 42 51 29
## 4 11 21 31 39 47 54 44
## 5 42 45 51 53 55 56 56
Aquí usamos la función fivenum para obtener cinco
valores clave que describen cada conjunto de datos. Los cinco valores
son el mínimo, el primer cuartil, la mediana, el tercer cuartil y el
máximo. Al presentarlos en forma de tabla, podemos comparar visualmente
las diferencias entre las columnas R1 a R7 y obtener información sobre
el rango de valores y las tendencias generales.
En este informe se han presentado diversos análisis para el conjunto de datos de Melate. Los histogramas ofrecen una visión gráfica de la distribución de valores, las medianas aportan un punto de referencia estadístico, y los cinco números clave proporcionan un resumen rápido de cada conjunto de datos. Estos análisis constituyen un buen punto de partida para entender el comportamiento y las tendencias dentro de los datos de Melate. ```