library(readr)
library(ggplot2)
source("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/scripts/probar%20funciones.R")
datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/datos/datos_aguacate_limpio.csv")
simple plot
f_histograma(datos$precio, "Precio aguacate")
Con ggplot()
f_histograma_ggplot(datos$precio, "Precio aguacate")
Con boxplot()
f_diagcaja(datos$precio, "Precio aguacate")
con ggplot
f_diagcaja_ggplot(datos$precio, "Precio aguacate")
Precio en función del tipo
precio_limpio <- f_limpiar_atipicos(datos$precio)
datos$precio_limpio <- precio_limpio
f_boxplotv1v2(datos$precio_limpio, datos$tipo, "Distribución de precio en relación a tipo", modo = 'V')
# o bien
f_boxplotv1v2(datos$precio_limpio, datos$tipo, "Distribución de precio en relación a tipo", modo = 'H', color = TRUE)
El valor del precio medio unitario del aguacate es de 1.41, el valor de la mediana es de 1.37 con una desviación estándar de 0.4.
La distribución del precio presenta un sesgo del lado derecho, seguramente hay datos atípicos.
El 68% de los datos está en el rango desde 1 a 1.81 que implica \(\mu \pm 1\sigma\).
Visualmente se observan valores atípicos muy por encima del cuartil 3 o sea \({precio > (Q3 + 1.5 \times RI)}\).
El precio unitario del aguacte orgánico tiene un precio mas alto.