Cargar librerías

library(readr)
library(ggplot2)

Cargar las funciones

source("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/scripts/probar%20funciones.R")

Cargar los datos limpios

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/datos/datos_aguacate_limpio.csv")

Visualizar histograma

simple plot

f_histograma(datos$precio, "Precio aguacate")

Con ggplot()

f_histograma_ggplot(datos$precio, "Precio aguacate")

Diagrama de caja

Con boxplot()

f_diagcaja(datos$precio, "Precio aguacate")

con ggplot

f_diagcaja_ggplot(datos$precio, "Precio aguacate")

Precio en función del tipo

precio_limpio <- f_limpiar_atipicos(datos$precio)
datos$precio_limpio <- precio_limpio 

f_boxplotv1v2(datos$precio_limpio, datos$tipo, "Distribución de precio en relación a tipo", modo = 'V')

#   o bien

f_boxplotv1v2(datos$precio_limpio, datos$tipo, "Distribución de precio en relación a tipo", modo = 'H', color = TRUE)

Interpretación

El valor del precio medio unitario del aguacate es de 1.41, el valor de la mediana es de 1.37 con una desviación estándar de 0.4.

La distribución del precio presenta un sesgo del lado derecho, seguramente hay datos atípicos.

El 68% de los datos está en el rango desde 1 a 1.81 que implica \(\mu \pm 1\sigma\).

Visualmente se observan valores atípicos muy por encima del cuartil 3 o sea \({precio > (Q3 + 1.5 \times RI)}\).

El precio unitario del aguacte orgánico tiene un precio mas alto.