Análisis del aguacate

Cargar librerias

library(readr)
library(ggplot2)

Cargar funciones

source("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/scripts/probar%20funciones.R")

Cargar desde una url de internet

datos_aguacate_url = read.csv("https://raw.githubusercontent.com/rpizarrog/Ciencia-de-los-Datos-Descriptivo-Predictivo/refs/heads/main/datos/datos_aguacate_limpio.csv")

head(datos_aguacate_url, 10) # Muestra los primeros 10 datos de la tabla
##         fecha precio         tipo region
## 1  27/12/2015   1.33 conventional Albany
## 2  20/12/2015   1.35 conventional Albany
## 3  13/12/2015   0.93 conventional Albany
## 4  06/12/2015   1.08 conventional Albany
## 5  29/11/2015   1.28 conventional Albany
## 6  22/11/2015   1.26 conventional Albany
## 7  15/11/2015   0.99 conventional Albany
## 8  08/11/2015   0.98 conventional Albany
## 9  01/11/2015   1.02 conventional Albany
## 10 25/10/2015   1.07 conventional Albany
tail(datos_aguacate_url, 10) # Muestra los ultimos 10 datos de la tabla
##            fecha precio    tipo           region
## 18240 11/03/2018   1.56 organic WestTexNewMexico
## 18241 04/03/2018   1.54 organic WestTexNewMexico
## 18242 25/02/2018   1.57 organic WestTexNewMexico
## 18243 18/02/2018   1.56 organic WestTexNewMexico
## 18244 11/02/2018   1.57 organic WestTexNewMexico
## 18245 04/02/2018   1.63 organic WestTexNewMexico
## 18246 28/01/2018   1.71 organic WestTexNewMexico
## 18247 21/01/2018   1.87 organic WestTexNewMexico
## 18248 14/01/2018   1.93 organic WestTexNewMexico
## 18249 07/01/2018   1.62 organic WestTexNewMexico

Visualizar histograma

simple plot

f_histograma(datos_aguacate_url$precio, "Precio aguacate")

Con ggplot()

f_histograma_ggplot(datos_aguacate_url$precio, "Precio aguacate")

Diagrama de caja

Con boxplot()

f_diagcaja(datos_aguacate_url$precio, "Precio aguacate")

con ggplot

f_diagcaja_ggplot(datos_aguacate_url$precio, "Precio aguacate")

Precio en función del tipo

f_boxplotv1v2(datos_aguacate_url$precio, datos_aguacate_url$tipo, "Distribución de precio en relación a tipo", modo = 'V')

#   o bien

f_boxplotv1v2(datos_aguacate_url$precio,
              datos_aguacate_url$tipo, "Distribución de precio en relación a tipo", modo = 'H', color = TRUE)

Interpretación

El valor del precio medio unitario del aguacate es de 1.41, el valor de la mediana es de 1.37 con una desviación estándar de 0.4.

La distribución del precio presenta un sesgo del lado derecho, seguramente hay datos atípicos.

El 68% de los datos está en el rango desde 1 a 1.81 que implica μ±1σ .

Visualmente se observan valores atípicos muy por encima del cuartil 3 o sea precio>(Q3+1.5×RI) .

El precio unitario del aguacte orgánico tiene un precio mas alto.