Valeria Mata Santiago Rodriguez Andrea del Portillo Leidy Lorena Gomez
library(dplyr)
library(descriptr)
library(ggplot2)
library(knitr)
library(modeest)
library(fdth)
library(readxl)
library(datos)
datos_d <- diamantes
set.seed(2369)
datos_d <- sample_n(diamantes, size=120, replace = FALSE)
media_q <- mean(diamantes$quilate)
media_q
## [1] 0.7979397
mediana <- median(diamantes$quilate)
mediana
## [1] 0.7
moda <- mlv1(diamantes$quilate)
moda
## [1] 0.4553637
rango_diamantes <- max(diamantes$profundidad)-min(diamantes$profundidad)
rango_diamantes
## [1] 36
cat("El rango de la profundidad de los diamantes es",rango_diamantes)
## El rango de la profundidad de los diamantes es 36
var_diamantes <- var(diamantes$profundidad)
cat("La varianzas de la profundidad de los diamantes es",var_diamantes)
## La varianzas de la profundidad de los diamantes es 2.052404
ds_diamantes <- sqrt(var(diamantes$profundidad))
cat("La Desviacion estandar de la profundidad de los diamantes es",ds_diamantes)
## La Desviacion estandar de la profundidad de los diamantes es 1.432621
CV <- (sd(diamantes$profundidad)/mean(diamantes$profundidad))*100
cat("El coeficiente de variacion de la profundidad de los diamantes es",CV)
## El coeficiente de variacion de la profundidad de los diamantes es 2.320057
percentil <- quantile(diamantes$tabla, probs = c(0.25,0.3,0.75,0.78,0.9), type = 3)
percentil
## 25% 30% 75% 78% 90%
## 56 56 59 59 60
asim_diamantes <-ds_skewness(diamantes$x)
court_diamantes <- ds_kurtosis(diamantes$x)
cat("El coeficiente de asimetria de x de los diamantes es",asim_diamantes)
## El coeficiente de asimetria de x de los diamantes es 0.3786763
cat("El coeficiente de kourtosis de x de los diamantes es",court_diamantes)
## El coeficiente de kourtosis de x de los diamantes es -0.6181607
tabla_frec_y <-ds_freq_table(diamantes,y)
tabla_frec_y
## Variable: y
## |-------------------------------------------------------------------------|
## | Bins | Frequency | Cum Frequency | Percent | Cum Percent |
## |-------------------------------------------------------------------------|
## | 0 - 11.8 | 53938 | 53938 | 100 | 100 |
## |-------------------------------------------------------------------------|
## | 11.8 - 23.6 | 0 | 53938 | 0 | 100 |
## |-------------------------------------------------------------------------|
## | 23.6 - 35.3 | 1 | 53939 | 0 | 100 |
## |-------------------------------------------------------------------------|
## | 35.3 - 47.1 | 0 | 53939 | 0 | 100 |
## |-------------------------------------------------------------------------|
## | 47.1 - 58.9 | 1 | 53940 | 0 | 100 |
## |-------------------------------------------------------------------------|
## | Total | 53940 | - | 100.00 | - |
## |-------------------------------------------------------------------------|
hist(diamonds$y,
breaks = 50,
xlim = c(0,10),
main = "Histograma de Y",
xlab = "y (mm)",
ylab = "Frecuencia",
col=c("purple","blue","green","aquamarine","cadetblue","pink"),
border = "grey")
tabla_frec_c <-ds_freq_table(diamantes,corte)
tabla_frec_c
## Variable: corte
## -------------------------------------------------------------------------
## Levels Frequency Cum Frequency Percent Cum Percent
## -------------------------------------------------------------------------
## Regular 1610 1610 2.98 2.98
## -------------------------------------------------------------------------
## Bueno 4906 6516 9.1 12.08
## -------------------------------------------------------------------------
## Muy bueno 12082 18598 22.4 34.48
## -------------------------------------------------------------------------
## Premium 13791 32389 25.57 60.05
## -------------------------------------------------------------------------
## Ideal 21551 53940 39.95 100
## -------------------------------------------------------------------------
## Total 53940 - 100.00 -
## -------------------------------------------------------------------------
tabla_z <- table(diamantes$corte)
tabla_z
##
## Regular Bueno Muy bueno Premium Ideal
## 1610 4906 12082 13791 21551
barplot(tabla_z,main = "Diagrama de barra para corte",
xlab = "zona", ylab ="Frecuencia",
col = c("blue","green","purple","gold"))
torta1 <- pie(tabla_z,
labels = c("Regular","Bueno","Muy bueno","Premium","Ideal"),
radius = 0.8,
clockwise = FALSE,
main = "Distribución de cortes de diamantes",
col = c("aquamarine","cadetblue","pink","purple","grey"))