Tarea 2

Valeria Mata Santiago Rodriguez Andrea del Portillo Leidy Lorena Gomez

library(dplyr)
library(descriptr)
library(ggplot2)
library(knitr)
library(modeest)
library(fdth)
library(readxl) 
library(datos)
  1. Las medidas de tendencia central para la variable quilate.
datos_d <- diamantes
set.seed(2369)
datos_d <- sample_n(diamantes, size=120, replace = FALSE)

media_q <- mean(diamantes$quilate)
media_q
## [1] 0.7979397
mediana <- median(diamantes$quilate)
mediana 
## [1] 0.7
moda <- mlv1(diamantes$quilate)
moda
## [1] 0.4553637
  1. Las medidas de variabilidad para la variable profundidad.
rango_diamantes <- max(diamantes$profundidad)-min(diamantes$profundidad)
rango_diamantes
## [1] 36
cat("El rango de la profundidad de los diamantes es",rango_diamantes)
## El rango de la profundidad de los diamantes es 36
var_diamantes <- var(diamantes$profundidad)
cat("La varianzas de la profundidad de los diamantes es",var_diamantes)
## La varianzas de la profundidad de los diamantes es 2.052404
ds_diamantes <- sqrt(var(diamantes$profundidad))
cat("La Desviacion estandar de la profundidad de los diamantes es",ds_diamantes)
## La Desviacion estandar de la profundidad de los diamantes es 1.432621
CV <- (sd(diamantes$profundidad)/mean(diamantes$profundidad))*100
cat("El coeficiente de variacion de la profundidad de los diamantes es",CV)
## El coeficiente de variacion de la profundidad de los diamantes es 2.320057
  1. El Q1, Q3 y los percentiles 30, 78 y 90 para la variable tabla.
percentil <- quantile(diamantes$tabla, probs = c(0.25,0.3,0.75,0.78,0.9),  type = 3)

percentil
## 25% 30% 75% 78% 90% 
##  56  56  59  59  60
  1. Las medidas de forma para la variable x.
asim_diamantes <-ds_skewness(diamantes$x) 
court_diamantes <- ds_kurtosis(diamantes$x)
cat("El coeficiente de asimetria de x de los diamantes es",asim_diamantes)
## El coeficiente de asimetria de x de los diamantes es 0.3786763
cat("El coeficiente de kourtosis de x de los diamantes es",court_diamantes)
## El coeficiente de kourtosis de x de los diamantes es -0.6181607
  1. elaborar una tabla de frecuencias y un histograma para la variable y.
tabla_frec_y <-ds_freq_table(diamantes,y)
tabla_frec_y
##                                 Variable: y                                 
## |-------------------------------------------------------------------------|
## |     Bins      | Frequency | Cum Frequency |   Percent    | Cum Percent  |
## |-------------------------------------------------------------------------|
## |   0   - 11.8  |   53938   |     53938     |     100      |     100      |
## |-------------------------------------------------------------------------|
## | 11.8  - 23.6  |     0     |     53938     |      0       |     100      |
## |-------------------------------------------------------------------------|
## | 23.6  - 35.3  |     1     |     53939     |      0       |     100      |
## |-------------------------------------------------------------------------|
## | 35.3  - 47.1  |     0     |     53939     |      0       |     100      |
## |-------------------------------------------------------------------------|
## | 47.1  - 58.9  |     1     |     53940     |      0       |     100      |
## |-------------------------------------------------------------------------|
## |     Total     |   53940   |       -       |    100.00    |      -       |
## |-------------------------------------------------------------------------|
hist(diamonds$y,
     breaks = 50,
     xlim   = c(0,10),  
     main   = "Histograma de Y",
     xlab   = "y (mm)",
     ylab   = "Frecuencia",
     col=c("purple","blue","green","aquamarine","cadetblue","pink"),
     border = "grey")

  1. Elaborar una tabla de frecuencias, un diagrama de barras y de dona para la variable corte.
tabla_frec_c <-ds_freq_table(diamantes,corte)
tabla_frec_c
##                              Variable: corte                              
## -------------------------------------------------------------------------
##  Levels      Frequency    Cum Frequency       Percent        Cum Percent  
## -------------------------------------------------------------------------
##  Regular       1610           1610             2.98             2.98     
## -------------------------------------------------------------------------
##   Bueno        4906           6516              9.1             12.08    
## -------------------------------------------------------------------------
## Muy bueno      12082          18598            22.4             34.48    
## -------------------------------------------------------------------------
##  Premium       13791          32389            25.57            60.05    
## -------------------------------------------------------------------------
##   Ideal        21551          53940            39.95             100     
## -------------------------------------------------------------------------
##   Total        53940            -             100.00              -      
## -------------------------------------------------------------------------
tabla_z <- table(diamantes$corte)
tabla_z
## 
##   Regular     Bueno Muy bueno   Premium     Ideal 
##      1610      4906     12082     13791     21551
barplot(tabla_z,main = "Diagrama de barra para corte",
        xlab = "zona", ylab ="Frecuencia",
        col = c("blue","green","purple","gold"))

torta1 <- pie(tabla_z,
             labels = c("Regular","Bueno","Muy bueno","Premium","Ideal"),
              radius = 0.8,
              clockwise = FALSE,
              main = "Distribución de cortes de diamantes",
              col = c("aquamarine","cadetblue","pink","purple","grey"))