knitr::opts_chunk$set(echo = TRUE)
#### Genere una muestra de 120 registros.

View(diamantes)

datos.d <- diamantes
set.seed(4495)

muestra_diamantes <- sample_n(datos.d,size= 120 ,replace = FALSE)

####1. Encontrar las medidas de tendencia central para la variable quilate.

media_a <- mean(muestra_diamantes$quilate)

mediana <- median(muestra_diamantes$quilate)

moda <- mlv1(muestra_diamantes$quilate)

 df_quilate <- data.frame(media_a, mediana, moda)
 
 df_quilate
##     media_a mediana      moda
## 1 0.7870833   0.565 0.4056667
####2. Las medidas de variabilidad para la variable profundidad.

"Rango"
## [1] "Rango"
rango_diam <- max(muestra_diamantes$profundidad) -min(muestra_diamantes$profundidad)
cat("El Rango de la profundidad de los diamantes es:",rango_diam)
## El Rango de la profundidad de los diamantes es: 6.6
"Varianza de profundidad"
## [1] "Varianza de profundidad"
var_diam <- var(muestra_diamantes$profundidad)
cat("la varianza de la produndidad de los diamantes es:", var_diam)
## la varianza de la produndidad de los diamantes es: 1.589342
"La desviacion estándar"
## [1] "La desviacion estándar"
ds_diam <- sqrt(var(muestra_diamantes$profundidad))
cat("la desv estandar de la profundidad de los diamantes es:", ds_diam)
## la desv estandar de la profundidad de los diamantes es: 1.260691
"Coeficiente de variación"
## [1] "Coeficiente de variación"
CV <- (sd(muestra_diamantes$profundidad)/ mean(muestra_diamantes$profundidad))*100
cat("El coeficiente de variación de la profundidad de los diamantes es:",CV)
## El coeficiente de variación de la profundidad de los diamantes es: 2.04188
resumen_profundidad.muestra_diamantes <- ds_tidy_stats(muestra_diamantes, profundidad)
kable(resumen_profundidad.muestra_diamantes)
vars min max mean t_mean median mode range variance stdev skew kurtosis coeff_var q1 q3 iqrange
profundidad 57.6 64.2 61.74167 61.77778 61.8 61.4 6.6 1.589342 1.260691 -0.4875068 0.3737419 2.04188 61 62.6 1.6
####3. El Q1, Q3 y los percentiles 30, 78 y 90 para la variable tabla.

 percentiles <- quantile(muestra_diamantes$tabla, probs = c(0.25, 0.75, 0.78, 0.90 ), type = 6)
 percentiles
## 25% 75% 78% 90% 
##  56  59  59  60
####4. Elabore las medidas de forma para la variable x y un histograma.

asim_diam <- ds_skewness(muestra_diamantes$x)
 curt_diam <- ds_kurtosis(muestra_diamantes$x)

cat("el coeficiente de asimetría de la variable x de los diamantes es:",asim_diam)
## el coeficiente de asimetría de la variable x de los diamantes es: 0.5580979
cat("el coeficiente de Curtosis de la variable x de los diamantes es:",curt_diam)
## el coeficiente de Curtosis de la variable x de los diamantes es: -0.6022881
resumen_x.muestra_diamantes <- ds_tidy_stats(muestra_diamantes, x)
kable(resumen_x.muestra_diamantes)
vars min max mean t_mean median mode range variance stdev skew kurtosis coeff_var q1 q3 iqrange
x 3.93 8.55 5.68975 5.629444 5.345 4.27 4.62 1.398028 1.182382 0.5580979 -0.6022881 20.78092 4.655 6.645 1.99
hist(muestra_diamantes$x, main = "Comportamiento de la variable X", col = "#68228B" , xlab = "Crecimiento", ylab = "Frecuencia", breaks = 10)

####5. Elaborar una tabla de frecuencias y un histograma para la variable y.

tabla_frec <- fdt(muestra_diamantes$"y",k = 5)
tabla_frec
##   Class limits  f   rf rf(%)  cf  cf(%)
##   [3.93,4.877) 39 0.32 32.50  39  32.50
##  [4.877,5.825) 30 0.25 25.00  69  57.50
##  [5.825,6.772) 28 0.23 23.33  97  80.83
##  [6.772,7.719) 15 0.12 12.50 112  93.33
##  [7.719,8.666)  8 0.07  6.67 120 100.00
hist(muestra_diamantes$y, main = "Comportamiento de la variable y", col = "#B23AEE" , xlab = "Crecimiento", ylab = "Frecuencia", breaks = 10)

resumen_y.muestra_diamantes <- ds_tidy_stats(muestra_diamantes, y)
kable(resumen_y.muestra_diamantes)
vars min max mean t_mean median mode range variance stdev skew kurtosis coeff_var q1 q3 iqrange
y 3.97 8.58 5.692917 5.633056 5.405 4.31 4.61 1.372273 1.17144 0.5647263 -0.5677204 20.57716 4.6725 6.59 1.9175
#### 6. Elaborar una tabla de frecuencias, un diagrama de barras y de dona para la variable corte.

tabla_frec_corte <- table(muestra_diamantes$corte)
tabla_frec_corte
## 
##   Regular     Bueno Muy bueno   Premium     Ideal 
##         0        10        36        32        42
barplot(tabla_frec_corte,
        col = c("#FFF68F","palegreen1","#FF83FA",
            "pink1", "cadetblue1"),
        horiz = FALSE,
        border = TRUE,
        ylim = c(0, 50),
        xlab = "Frecuencia",
        main = "Frecuencia de la variable Corte")

colores <- c("#FFF68F","palegreen1","#FF83FA","pink1","cadetblue1")

pie(tabla_frec_corte,
    labels = names(tabla_frec_corte),
    col = colores,
    main = "Gráfico de Dona de la variable Corte",
    border = "white", cex = 1)

par(new = TRUE)   
symbols(0, 0, circles = 0.6, inches = FALSE, add = TRUE, bg = "white", fg = "white")