library(datos)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(modeest)
library(descriptr)
library(plotrix)

set.seed(6716)

base_tarea <- diamantes

datos_tarea <- sample_n(base_tarea,size = 120,replace = FALSE)

MEDIDAS DE TENDENCIA CENTRAL PARA LA VARIABLE “QUILATES”

Promedio aritmético

media_t <- mean(datos_tarea$quilate)
cat ("El promedio aritmético de los quilates de los diamantes es:",media_t)
## El promedio aritmético de los quilates de los diamantes es: 0.8585

Mediana

mediana_t <- median(datos_tarea$quilate)
cat ("La mediana de los quilates de los diamantes es:",mediana_t)
## La mediana de los quilates de los diamantes es: 0.725

Moda

moda_t <- mlv1(datos_tarea$quilate, method = "mfv")
cat ("La moda de los quilates de los diamantes es:",moda_t)
## La moda de los quilates de los diamantes es: 0.31

MEDIDAS DE VARIABILIDAD PARA LA VARIABLE “PROFUNDIDAD”

Rango

rango_prof <- max(datos_tarea$profundidad) - min(diamantes$profundidad)
cat ("El rango de la profundidad de los diamantes es:",rango_prof)
## El rango de la profundidad de los diamantes es: 24.4

Varianza

var_prof <- var(datos_tarea$profundidad)
cat ("La varianza de la profundidad de los diamantes es:",var_prof)
## La varianza de la profundidad de los diamantes es: 2.378817

Desviación Estándar

des_prof <- sd(datos_tarea$profundidad)
cat ("La varianza de la profundidad de los diamantes es:",des_prof)
## La varianza de la profundidad de los diamantes es: 1.542341

Coeficiente de Variación

coefic_prof <- (sd(datos_tarea$profundidad) / mean(datos_tarea$profundidad)) * 100
cat ("El coeficiente de variación de la profundidad de los diamantes es:", coefic_prof) 
## El coeficiente de variación de la profundidad de los diamantes es: 2.506751

Q1, Q3 y los percentiles 30, 78 y 90 para la variable “tabla”

per_prof <- quantile(datos_tarea$tabla, probs = c(0.25,0.3,0.75, 0.78,0.9), type = 6)
per_prof
## 25% 30% 75% 78% 90% 
##  56  56  59  59  61

MEDIDAS DE FORMA PARA LA VARIABLE “X”

Asimetría

asim_x <- ds_skewness(datos_tarea$x, x = NULL)
cat ("El coeficiente de asimetría de X en  diamantes es:",asim_x)
## El coeficiente de asimetría de X en  diamantes es: 0.3539339

Curtosis

curt_x <- ds_kurtosis(datos_tarea$x, x = NULL)
cat ("El coeficiente de Curtosis de X en diamantes es:",curt_x)
## El coeficiente de Curtosis de X en diamantes es: -0.8572559

TABLA DE FRECUENCIA PARA VARIABLE “Y”

tabla_frec_y <- table(datos_tarea$y)
tabla_frec_y
## 
##    4 4.16 4.17 4.24 4.26 4.29 4.31 4.36 4.37  4.4 4.43 4.45  4.5 4.51 4.55 4.58 
##    1    1    1    1    1    1    4    1    1    1    2    1    2    2    1    1 
## 4.59 4.61 4.67 4.68 4.74 4.79  4.8 4.85 4.86 4.96 5.09 5.11 5.15 5.16 5.17 5.23 
##    1    1    2    1    1    1    2    2    1    1    1    2    1    1    1    2 
## 5.27 5.31 5.32  5.4 5.41 5.53 5.54  5.6 5.66 5.71 5.72 5.73 5.76 5.77 5.81 5.88 
##    2    1    1    1    1    1    1    2    1    2    1    1    1    1    2    1 
## 5.89  5.9 5.97 5.98 6.02 6.03 6.05 6.09 6.13 6.16  6.2 6.25 6.26 6.45 6.47 6.48 
##    2    1    1    1    1    1    1    1    1    1    1    1    2    1    2    2 
## 6.49 6.52 6.53 6.55 6.58  6.6 6.62 6.74 6.79  6.8 6.98 7.03 7.04 7.18 7.25 7.27 
##    1    1    1    1    1    1    2    1    1    1    1    1    2    1    1    1 
## 7.34 7.36 7.43 7.45 7.46 7.48  7.5 7.51 7.52 7.53 7.98 7.99 8.01 8.08 8.12 8.16 
##    1    1    1    1    1    1    1    1    1    1    1    1    1    1    2    1 
## 8.33 8.42 
##    1    1

HISTOGRAMA PARA VARIABLE “Y”

hist(datos_tarea$y, col = "#FFF0F5",  main = paste("Histograma de Y"), xlab = ("Variable Y"), ylab = ("Frecuencia"))

?hist
## starting httpd help server ... done
View(datos_tarea)

TABLA DE FRECUENCIA PARA VARIABLE “CORTE”

tabla_corte <- table(datos_tarea$corte)
tabla_corte
## 
##   Regular     Bueno Muy bueno   Premium     Ideal 
##         4        10        24        32        50

DIAGRAMA DE BARRAS PARA VARIABLE “CORTE”

barplot(tabla_corte, width = 1.3, ylim=c(0,100),col = 'cadetblue',
        border = '#B03060',ylab="Frecuencia absoluta",main = "Diagrama de barras para corte",
        xlab = "Categoría", density = 25)

DIAGRAMA DE TORTA PARA VARIABLE “CORTE”

frec <- table(datos_tarea$corte)

df <- as.data.frame(frec)
df <- rename(df, Corte = Var1, Frecuencia = Freq)
View(df)
pct <- round(df$Frecuencia/sum(df$Frecuencia)*100,2);pct
## [1]  3.33  8.33 20.00 26.67 41.67
etiquetas <- paste(df$Corte,pct) 
View(etiquetas)
?paste

etiquetas <- paste(etiquetas,"%") # Adicionando el símbolo de %
torta2 <- pie(pct,labels = etiquetas, radius = 0.8,
              col=c("mistyrose","antiquewhite1","#F0FFFF","#FFBBFF"),
              main="Diagrama de torta")