TOMA DE DATOS DE LA BASE DIAMANTES

Se tomó una muestra de 120 registros de la base de datos “diamantes” de la base de datos datos con los últimos dígitos de los integrantes de cada grupo

library(datos)
library(descriptr)
library(dplyr)
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(fdth)
## 
## Adjuntando el paquete: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library (modeest)
## 
## Adjuntando el paquete: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
library (knitr)

Ahora se va a tomar una muestra de 120 datos usando como semilla 8126

set.seed(8126)

datos.d <- sample_n(diamantes,size=120, replace = FALSE)
Primer punto

Ahora se van a sacar las medidas de tendencia central para la variable quilate

media_a <- mean (datos.d$quilate)
mediana <- median(datos.d$quilate)
moda <- mlv1(datos.d$quilate)
## Warning: argument 'method' is missing. Data are supposed to be continuous. 
##             Default method 'shorth' is used
df <- data.frame (media_a, mediana, moda)
kable(df)
media_a mediana moda
0.8398333 0.695 0.4601667
Segundo punto

Ahora se van a sacar las medidas de variabilidad para la variable profundidad, emepzando por el rango:

rango_diam <- max(datos.d$profundidad)-min(datos.d$profundidad)
cat("El rango de la profundidad de los diamantes:", rango_diam)
## El rango de la profundidad de los diamantes: 8.1

*Varianza de la profunidad de los diamantes:

var_diam <- var(datos.d$profundidad)
cat("La varianza de la profunndidad de los diamantes es:",var_diam)
## La varianza de la profunndidad de los diamantes es: 1.865165

*Desviación estandar de la profundidad de los diamantes

ds_diam <- sqrt(var(datos.d$profundidad))
cat("La desvicación estandar de la prfundidad de los diamantes es:",ds_diam)
## La desvicación estandar de la prfundidad de los diamantes es: 1.365711
  • Coeficiente de variación
CV <- (sd(datos.d$profundidad)/mean(datos.d$profundidad))*100
cat("El coeficiente de variación de la profundidad de los diamantes es:",CV)
## El coeficiente de variación de la profundidad de los diamantes es: 2.210126
df <- data.frame (rango_diam, var_diam, ds_diam, CV)
kable(df)
rango_diam var_diam ds_diam CV
8.1 1.865165 1.365711 2.210126
Tercer punto

Ahora se van a sacar el Q1, Q3 y los percentiles 30, 78 y 90 para la variable tabla.

percentiles <- quantile(datos.d$tabla, probs = c(0.25, 0.3, 0.75, 0.78, 0.9), type = 6)
percentiles
## 25% 30% 75% 78% 90% 
##  56  56  59  59  61
df <- data.frame (percentiles)
kable(df)
percentiles
25% 56
30% 56
75% 59
78% 59
90% 61
Cuarto punto

Ahora se van a sacar las medidas de forma para la variable x.

asimetria <- ds_skewness(datos.d$x)
curtosis <- ds_kurtosis(datos.d$x)

cat ("El coeficiente de asimetría de la variable x de los diamantes es:", asimetria)
## El coeficiente de asimetría de la variable x de los diamantes es: 0.624504
cat("La curtosis de la variable x de los diamantes es:", curtosis)
## La curtosis de la variable x de los diamantes es: -0.1370948
df <- data.frame (asimetria, curtosis)
kable(df)
asimetria curtosis
0.624504 -0.1370948

####quinto punto

Mostrar la tabla en formato bonito

tabla_frec_y <- fdt(datos.d$y, breaks = "Sturges")
kable(tabla_frec_y)
Class limits f rf rf(%) cf cf(%)
[3.901,4.652) 30 0.2500000 25.0000000 30 25.00000
[4.652,5.402) 26 0.2166667 21.6666667 56 46.66667
[5.402,6.153) 16 0.1333333 13.3333333 72 60.00000
[6.153,6.904) 27 0.2250000 22.5000000 99 82.50000
[6.904,7.655) 13 0.1083333 10.8333333 112 93.33333
[7.655,8.406) 5 0.0416667 4.1666667 117 97.50000
[8.406,9.157) 2 0.0166667 1.6666667 119 99.16667
[9.157,9.908) 1 0.0083333 0.8333333 120 100.00000
x
start 3.9006000
end 9.9081000
h 0.7509375
right 0.0000000

Histograma para la variable y

hist(datos.d$y,
     main = "Histograma de la variable Y",
     xlab = "Valor de Y",
     ylab = "Frecuencia",
     col = "skyblue",
     border = "black")

Sexto punto

Elaborar una tabla de frecuencias, un diagrama de barras y de dona para la variable corte.

Tabla de frecuencia

tabla.frec.diam.corte <-table(datos.d$corte)

tabla.frec.diam.corte
## 
##   Regular     Bueno Muy bueno   Premium     Ideal 
##         3        13        20        36        48

##Diagrama de barras install.packages(“ggplot2”)

library(ggplot2)

df.diam.corte<-as.data.frame(tabla.frec.diam.corte)
is.data.frame(df.diam.corte)
## [1] TRUE
df.diam.corte
##        Var1 Freq
## 1   Regular    3
## 2     Bueno   13
## 3 Muy bueno   20
## 4   Premium   36
## 5     Ideal   48
df.diam.corte<-rename(df.diam.corte, Corte=Var1, Frecuencia=Freq)
View(df.diam.corte)

diag_barra <- ggplot(df.diam.corte, aes(x = Corte, y= Frecuencia)) +
  geom_col(col=rainbow(n=5))+
  geom_text(aes(label = Corte), vjust = 1, colour = "yellow")
diag_barra

##Diagrama de torta

library(dplyr)
attach(df.diam.corte)

library(plotrix)


pct <- round(Frecuencia/sum(Frecuencia)*100)
porcentaje <-paste(pct, "%")


pie3D(Frecuencia,labels=porcentaje,radius = 1,col =rainbow(length(Frecuencia)),
                explode=0.1, height=0.1,labelcex = 1.0,theta=pi/4,
                main="Diagrama de torta corte diamantes")
legend("topright",legend = Corte, fill = rainbow(length(Frecuencia)),title = "Cortes",cex = 0.5)

labels= c("Regular","Bueno", "Muy bueno", "Premium", "Ideal")