Se tomó una muestra de 120 registros de la base de datos “diamantes” de la base de datos datos con los últimos dígitos de los integrantes de cada grupo
library(datos)
library(descriptr)
library(dplyr)
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(fdth)
##
## Adjuntando el paquete: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library (modeest)
##
## Adjuntando el paquete: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
library (knitr)
Ahora se va a tomar una muestra de 120 datos usando como semilla 8126
set.seed(8126)
datos.d <- sample_n(diamantes,size=120, replace = FALSE)
Ahora se van a sacar las medidas de tendencia central para la variable quilate
media_a <- mean (datos.d$quilate)
mediana <- median(datos.d$quilate)
moda <- mlv1(datos.d$quilate)
## Warning: argument 'method' is missing. Data are supposed to be continuous.
## Default method 'shorth' is used
df <- data.frame (media_a, mediana, moda)
kable(df)
media_a | mediana | moda |
---|---|---|
0.8398333 | 0.695 | 0.4601667 |
Ahora se van a sacar las medidas de variabilidad para la variable profundidad, emepzando por el rango:
rango_diam <- max(datos.d$profundidad)-min(datos.d$profundidad)
cat("El rango de la profundidad de los diamantes:", rango_diam)
## El rango de la profundidad de los diamantes: 8.1
*Varianza de la profunidad de los diamantes:
var_diam <- var(datos.d$profundidad)
cat("La varianza de la profunndidad de los diamantes es:",var_diam)
## La varianza de la profunndidad de los diamantes es: 1.865165
*Desviación estandar de la profundidad de los diamantes
ds_diam <- sqrt(var(datos.d$profundidad))
cat("La desvicación estandar de la prfundidad de los diamantes es:",ds_diam)
## La desvicación estandar de la prfundidad de los diamantes es: 1.365711
CV <- (sd(datos.d$profundidad)/mean(datos.d$profundidad))*100
cat("El coeficiente de variación de la profundidad de los diamantes es:",CV)
## El coeficiente de variación de la profundidad de los diamantes es: 2.210126
df <- data.frame (rango_diam, var_diam, ds_diam, CV)
kable(df)
rango_diam | var_diam | ds_diam | CV |
---|---|---|---|
8.1 | 1.865165 | 1.365711 | 2.210126 |
Ahora se van a sacar el Q1, Q3 y los percentiles 30, 78 y 90 para la variable tabla.
percentiles <- quantile(datos.d$tabla, probs = c(0.25, 0.3, 0.75, 0.78, 0.9), type = 6)
percentiles
## 25% 30% 75% 78% 90%
## 56 56 59 59 61
df <- data.frame (percentiles)
kable(df)
percentiles | |
---|---|
25% | 56 |
30% | 56 |
75% | 59 |
78% | 59 |
90% | 61 |
Ahora se van a sacar las medidas de forma para la variable x.
asimetria <- ds_skewness(datos.d$x)
curtosis <- ds_kurtosis(datos.d$x)
cat ("El coeficiente de asimetría de la variable x de los diamantes es:", asimetria)
## El coeficiente de asimetría de la variable x de los diamantes es: 0.624504
cat("La curtosis de la variable x de los diamantes es:", curtosis)
## La curtosis de la variable x de los diamantes es: -0.1370948
df <- data.frame (asimetria, curtosis)
kable(df)
asimetria | curtosis |
---|---|
0.624504 | -0.1370948 |
####quinto punto
tabla_frec_y <- fdt(datos.d$y, breaks = "Sturges")
kable(tabla_frec_y)
|
|
hist(datos.d$y,
main = "Histograma de la variable Y",
xlab = "Valor de Y",
ylab = "Frecuencia",
col = "skyblue",
border = "black")
Elaborar una tabla de frecuencias, un diagrama de barras y de dona para la variable corte.
tabla.frec.diam.corte <-table(datos.d$corte)
tabla.frec.diam.corte
##
## Regular Bueno Muy bueno Premium Ideal
## 3 13 20 36 48
##Diagrama de barras install.packages(“ggplot2”)
library(ggplot2)
df.diam.corte<-as.data.frame(tabla.frec.diam.corte)
is.data.frame(df.diam.corte)
## [1] TRUE
df.diam.corte
## Var1 Freq
## 1 Regular 3
## 2 Bueno 13
## 3 Muy bueno 20
## 4 Premium 36
## 5 Ideal 48
df.diam.corte<-rename(df.diam.corte, Corte=Var1, Frecuencia=Freq)
View(df.diam.corte)
diag_barra <- ggplot(df.diam.corte, aes(x = Corte, y= Frecuencia)) +
geom_col(col=rainbow(n=5))+
geom_text(aes(label = Corte), vjust = 1, colour = "yellow")
diag_barra
##Diagrama de torta
library(dplyr)
attach(df.diam.corte)
library(plotrix)
pct <- round(Frecuencia/sum(Frecuencia)*100)
porcentaje <-paste(pct, "%")
pie3D(Frecuencia,labels=porcentaje,radius = 1,col =rainbow(length(Frecuencia)),
explode=0.1, height=0.1,labelcex = 1.0,theta=pi/4,
main="Diagrama de torta corte diamantes")
legend("topright",legend = Corte, fill = rainbow(length(Frecuencia)),title = "Cortes",cex = 0.5)
labels= c("Regular","Bueno", "Muy bueno", "Premium", "Ideal")