ANALISIS ESTADISTICO PARA VARIABLES CUANTITATIVAS
En el presente anĂ¡lisis se contarĂ¡ con las siguientes variables de la base de datos denominada diamantes:
PRECIO: Precio de los diamantes en dĂ³lares americanos.
QUILATE: Peso del diamante
PROFUNDIDAD: Porcentaje de la profundidad total.
TABLA: Ancho de la parte superior del diamante.
X: Largo en milĂmetros.
Y: Ancho en milĂmetros.
Z: Profundidad en milĂmetros.
El presente documento presenta un anĂ¡lisis estadĂstico de una muestra de mil datos extraĂdos de mĂ¡s de 50,000 registros de diamantes con informaciĂ³n detallada sobre su precio, color, quilate, corte, claridad, profundidad, tabla, x, y, y z. Estas diez variables fueron clasificadas como cuantitativas y cualitativas, y se les aplicaron diversas medidas estadĂsticas para obtener una comprensiĂ³n mĂ¡s profunda de los datos.
Entre las medidas aplicadas se encuentran las medidas de tendencia central, como la media, la mediana y la moda, las cuales proporcionan informaciĂ³n valiosa sobre el comportamiento general de los datos y nos permiten identificar los valores mĂ¡s representativos en cada una de las variables.
AdemĂ¡s, se emplearon medidas de variabilidad, tales como la desviaciĂ³n estĂ¡ndar y el rango intercuartil, para conocer la dispersiĂ³n de los datos en torno a las medidas de tendencia central. Estas medidas nos permiten comprender la variabilidad de los datos y detectar posibles valores atĂpicos o anomalĂas en la muestra.
Asimismo, se aplicaron medidas de dispersiĂ³n, como la correlaciĂ³n y la covarianza, para examinar la relaciĂ³n entre las diferentes variables en la muestra. Estas medidas nos permiten comprender si existe una relaciĂ³n entre dos o mĂ¡s variables, y si esta relaciĂ³n es positiva o negativa.
En resumen, este anĂ¡lisis estadĂstico nos permite obtener una comprensiĂ³n mĂ¡s profunda de la muestra de datos de diamantes y proporciona informaciĂ³n valiosa para la toma de decisiones.
Las tablas de frecuencia nos ayudan a organizar los conjuntos de datos.Existen diferentes tipos de frecuencia entre ellas se encuentran la frecuencia absoluta, frecuencia absoluta acumulada, frecuencia relativa y frecuencia relativa acumulada. Por otra parte, las tablas de frecuencia junto con los histogramas y la densidad nos dan una idea de como se encuentran distribuidos los datos. Para ello a continuaciĂ³n se presentan diferentes graficos como la densidad y poligono de frecuencia de cada una de las variables, posteriormente se mostraran las simetrias.
<- fdt(precio,breaks = "Sturges"); tablaFrecuenciaPrecio tablaFrecuenciaPrecio
## Class limits f rf rf(%) cf cf(%)
## [379.17,2062.2509) 470 0.47 47.0 470 47.0
## [2062.2509,3745.3318) 156 0.16 15.6 626 62.6
## [3745.3318,5428.4127) 124 0.12 12.4 750 75.0
## [5428.4127,7111.4936) 69 0.07 6.9 819 81.9
## [7111.4936,8794.5745) 49 0.05 4.9 868 86.8
## [8794.5745,10477.655) 42 0.04 4.2 910 91.0
## [10477.655,12160.736) 24 0.02 2.4 934 93.4
## [12160.736,13843.817) 25 0.03 2.5 959 95.9
## [13843.817,15526.898) 11 0.01 1.1 970 97.0
## [15526.898,17209.979) 13 0.01 1.3 983 98.3
## [17209.979,18893.06) 17 0.02 1.7 1000 100.0
plot(tablaFrecuenciaPrecio,main="Histograma Precio",xlab="precio",
ylab="Frecuencia absoluta",col="#CD3333")
La linea azul representa la media para la variable precio
<- data.frame(valores=precio)
tablaPrecio
<- ggplot(tablaPrecio, aes(x=valores))+
histogramaPrecio geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#FF6666")+ggtitle("Densidad y Poligono de frecuencia")
histogramaPrecio
<- histogramaPrecio + geom_vline(aes(xintercept=mean(valores)),
histMediaPrecio color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaPrecio, color="#8B7B8B")
histMediaPrecio
<- fdt(quilate,breaks = "Sturges"); tablaFrecuenciaQuilate tablaFrecuenciaQuilate
## Class limits f rf rf(%) cf cf(%)
## [0.2277,0.4567) 324 0.32 32.4 324 32.4
## [0.4567,0.6858) 151 0.15 15.1 475 47.5
## [0.6858,0.9148) 166 0.17 16.6 641 64.1
## [0.9148,1.144) 160 0.16 16.0 801 80.1
## [1.144,1.373) 73 0.07 7.3 874 87.4
## [1.373,1.602) 59 0.06 5.9 933 93.3
## [1.602,1.831) 20 0.02 2.0 953 95.3
## [1.831,2.06) 22 0.02 2.2 975 97.5
## [2.06,2.289) 17 0.02 1.7 992 99.2
## [2.289,2.518) 7 0.01 0.7 999 99.9
## [2.518,2.747) 1 0.00 0.1 1000 100.0
plot(tablaFrecuenciaQuilate,main="Histograma Quilate",xlab="Quilate",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(values=quilate)
tablaQuilate
<- ggplot(tablaQuilate, aes(x=values))+
histogramaQuilate geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y poligono de frecuencia")
histogramaQuilate
<- histogramaQuilate + geom_vline(aes(xintercept=mean(values)),
histMediaQuilate color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaQuilate, color="#8B7B8B")
histMediaQuilate
<- fdt(profundidad,breaks = "Sturges"); tablaFrecuenciaProfundidad tablaFrecuenciaProfundidad
## Class limits f rf rf(%) cf cf(%)
## [53.658,55.07) 1 0.00 0.1 1 0.1
## [55.07,56.481) 0 0.00 0.0 1 0.1
## [56.481,57.893) 6 0.01 0.6 7 0.7
## [57.893,59.304) 39 0.04 3.9 46 4.6
## [59.304,60.716) 141 0.14 14.1 187 18.7
## [60.716,62.127) 408 0.41 40.8 595 59.5
## [62.127,63.539) 326 0.33 32.6 921 92.1
## [63.539,64.95) 59 0.06 5.9 980 98.0
## [64.95,66.362) 14 0.01 1.4 994 99.4
## [66.362,67.773) 4 0.00 0.4 998 99.8
## [67.773,69.185) 2 0.00 0.2 1000 100.0
plot(tablaFrecuenciaProfundidad,main="Histograma profundidad",xlab="profundidad",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(value=profundidad)
tablaProfundidad
<- ggplot(tablaProfundidad, aes(x=value))+
histogramaProfundidad geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y poligono Profundidad")
histogramaProfundidad
<- histogramaProfundidad + geom_vline(aes(xintercept=mean(value)),
histMediaProfundidad color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaProfundidad, color="#8B7B8B")
histMediaProfundidad
<- fdt(muestra1$tabla,breaks = "Sturges"); tablaFrecuenciaTabla tablaFrecuenciaTabla
## Class limits f rf rf(%) cf cf(%)
## [51.48,53.503) 18 0.02 1.8 18 1.8
## [53.503,55.525) 172 0.17 17.2 190 19.0
## [55.525,57.548) 353 0.35 35.3 543 54.3
## [57.548,59.571) 288 0.29 28.8 831 83.1
## [59.571,61.594) 124 0.12 12.4 955 95.5
## [61.594,63.616) 36 0.04 3.6 991 99.1
## [63.616,65.639) 6 0.01 0.6 997 99.7
## [65.639,67.662) 2 0.00 0.2 999 99.9
## [67.662,69.685) 0 0.00 0.0 999 99.9
## [69.685,71.707) 0 0.00 0.0 999 99.9
## [71.707,73.73) 1 0.00 0.1 1000 100.0
plot(tablaFrecuenciaTabla,main="Histograma Tabla",xlab="Tabla",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(value=muestra1$tabla)
tablaTable
<- ggplot(tablaTable, aes(x=value))+
histogramaTabla geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y poligono Tabla")
histogramaTabla
<- histogramaTabla + geom_vline(aes(xintercept=mean(value)),
histMediaTabla color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaTable, color="#8B7B8B")
histMediaTabla
<- fdt(muestra1$x,breaks = "Sturges"); tablaFrecuenciaX tablaFrecuenciaX
## Class limits f rf rf(%) cf cf(%)
## [0,0.8043) 1 0.00 0.1 1 0.1
## [0.8043,1.609) 0 0.00 0.0 1 0.1
## [1.609,2.413) 0 0.00 0.0 1 0.1
## [2.413,3.217) 0 0.00 0.0 1 0.1
## [3.217,4.022) 4 0.00 0.4 5 0.5
## [4.022,4.826) 298 0.30 29.8 303 30.3
## [4.826,5.63) 184 0.18 18.4 487 48.7
## [5.63,6.435) 228 0.23 22.8 715 71.5
## [6.435,7.239) 168 0.17 16.8 883 88.3
## [7.239,8.043) 77 0.08 7.7 960 96.0
## [8.043,8.848) 40 0.04 4.0 1000 100.0
plot(tablaFrecuenciaX,main="Histograma X",xlab="X",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(value=muestra1$x)
tablaX
<- ggplot(tablaX, aes(x=value))+
histogramaX geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y Poligono X")
histogramaX
<- histogramaX + geom_vline(aes(xintercept=mean(value)),
histMediaX color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaX, color="#8B7B8B")
histMediaX
<- fdt(muestra1$y,breaks = "Sturges"); tablaFrecuenciaY tablaFrecuenciaY
## Class limits f rf rf(%) cf cf(%)
## [3.96,6.5198) 743 0.74 74.3 743 74.3
## [6.5198,9.0796) 256 0.26 25.6 999 99.9
## [9.0796,11.639) 0 0.00 0.0 999 99.9
## [11.639,14.199) 0 0.00 0.0 999 99.9
## [14.199,16.759) 0 0.00 0.0 999 99.9
## [16.759,19.319) 0 0.00 0.0 999 99.9
## [19.319,21.879) 0 0.00 0.0 999 99.9
## [21.879,24.439) 0 0.00 0.0 999 99.9
## [24.439,26.998) 0 0.00 0.0 999 99.9
## [26.998,29.558) 0 0.00 0.0 999 99.9
## [29.558,32.118) 1 0.00 0.1 1000 100.0
plot(tablaFrecuenciaY,main="Histograma Y",xlab="Y",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(value=muestra1$y)
tablaY
<- ggplot(tablaY, aes(x=value))+
histogramaY geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y Poligono Y")
histogramaY
<- histogramaY + geom_vline(aes(xintercept=mean(value)),
histMediaY color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaY, color="#27408B")
histMediaY
<- fdt(muestra1$z,breaks = "Sturges"); tablaFrecuenciaZ tablaFrecuenciaZ
## Class limits f rf rf(%) cf cf(%)
## [0,0.5289) 1 0.00 0.1 1 0.1
## [0.5289,1.058) 0 0.00 0.0 1 0.1
## [1.058,1.587) 0 0.00 0.0 1 0.1
## [1.587,2.115) 0 0.00 0.0 1 0.1
## [2.115,2.644) 37 0.04 3.7 38 3.8
## [2.644,3.173) 330 0.33 33.0 368 36.8
## [3.173,3.702) 220 0.22 22.0 588 58.8
## [3.702,4.231) 245 0.24 24.5 833 83.3
## [4.231,4.76) 115 0.12 11.5 948 94.8
## [4.76,5.289) 47 0.05 4.7 995 99.5
## [5.289,5.818) 5 0.00 0.5 1000 100.0
plot(tablaFrecuenciaZ,main="Histograma Z",xlab="Z",
ylab="Frecuencia absoluta",col="#EED8AE")
<- data.frame(value=muestra1$z)
tablaZ
<- ggplot(tablaZ, aes(x=value))+
histogramaZ geom_histogram(aes(y=..density..), colour="#EE9572",fill="white")+
geom_density(alpha=.2, fill="#00868B")+ggtitle("Densidad y Poligono Z")
histogramaZ
<- histogramaZ + geom_vline(aes(xintercept=mean(value)),
histMediaZ color="aquamarine3",linetype="dashed",linewidth=1)+
geom_freqpoly(bin=tablaZ, color="#EE6363")
histMediaZ
Las medidas de tendencia central son medidas que resumen en un solo valor un conjunto de valores o datos. Entre las medidas de tendencia central encontramos el promedio o media aritmetica, mediana y moda
PROMEDIO: El promedio nos permiten observar el comportamiento de un conjunto de datos
MEDIANA: Es el valor que ocupa el centro de nuestro conjunto de datos de una variables
MODA: Es el valor que mĂ¡s se repite en el conjunto de datos de una variable
<- mean(precio)
promedioPrecio <- data.frame(promedioPrecio,medianaPrecio,modaPrecio);variabilidadPrecio variabilidadPrecio
## promedioPrecio medianaPrecio modaPrecio
## 1 3942.385 2302 945
<- data.frame(promedioQuilate,medianaQuilate
variabilidadQuilate ,modaQuilate);variabilidadQuilate
## promedioQuilate medianaQuilate modaQuilate
## 1 0.80162 0.7 0.3
<- data.frame(promedioProfundidad,medianaProfundidad
variabilidadProfundidad ,modaProfundidad);variabilidadProfundidad
## promedioProfundidad medianaProfundidad modaProfundidad
## 1 61.8089 61.9 62.2
<- data.frame(promedioTabla,medianaTabla
variabilidadTabla ,modaTabla);variabilidadTabla
## promedioTabla medianaTabla modaTabla
## 1 57.4563 57 56
<- data.frame(promedioX,medianaX
variabilidadX ,modaX);variabilidadX
## promedioX medianaX modaX
## 1 5.72209 5.67 4.34
<- data.frame(promedioY,medianaY
variabilidadY ,modaY);variabilidadY
## promedioY medianaY modaY
## 1 5.76078 5.7 4.39
<- data.frame(promedioZ,medianaZ
variabilidadZ ,modaZ);variabilidadZ
## promedioZ medianaZ modaZ
## 1 3.53992 3.495 2.69
Las medidas de variabilidad proveen informaciĂ³n sobre la variaciĂ³n de una variable es decir resumen en un valor la dispersiĂ³n de una variable en un conjunto de datos. Entre las medidas de variabilidad encontramos el rango, varianza, desviacion estandar y el coeficiente de variaciĂ³n
En la siguiente grĂ¡fica se presenta la varianza de los variables que conforman a diamantes, la presente grĂ¡fica no tiene en cuenta el precio debido a que su varianza es demasiado grande debidoa ello no se logra apreciar las demĂ¡s varianzas de las otras variables.
## propiedades varianzasDatos
## 1 Quilate 0.2374538
## 2 Profundidad 2.0545053
## 3 Tabla 5.1654057
## 4 X 1.3267479
## 5 Y 1.9633141
## 6 Z 0.5110995
ggplot(dataFrameDatos,aes(x=propiedades,y=varianzasDatos,fill=propiedades))+
geom_bar(stat="identity",width = 0.5)+
geom_text(aes(label=round(varianzasDatos,4)),vjust=-1)+
labs(title = "Varianza de variables")
En la siguiente grĂ¡fica se presenta la desviaciĂ³n estandar de las variables que conforman diamantes
## propiedades Desviacion_Estandar
## 1 Quilate 0.4872923
## 2 Profundidad 1.4333546
## 3 Tabla 2.2727529
## 4 X 1.1518454
## 5 Y 1.4011831
## 6 Z 0.7149122
ggplot(dataFrameDesviacion,aes(x=propiedades,y=Desviacion_Estandar,fill=propiedades))+
geom_bar(stat="identity",width = 0.5)+
scale_fill_manual("Propiedades",values =colores)+
geom_text(aes(label=round(Desviacion_Estandar,4)),vjust=-1)+
labs(title = "DesviaciĂ³n estandar variables")
Se presentan los coeficientes de variaciĂ³n para las diferentes variables de diamantes
<- data.frame(coeficientePrecio,coeficienteQuilate,coeficienteProfundidad,
coeficientesDeVariacion coeficienteTabla,coeficienteX,coeficienteY,coeficienteZ); coeficientesDeVariacion
## coeficientePrecio coeficienteQuilate coeficienteProfundidad coeficienteTabla
## 1 103.4925 60.78845 2.31901 3.95562
## coeficienteX coeficienteY coeficienteZ
## 1 20.1298 24.3228 20.19572
<- data.frame(rangoPrecio,rangoProfundidad,rangoQuilate,rangoTabla,
RangosDiaman rangoX,rangoY,rangoZ); RangosDiaman
## rangoPrecio rangoProfundidad rangoQuilate rangoTabla rangoX rangoY rangoZ
## 1 18323 14.3 2.49 21 8.76 27.8 5.76
Los graficos de dispersiĂ³n nos ayudan a entender las posibles relaciones entre variables. En este caso se mostrara la dispersiĂ³n de los datos a lo largo de la muestra.
ggplot(muestra1,aes(x=sample_Diamond,y=precio,fill=medianaPrecio))+
geom_point(color="steelblue4")+
geom_hline(yintercept = medianaPrecio,color="#8B3626",size=2)+
labs(title=" Dispersion Precio")
De las anteriores graficas podemos inferir que existe como una relacion entre precio y quilate como de igual manera entre X y Z
pairs(~precio + quilate,col=(mako(20,direction = -1)),
main="Dispersion Precio-Quilate")
En la presente grĂ¡fica se presenta las posible relaciones que pueden tener todas las variables
pairs(~precio+profundidad+quilate+muestra1$tabla+muestra1$x+
$y+muestra1$z,main="Dispersion de varias variables",
muestra1col=turbo(30,direction = -1))
Las medidas de posiciĂ³n permiten dividir el conjunto de datos en partes iguales. Para realizar el analisis estadistico solo se tendra en cuanta las medidas de posicion que creemos que son importantes. Entre las medidas de posiciĂ³n se encuentran los:
Cuantiles: Dividen el conjunto de datos en 4 partes iguales
Deciles: Dividen el conjunto de datos en 10 partes iguales
Percentiles: Dividen el conjunto de datos en 100 partes iguales
Para los percentiles se indicaran los percentiles 20, 30, 60 y 75 y para los cuartiles se indicaran los cuartiles 25, 50 y 75
Convenciones percentiles
Percentil 20 linea azul Percentil 30 linea morada Percentil 60 linea marron Percentil 75 linea Verde
Convenciones cuartiles
Cuartil 25 linea morada Cuartil 50 linea Azul Cuartil 75 linea Verde
<- quantile(precio,0.20,type = 6)
perPresio20 <- quantile(precio,0.40,type = 6)
perPresio30 <- quantile(precio,0.60,type = 6)
perPresio60 <- quantile(precio,0.75,type = 6) perPresio75
ggplot(PercentilesPresio,aes(x=precio)) + geom_histogram()+
labs(x="Presio",y="Frecuencia")+
geom_vline(xintercept = c(perPresio20,perPresio30,perPresio60,perPresio75),
colour=c("#FF7256","deeppink4","#8B2500","palegreen4"),
size=1,
linetype = "longdash"
+
)labs(title = "Percentiles para Precio")
<- quantile(precio,0.25,type = 6)
QuantilPrecio25 <- quantile(precio,0.50,type = 6)
QuantilPrecio50 <- quantile(precio,0.75,type = 6)
QuantilPrecio75
ggplot(muestra1,aes(x=precio,fill="#7CCD7C")) + geom_histogram()+
labs(x="Presio",y="Frecuencia")+
geom_vline(xintercept = c(QuantilPrecio25,QuantilPrecio50,QuantilPrecio75),
colour=c("deeppink4","#8B2500","palegreen4"),
size=1,
linetype = "longdash"
+ theme(legend.position = "none")+
)labs(title = "Cuantiles para Precio")
Los box plot o diagramas de caja nos permiten representar grĂ¡ficamente sus datos mediante sus cuartiles. Las partes fundamentales de este diagrama la conforman sus cuartiles de igual sus valores extremos como lo son el minimo y el mĂ¡ximo. De acuerdo a ello se puede visualizar valores atĂpicos es decir valores que estan por encima del mĂ¡ximo y por debajo del minimo. La linea central de cada boxplot representa la mediana. Por otra se presenta la grĂ¡fica de densidad junto con el boxplot para observar el comportamiento de los datos de las diferentes variables
boxplot(precio,id=list(method="y"),col= "lightblue",horizontal = TRUE, main="Diagrama de caja para Precio")
hist(precio, probability = TRUE, ylab = "", col = "grey",
axes = FALSE, main = "RelaciĂ³n densidad y Boxplot Precio")
axis(1)
lines(density(precio), col = "red", lwd = 2)
par(new = TRUE)
boxplot(precio, horizontal = TRUE, axes = FALSE,
lwd = 2, col = rgb(0, 1, 1, alpha = 0.15))
La curtosis determina la cercania de los datos, es decir indica la altura de la curva. A lo largo del presente documento se a presentado las curvas que conforman a las variables. Dentro de ellos se pueden observar que hay curvas con apuntamiento. Las medidas de sesgo representan que tan a leadeadas estan las curvas.
En el siguiente data frame se muestran la curtosis para las variables de la base de datos
<- kurtosis(precio)
curtosisPrecio <- kurtosis((quilate))
curtosisQuilate <- kurtosis(profundidad)
curtosisProfundidad <- kurtosis(muestra1$tabla)
curtosisTabla <- kurtosis(muestra1$x)
curtosisX <- kurtosis(muestra1$y)
curtosisY <- kurtosis(muestra1$z)
curtosisZ
<- data.frame(curtosisPrecio,curtosisProfundidad,curtosisQuilate,
curtosisDatos curtosisTabla,curtosisX,curtosisY,curtosisZ); curtosisDatos
## curtosisPrecio curtosisProfundidad curtosisQuilate curtosisTabla curtosisX
## 1 5.16939 5.521043 3.870395 5.324585 2.782561
## curtosisY curtosisZ
## 1 120.4599 2.838128
ANALISIS ESTADISTICO PARA VARIABLES CUALITATIVAS
La escala de color en diamantes se refiere a la forma en que la luz se refleja en el, y varia entre color D hasta color Z, en este caso se tiene colores desde D hasta J.
=muestra1$color
color=table(color)
color_tablaprint(color_tabla)
## color
## D E F G H I J
## 106 172 188 215 165 89 65
=c("#260800","#2c4000","#ff5e59","#209fd8","#ffd043","#f5ffa1","#d0ff72")
coloresbarplot(color_tabla, xlab = "Color",ylab = "Frecuencia absoluta",main = "Color Diamantes",col =colores)
=length(color)
nc=(color_tabla/nc)*100
porcentajecolorprint(porcentajecolor)
## color
## D E F G H I J
## 10.6 17.2 18.8 21.5 16.5 8.9 6.5
=paste(porcentajecolor,"%",sep = " ")
etiqueta=c("#260800","#2c4000","#ff5e59","#209fd8","#ffd043","#f5ffa1","#d0ff72")
colorespie3D(porcentajecolor,labels = etiqueta,col = colores,main ="Diagrama de sectores color")
legend("topright",c("D","E","F","G","H","I","J"),cex = 0.5,fill = colores)
La claridad de un diamate se refiere a la existencia de alguna imperfeccion en su superficie o en su estructura interna y se clasifican en 6 categorias FL: sin inclusiones o marcas visibles bajo una lupa de 10x
IF: inclusiones y marcas muy difĂciles de ver bajo una lupa de 10x
VVS1/VVS2: inclusiones y marcas muy pequeñas y difĂciles de ver bajo una lupa de 10x
VS1/VS2: inclusiones y marcas pequeñas pero visibles bajo una lupa de 10x
SI1/SI2: inclusiones y marcas visibles a simple vista pero que no afectansignificativamente la belleza del diamante
I1/I2/I3: inclusiones y marcas grandes y visibles a simple vista que pueden afectar significativamente la belleza del diamante
=muestra1$claridad
claridad=table(claridad)
claridad_tablaprint(claridad_tabla)
## claridad
## I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF
## 12 164 260 227 134 83 83 37
=c("#90a4aE","#e0e0e0","#a1887f","#ff7043","#ffa726","#ffee58","#dce775","#aed581")
colores2barplot(claridad_tabla, xlab = "Claridad",ylab = "Frecuencia absoluta",main = "Claridad Diamantes",col = colores2)
=length(claridad)
nclar=(claridad_tabla/nclar)*100
porcentajclaridadprint(porcentajclaridad)
## claridad
## I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF
## 1.2 16.4 26.0 22.7 13.4 8.3 8.3 3.7
=paste(porcentajclaridad,"%",sep = " ")
etiqueta2pie3D(porcentajclaridad,labels = etiqueta2,col = colores2,main ="Diagrama de sectores Claridad")
legend("topright",c("I1","SI2","SI1","VS1","VVS2","VVS1","IF"),cex = 0.5,fill = colores2)
El corte en los diamantes se refiere a la manera en que la piedra preciosa ha sido tallada y pulida para maximizar su brillo, destello y belleza.
=table(corte)
corte_1=c("#9A7D0A","#943126","#117864","#5B2C6F","#1A5276")
colores4barplot(corte_1, xlab = "Corte",ylab = "Frecuencia absoluta",main = "Corte Diamantes",col = colores4)
=length(corte)
ncor=(corte_1/ncor)*100
porcentajcorte=paste(porcentajcorte,"%",sep = " ")
etiqueta3pie3D(porcentajcorte,labels = etiqueta3,col = colores4,main ="Diagrama de sectores Corte")
legend("topright",c("Regular","Bueno","Muy bueno","Premium","Ideal"),cex = 0.5,fill = colores2)
=table(claridad,corte)
p
=c("#90a4aE","#e0e0e0","#a1887f","#ff7043","#ffa726","#ffee58","#dce775","#aed581")
colores3barplot(p, xlab = "Claridad-Corte",ylab = "Frecuencia absoluta",main = "Claridad-Corte Diamantes",col = colores3)
legend("topleft",c("I1","SI2","SI1","VS1","VVS2","VVS1","IF"),cex = 0.5,fill = colores3)
=table(corte,color)
g=c("#9A7D0A","#943126","#117864","#5B2C6F","#1A5276")
colores5barplot(g, xlab = "Color-Corte",ylab = "Frecuencia absoluta",main = "Color-Corte Diamantes",col = colores5)
legend("topleft",c("Regular","Bueno","Muy bueno","Premium","Ideal"),cex = 0.5,fill = colores5)
```