setwd("~/UCE/III/estadistica")
#Carga de Datos
datos <- read.csv("Conjunto_Datos_Minerales.csv", header = TRUE, sep = ";",
dec = ".")
# Extraer la variable score
Score <- datos$score
# Tabla de frecuencia
TDFScore <- table(Score)
TablaScore <- as.data.frame(TDFScore)
colnames(TablaScore) <- c("Score", "ni")
# Frecuencia relativa porcentual
hi_porc <- (TablaScore$ni / sum(TablaScore$ni)) * 100
# Verificaciones
print(sum(TablaScore$ni))
## [1] 304632
print(sum(hi_porc))
## [1] 100
# Agregar columna de porcentajes
TablaScore <- data.frame(TablaScore, hi_porc)
print(TablaScore)
## Score ni hi_porc
## 1 A 808 0.2652381
## 2 B 24359 7.9962053
## 3 C 42503 13.9522440
## 4 D 212115 69.6299141
## 5 E 24847 8.1563985
# Gráfica No.1: ni Global
barplot(TablaScore$ni,
main = "Gráfica No.1: Distribución de cantidad de Score",
xlab = "Score",
ylab = "Cantidad",
col = "skyblue",
names.arg = TablaScore$Score,
ylim = c(0, length(Score)),
las=1,
cex.axis = 0.6)

# Gráfica No.2: ni Local
barplot(TablaScore$ni,
main = "Gráfica No.2: Distribución de cantidad de Score",
xlab = "Score",
ylab = "Cantidad",
col = "skyblue",
names.arg = TablaScore$Score,
las=1,
cex.axis = 0.6)

# Gráfica No.3: hi_porc Global
barplot(TablaScore$hi_porc,
main = "Gráfica No.3: Distribución de porcentaje de Score",
xlab = "Score",
ylab = "Porcentaje (%)",
col = "red",
names.arg = TablaScore$Score,
ylim = c(0, 100),
las=1,
cex.axis = 0.6)

# Gráfica No.4: hi_porc Local
barplot(TablaScore$hi_porc,
main = "Gráfica No.4: Distribución de porcentaje de Score",
xlab = "Score",
ylab = "Porcentaje (%)",
col = "red",
names.arg = TablaScore$Score,
las=1,
cex.axis = 0.6)

# Gráfica No.5: Gráfico circular
colores_grises <- gray.colors(length(TablaScore$Score), start = 0.2, end = 0.8)
pie(TablaScore$hi_porc,
labels = NA,
main = "Gráfica No.5: Distribución de porcentaje de Score",
col = colores_grises)
legend("topright",
legend = paste(TablaScore$Score, ": ", round(TablaScore$hi_porc, 1), "%"),
fill = colores_grises,
cex = 0.9,
bty = "n")
