Variable cualitativa ordinal
Mes
Ese código importa en R el archivo “Mes.csv” como un data frame, indicando que los datos están separados por comas, el punto es el separador decimal y la primera fila contiene los nombres de las columnas.
Extraemos la columna Cantidad del data frame Mes, la guardamos en ni, calculamos su suma total, luego obtienemos el porcentaje (hi) que representa cada valor de ni respecto al total. Después creamos un nuevo data frame llamado TDFMes que incluye las columnas originales más ni y hi.
## [1] 17805
## [1] 100
Filtramos los datos del data frame Mes para seleccionar solo los meses del 1 al 6, creamos un nuevo data frame con esa selección y calculamos las frecuencias relativas de la columna Cantidad en ese subconjunto.
Mes1 <- subset(Mes, Mes >= 1 & Mes <= 6)
tdfmes1<- data.frame(Mes1)
hi1<- tdfmes1$Cantidad/sum(tdfmes1$Cantidad)
hi1## [1] 0.1542828 0.1702786 0.1933953 0.2122807 0.1497420 0.1200206
barplot(hi1, main = "Gráfica N°80: Distribución de Probabilidad de Mes(1-6)",
xlab = "Mes",
ylab = "Cantidad-",
names.arg = tdfmes1$Mes, col="skyblue")Calculamos las probabilidades teóricas usando la distribución de
Poisson con parámetro lambda1 para los meses filtrados,
mostramos esos valores, y creamos un diagrama de barras comparando las
frecuencias relativas reales (hi1) con las probabilidades
del modelo (P1), incluyendo una leyenda para distinguir
ambas.
## [1] 0.11403235 0.19345487 0.21879633 0.18559303 0.12594278 0.07122027
barplot(rbind(hi1,P1), main = "Gráfica N°81: Distribución de Probabilidad de Mes(1-6)",
xlab = "Mes",
ylab = "Cantidad-Probabilidad",
names.arg = Mes1$Mes, beside = TRUE, col=c("red", "blue") )
legend("topright",legend = c("Real", "Modelo"),
fill=c("red", "blue"))## [1] 0.1542828 0.1702786 0.1933953 0.2122807 0.1497420 0.1200206
## [1] 0.11403235 0.19345487 0.21879633 0.18559303 0.12594278 0.07122027
## [1] 87.58027
plot(Fo1,Fe1, main="Gráfica N°82: Correlación entre frecuencias observadas y
esperadas de Magnitud de los sismos",
xlab="Observado (hi)", ylab="Esperado (P)")
abline(lm(Fe1 ~ Fo1), col="red",lwd=2)## [1] 9690
De los 9690 sismos ocurridos entre enero y febrero, ¿cuál es la probabilidad de que un sismo ocurra en el mes 3?
## [1] 2120.136
Filtramos los meses de julio a diciembre, crea un nuevo data frame y calculamos las frecuencias relativas de Cantidad en ese rango.
Mes2 <- subset(Mes, Mes >= 7 & Mes <= 12)
tdfmes2 <- data.frame(Mes2)
hi2<- tdfmes2$Cantidad/sum(tdfmes2$Cantidad)
hi2## [1] 0.1256932 0.1455330 0.1918669 0.2316697 0.1805299 0.1247073
Distribución de Probabilidad de Mes(7 a 12)
barplot(hi2, main = "Gráfico N°83: Distribución de Probabilidad de Mes(7 a 12)",
xlab = "Mes",
ylab = "Cantidad-",
names.arg = tdfmes2$Mes, col="skyblue")## [1] 8115
## [1] 1020 1181 1557 1880 1465 1012
## [1] 2
Asignamos valores de X: 0 a (k-1), esto es para que los valores tomen la forma binomial (x = 0,1,2,…)
## [1] 0 1 2 3 4 5
Estimar p a partir de la esperanza E(X) = np
## [1] 2.569932
Aplicar la fórmula: P(X = x) = C(n,x) * p^x * q^(n-x)
barplot(rbind(hi2, P2_binomial), beside = TRUE,
col = c("red", "blue"),
names.arg = tdfmes2$Mes,
main = "Gráfica N°84: Modelo Binomial Aplicado (Meses 7-12)",
ylab = "Probabilidad", xlab = "Mes")
legend("topright", legend = c("Observado", "Modelo Binomial"),
fill = c("red", "blue"), cex = 0.5)