TERREMOTOS DESDE 1900 HASTA EL AÑO 2000
library(foreign)
load("earthquakes.rda")
| # 1.1 Cinco máximos terremotos según la escala Richter |
r terremotosOrdenados <- earthquakes[order(earthquakes$richter, decreasing = TRUE),] topCinco <- head(terremotosOrdenados, 5) print(topCinco) |
## year month day richter area region deaths ## 62 1960 May 21 9.5 South Chile 1655 ## 65 1964 March 27 9.2 Alaska United States 131 ## 6 1906 January 31 8.8 Esmeraldas (off coast) Ecuador 1000 ## 9 1906 August 17 8.6 Valparaiso Chile 3882 ## 54 1950 August 15 8.6 Assam India 1526 |
barplot(earthquakes$deaths, names.arg = earthquakes$region, xlab = "Nombre de la variable", ylab = "Número de la variable", main = "Gráfico de barras", col = "lightblue", border ="black")
cuentaPaises <- table(earthquakes$region)
cuentaPaises <- data.frame(region = names(cuentaPaises), cuenta = as.integer(cuentaPaises))
cuentaPaises <- cuentaPaises[order(-cuentaPaises$cuenta),]
top10_regiones <- head(cuentaPaises, 10)
pie(top10_regiones$cuenta, main = "Top 10 países con más terremotos", labels = top10_regiones$region)
Vamos a comparar la cantidad de personas fallecidas de las que se guarda registro en los 20 primeros terremotos ocurridos a partir del año 1900 con la cantidad de personas fallecidas en los ultimos 20 terremotos ocurridos antes del año 2000. Con esta comparacion estudiaremos si hay alguna diferencia significativa entre las cantidades de personas fallecidas de ambas muestras.
Se tiene en cuenta que la cantidad de personas fallecidas no sigue una distribucion normal. Las muestras son de 20 terremotos. Debido a estas dos condiciones, y que se trata de dos muestras emparejadas, utilizamos un test no parametrico, concretamente el test de los signos.
A continuacion vamos a representar la cantidad de personas fallecidas en una tabla:
library(knitr)
data<- data.frame(
Año = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20),
PrimerosAños = c(2000,4700,3500,1000,19000,1000,1250,3000,3882,12000,72000,5000,2800,4000,32610,1800,1000,200000,3500,2200),
UltimosAños = c(40000,1621,1200,2000,4000,3,2500,9748,61,1000,5502,1989,1000,1567,2323,4000,2183,1185,17118,2400)
)
tabla<-kable(data, caption = "Número de personas fallecidas en cada terremoto")
tabla
| Año | PrimerosAños | UltimosAños |
|---|---|---|
| 1 | 2000 | 40000 |
| 2 | 4700 | 1621 |
| 3 | 3500 | 1200 |
| 4 | 1000 | 2000 |
| 5 | 19000 | 4000 |
| 6 | 1000 | 3 |
| 7 | 1250 | 2500 |
| 8 | 3000 | 9748 |
| 9 | 3882 | 61 |
| 10 | 12000 | 1000 |
| 11 | 72000 | 5502 |
| 12 | 5000 | 1989 |
| 13 | 2800 | 1000 |
| 14 | 4000 | 1567 |
| 15 | 32610 | 2323 |
| 16 | 1800 | 4000 |
| 17 | 1000 | 2183 |
| 18 | 200000 | 1185 |
| 19 | 3500 | 17118 |
| 20 | 2200 | 2400 |
Las hipotesis se plantean son las siguientes:
Hipótesis nula: La mediana de las diferencias es igual a 0. (H0 = 0)
Hipótesis alternativa: La mediana de las diferencias es diferente a 0. (H1 ≠ 0)
Utilizamos un nivel de significacion con valor de 0.05. (α = 0.05)
Calculamos el valor del estadístico, para ello comprobamos cuantos positivos y cuantos negativos hay, y nos quedamos con el valor maximo:
PrimerosAños = c(2000,4700,3500,1000,19000,1000,1250,3000,3882,12000,72000,5000,2800,4000,32610,1800,1000,200000,3500,2200)
UltimosAños = c(40000,1621,1200,2000,4000,3,2500,9748,61,1000,5502,1989,1000,1567,2323,4000,2183,1185,17118,2400)
Positivos <- sum((PrimerosAños-UltimosAños)>0)
Negativos <- sum((PrimerosAños-UltimosAños)<0)
Positivos
## [1] 12
Negativos
## [1] 8
max(Positivos,Negativos)
## [1] 12
Las funciones “sum” nos indican que hay 12 positivos y 8 negativos, y la funcion “max” nos indica que el máximo es 12.
Ahora calculamos el umbral para compararlo con el valor del estadistico y poder tomar una decision:
qbinom(1-(0.05/2),20,0.5)
## [1] 14
La funcion “qbinom” nos devuelve el numero 14, que es el valor del umbral.
El valor del estadistico (Bs) no es mayor que el valor del umbral (Bα/2), por lo tanto no se rechaza la hipotesis nula (H0).
No se aprecia una diferencia significativa entre la cantidad de personas fallecidas en los primeros 20 terremotos a partir del año 1900 y la cantidad de personas fallecidas en los ultimos 20 terremotos antes del año 2000.