TERREMOTOS DESDE 1900 HASTA EL AÑO 2000

library(foreign)
load("earthquakes.rda")

————————————————————————

#1. Analisis descritivo

# 1.1 Cinco máximos terremotos según la escala Richter
r terremotosOrdenados <- earthquakes[order(earthquakes$richter, decreasing = TRUE),] topCinco <- head(terremotosOrdenados, 5) print(topCinco)
## year month day richter area region deaths ## 62 1960 May 21 9.5 South Chile 1655 ## 65 1964 March 27 9.2 Alaska United States 131 ## 6 1906 January 31 8.8 Esmeraldas (off coast) Ecuador 1000 ## 9 1906 August 17 8.6 Valparaiso Chile 3882 ## 54 1950 August 15 8.6 Assam India 1526

1.2 Ordenar por muertes y país

barplot(earthquakes$deaths, names.arg = earthquakes$region, xlab = "Nombre de la variable", ylab = "Número de la variable", main = "Gráfico de barras", col = "lightblue", border ="black")


1.3 Mostrar los países 10 que mas terremotos han sufrido

cuentaPaises <- table(earthquakes$region)

cuentaPaises <- data.frame(region = names(cuentaPaises), cuenta = as.integer(cuentaPaises))
cuentaPaises <- cuentaPaises[order(-cuentaPaises$cuenta),]

top10_regiones <- head(cuentaPaises, 10)

pie(top10_regiones$cuenta, main = "Top 10 países con más terremotos", labels = top10_regiones$region)


2. CONTRASTE DE HIPÓTESIS

Vamos a comparar la cantidad de personas fallecidas de las que se guarda registro en los 20 primeros terremotos ocurridos a partir del año 1900 con la cantidad de personas fallecidas en los ultimos 20 terremotos ocurridos antes del año 2000. Con esta comparacion estudiaremos si hay alguna diferencia significativa entre las cantidades de personas fallecidas de ambas muestras.

Se tiene en cuenta que la cantidad de personas fallecidas no sigue una distribucion normal. Las muestras son de 20 terremotos. Debido a estas dos condiciones, y que se trata de dos muestras emparejadas, utilizamos un test no parametrico, concretamente el test de los signos.

A continuacion vamos a representar la cantidad de personas fallecidas en una tabla:

library(knitr)

data<- data.frame( 
  Año = c(1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20), 
  PrimerosAños = c(2000,4700,3500,1000,19000,1000,1250,3000,3882,12000,72000,5000,2800,4000,32610,1800,1000,200000,3500,2200), 
  UltimosAños = c(40000,1621,1200,2000,4000,3,2500,9748,61,1000,5502,1989,1000,1567,2323,4000,2183,1185,17118,2400)
  )

tabla<-kable(data, caption = "Número de personas fallecidas en cada terremoto") 

tabla
Número de personas fallecidas en cada terremoto
Año PrimerosAños UltimosAños
1 2000 40000
2 4700 1621
3 3500 1200
4 1000 2000
5 19000 4000
6 1000 3
7 1250 2500
8 3000 9748
9 3882 61
10 12000 1000
11 72000 5502
12 5000 1989
13 2800 1000
14 4000 1567
15 32610 2323
16 1800 4000
17 1000 2183
18 200000 1185
19 3500 17118
20 2200 2400

Las hipotesis se plantean son las siguientes:

Hipótesis nula: La mediana de las diferencias es igual a 0. (H0 = 0)

Hipótesis alternativa: La mediana de las diferencias es diferente a 0. (H1 ≠ 0)

Utilizamos un nivel de significacion con valor de 0.05. (α = 0.05)

Calculamos el valor del estadístico, para ello comprobamos cuantos positivos y cuantos negativos hay, y nos quedamos con el valor maximo:

PrimerosAños = c(2000,4700,3500,1000,19000,1000,1250,3000,3882,12000,72000,5000,2800,4000,32610,1800,1000,200000,3500,2200) 
  UltimosAños = c(40000,1621,1200,2000,4000,3,2500,9748,61,1000,5502,1989,1000,1567,2323,4000,2183,1185,17118,2400)

Positivos <- sum((PrimerosAños-UltimosAños)>0)

Negativos <- sum((PrimerosAños-UltimosAños)<0)

Positivos
## [1] 12
Negativos
## [1] 8
max(Positivos,Negativos)
## [1] 12

Las funciones “sum” nos indican que hay 12 positivos y 8 negativos, y la funcion “max” nos indica que el máximo es 12.

Ahora calculamos el umbral para compararlo con el valor del estadistico y poder tomar una decision:

qbinom(1-(0.05/2),20,0.5)
## [1] 14

La funcion “qbinom” nos devuelve el numero 14, que es el valor del umbral.

Conclusion:

El valor del estadistico (Bs) no es mayor que el valor del umbral (Bα/2), por lo tanto no se rechaza la hipotesis nula (H0).

No se aprecia una diferencia significativa entre la cantidad de personas fallecidas en los primeros 20 terremotos a partir del año 1900 y la cantidad de personas fallecidas en los ultimos 20 terremotos antes del año 2000.

———————————————–