—————————————————————–
El análisis de datos es la ciencia que examina un conjunto de datos con la finalidad de ampliar un tema de conocimiento u obtener información sobre ella. El análisis de datos consiste en someter los datos a la realización de operaciones, tiene el fin de concluir , la recolección de datos puede revelar ciertas dificultades.
En el informe presentado se muestran los resultados hechos a partir de una base de datos sobre el deslizamiento de tierra a escala global según la Nasa, el objetivo que se busca realizar es un claro entendimiento de esta enorme cantidad de datos de muestreo, de tal forma que podamos encontrar algún tipo de patrón recolectado, unos máximos y mínimos puntos sobre fechas, estadísticas, mediana, rango medio, diagramas de bigotes, tablas de frecuencias, aplicar los conocimientos básicos del análisis estadístico en R Studio de este modo se explicará la relevancia de estos datos de muestreo, cómo se comportan, y cúal podría ser su uso en un área de estudio.
La siguiente tabla muestra los resultados de 1694 datos recolectados por la NASA desde el 2007, acerca de los deslizamientos presentados en 70 países, este cuenta con información desde la frecuencia, el nombre del país,estado, ciudad, población, coordenadas geográficas, descripción básica del deslizamiento y las fuentes que sustentan su acontecimiento.
| id | date | time | Codigo_Continente | Nombre_Pais | Codigo_Pais | Estado | Poblacion | Ciudad | Distancia | location_description | latitude | longitude | geolocation | hazard_type | landslide_type | landslide_size | trigger | storm_name | injuries | fatalities | source_name | source_link |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 34 | 3/2/07 | Night | NA | United States | US | Virginia | 16000 | Cherry Hill | 3.40765 | Unknown | 38.6009 | -77.2682 | (38.600900000000003, -77.268199999999993) | Landslide | Landslide | Small | Rain | NA | NA | NA | NBC 4 news | http://www.nbc4.com/news/11186871/detail.html |
| 42 | 3/22/07 | NA | NA | United States | US | Ohio | 17288 | New Philadelphia | 3.33522 | NA | 40.5175 | -81.4305 | (40.517499999999998, -81.430499999999995) | Landslide | Landslide | Small | Rain | NA | NA | NA | Canton Rep.com | http://www.cantonrep.com/index.php?ID=345054&Category=9&subCategoryID=0 |
| 56 | 4/6/07 | NA | NA | United States | US | Pennsylvania | 15930 | Wilkinsburg | 2.91977 | Urban area | 40.4377 | -79.9160 | (40.4377, -79.915999999999997) | Landslide | Landslide | Small | Rain | NA | NA | NA | The Pittsburgh Channel.com | https://web.archive.org/web/20080423132842/http://www.thepittsburghchannel.com/news/11846833/detail.html |
| 59 | 4/14/07 | NA | NA | Canada | CA | Quebec | 42786 | Châteauguay | 2.98682 | Above river | 45.3226 | -73.7771 | (45.322600000000001, -73.777100000000004) | Landslide | Riverbank collapse | Small | Rain | NA | NA | NA | Le Soleil | http://www.hebdos.net/lsc/edition162007/articles.asp?article_id=166976 |
| 61 | 4/15/07 | NA | NA | United States | US | Kentucky | 6903 | Pikeville | 5.66542 | Below road | 37.4325 | -82.4931 | (37.432499999999997, -82.493099999999998) | Landslide | Landslide | Small | Downpour | NA | NA | 0 | Matthew Crawford (KGS) | NA |
| 64 | 4/20/07 | NA | NA | United States | US | Kentucky | 6903 | Pikeville | 0.23715 | NA | 37.4814 | -82.5186 | (37.481400000000001, -82.518600000000006) | Landslide | Landslide | Small | Rain | NA | NA | NA | Applalachain news-express | http://www.news-expressky.com/articles/2007/04/19/top_story/01mudslide.txt |
Tabla 1. Nota: Se tomaron solo los encabezados de la tabla para no ocupar mucho espacio usando el comando “knitr::kable(head(df))”
Se muestran los deslizamientos de cada ciudad en el siguiente gráfico
Gráfica de todos los países con el valor del deslizamiento total por país
## Warning: Removed 1 rows containing missing values (position_stack).
Este valor es porcentual, el cual nos permite conocer más fácil la cantidad de terreno deslizado a partir del total de deslizamiento total de la forma:
x<- Total deslizado en canadá
f<- porcentaje de la ciudad “n”
(f*100)/x = Total terreno deslizado por ciudad en metros
“También nos permite conocer más fácil los máximos y mínimos”
Estos diagramas nos ayuda a reagrupar la información de forma numérica, de modo que logramos comprender mejor la ubicación de los datos, máximos mínimos, cantidad de datos por cada número de cifras, etc. ### 4.8 Distancias de desplazamiento registradas en Guatemala
##
## The decimal point is at the |
##
## 0 | 0022445567788888999900456677889
## 2 | 011334677880011233556899
## 4 | 00125713599
## 6 | 012204
## 8 | 39
## 10 |
## 12 | 64
## 14 |
## 16 |
## 18 |
## 20 | 8
## 22 | 69
| DATOS (X= | Frecuencia | Frecuencia acumulada | X^2 | |
| 0 | 4 | 4 | 0 | |
| 2 | 2 | 6 | 8 | |
| 4 | 3 | 9 | 48 | |
| 5 | 3 | 12 | 75 | |
| 6 | 3 | 15 | 108 | |
| 7 | 4 | 19 | 196 | |
| 8 | 8 | 27 | 512 | |
| 9 | 5 | 32 | 405 | |
| 20 | 3 | 35 | 1200 | |
| 21 | 4 | 39 | 1764 | |
| 22 | 1 | 40 | 484 | |
| 23 | 4 | 44 | 2116 | |
| 24 | 4 | 48 | 2304 | |
| 25 | 1 | 49 | 625 | |
| 26 | 2 | 51 | 1352 | |
| 27 | 2 | 53 | 1458 | |
| 28 | 3 | 56 | 2352 | |
| 29 | 2 | 58 | 1682 | |
| 40 | 2 | 60 | 3200 | |
| 41 | 2 | 62 | 3362 | |
| 42 | 1 | 63 | 1764 | |
| 43 | 1 | 64 | 1849 | |
| 45 | 2 | 66 | 4050 | |
| 47 | 1 | 67 | 2209 | |
| 49 | 2 | 69 | 4802 | |
| 60 | 2 | 71 | 7200 | |
| 61 | 1 | 72 | 3721 | |
| 62 | 2 | 74 | 7688 | |
| 64 | 2 | 76 | 8192 | |
| 69 | 2 | 78 | 9522 | |
| 83 | 1 | 79 | 6889 | |
| 89 | 2 | 81 | 15842 | |
| TOTAL | 2127 | 81 | 96979 |
Media
Media <- 2127
frecuencia <- 81
Media2 <- 96979
prom_x <- Media/frecuencia
prom_x
## [1] 26.25926
Mediana
mediana <- (frecuencia + 1)/2
mediana
## [1] 41
corresponde al valor de 22
Moda 8 <- se repite 8 veces
rango medio
rango_medio <- frecuencia/2
rango_medio
## [1] 40.5
Cuartiles
Q2 <- mediana
Q1<- (25*frecuencia)/100
Q3 <- (75*frecuencia)/100
Q1
## [1] 20.25
Q2
## [1] 41
Q3
## [1] 60.75
rango_intercuartil <- Q3-Q1
rango_intercuartil
## [1] 40.5
4.23 Gráfico circular de Guatemala por Estados
Comparación de estados unidos, sin embargo la media muestral de estados unidos por estado oscila entre los 25 metros, por otro lado Canadá cuenta con una media de 8, los deslizamientos de Estados unidos tienden a ser 3 veces mayores que los de canadá.
## Warning: Removed 1 rows containing missing values (geom_bar).
Se utilizó los conocimientos aprendidos de analisis estadistico para comprender los procesos geológicos de desplazamientos, utilizando el programa R Studio para detallar datos sobre la mediana, media, rango, entre ciudades, estados y paises. Entre ellos, se consiguió comparar datos de deslizamiento mediante gráficas utilizando códigos y filtros de una cantidad grandísima de datos, lo cual permite apreciar la gran utilidad de esta plataforma.
Se logró analizar datos de deslizamientos para algunos países, la mayoría ubicados en Centroamérica. Una de las zonas interés, fue Guatemala, la cual cuenta con 81 deslizamientos datados desde el 2007, un número bastante elevado comparado con otros países como Perú. Las causas de esta gran cantidad de deslizamientos son: Las fuertes lluvias, las empinadas pendientes y la topografía irregular del terreno. Con la ayuda del sistema de información geográfica Google Earth, realizamos un perfil de elevación de la zona de El Cerritos y las Torres, donde se presentaron fuertes deslizamientos en el 2007, en esta imagen se pueden evidenciar algunas características del área ya mencionadas. Por último, se hallaron los valores de las medidas de tendencia central como la moda (22), mediana (41), media (26.25), rango medio (40.5) y los valores de las medidas de localización (Q1= 20.25, Q2= 41, Q3=60.75).
Altamirano, P & Espinoza, E. (2009). Guía para la presentación de gráficos estadísticos. https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf
Caimo, A & Charlton, M. (2012). Time Series Analysis. https://www.espon.eu/sites/default/files/attachments/TR_Time_Series_june2012.pdf
Reinert, G. (2010). Time series. http://www.stats.ox.ac.uk/~reinert/time/notesht10short.pdf
Universidad Nacional Autónoma de México. Medidas de tendencia central y dispersión. http://asesorias.cuautitlan2.unam.mx/Laboratoriovirtualdeestadistica/DOCUMENTOS/TEMA%202/1.%20MEDIDAS%20DE%20TENDENCIA%20CENTRAL%20Y%20DISPERSION.pdf
Institute for Healthcare Improvement. (2004). Pareto diagram.
https://www.health.state.mn.us/communities/practice/resources/phqitoolbox/docs/paretodiagram_ihi.pdf
https://www.espon.eu/sites/default/files/attachments/TR_Time_Series_june2012.pdf
https://www.inei.gob.pe/media/MenuRecursivo/metodologias/libro.pdf
http://www.dspace.uce.edu.ec/bitstream/25000/21017/1/Estad%C3%ADstica%20b%C3%A1sica%20I.pdf
https://www.health.state.mn.us/communities/practice/resources/phqitoolbox/docs/paretodiagram_ihi.pdf