Brayan Iván Cruz Corona

13001595

Introducción

El presente proyecto trata de una recopilación y análisis del desarrollo de las religiones a lo largo del tiempo, enfocados en la epoca de 1945 (final de la WWII) hasta hace unos años (2010). El proyecto se desarrolla en base a una competencia de Kaggle (www.kaggle.com) Los datos contienen informacion de cuantas personas se han unido a determinada religion en lapsos de tiempo de 5 años, incluso se incluye en el dataset las diferentes ramas de determinada religion para poder ser analizadas.

Es importante enfocar que se cuenta con 3 bases de datos:

  1. Global
  2. Regional
  3. Nacional

Es importante analizar cada uno de los datasets debido a que la evolucion es diferente en cada region, debido a la influencia de la cultura o incluso a los misioneros que se hicieron presentes para poder compartir de su fe en determinadas areas.

Por tanto el motivo de este proyecto es mostrar las tendencias de religion que han sido desarrolladas por los humanos a lo largo de varias decadas y que incluyen a los 7 continentes existentes.

Librerias utilizadas

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(rmarkdown)
library(ggplot2)
library(reader)
## Loading required package: NCmisc

Cada uno de estos paquetes tiene una funcionalidad especifica para el proyecto:

  1. dplyr: Una manera mas sencilla de manipular datos y de modificar la gramatica.
  2. rmarkdown: permite crear documentos dinamicos en R.
  3. reader: Permite leer archivos de manera mas flexible.
  4. ggplot2: Nos da la opcion de crear graficas personalizadas para mejor comprension.

Datasets utilizados

##   year christianity_protestant christianity_romancatholic
## 1 1945               160887585                  391332035
## 2 1950               133301043                  401935856
## 3 1955               189347338                  474378130
## 4 1960               220293770                  541957872
##   christianity_easternorthodox christianity_anglican
## 1                     98501171              36955033
## 2                    106610911              38307544
## 3                    111661338              38177572
## 4                    118268109              41846700
regional <- read.csv("regional.csv")
head(regional[1:4,1:5])
##   year  region christianity_protestant christianity_romancatholic
## 1 1945  Africa                 2074180                     672337
## 2 1945    Asia                 2407144                    2222908
## 3 1945  Europe                83145512                  216041422
## 4 1945 Mideast                   87174                     635929
##   christianity_easternorthodox
## 1                      7251492
## 2                       181928
## 3                     86503645
## 4                      3180260
naciones <- read.csv("national.csv")
head(naciones[1:4,1:5])
##   year                    state code christianity_protestant
## 1 1945 United States of America  USA                66069671
## 2 1950 United States of America  USA                73090083
## 3 1955 United States of America  USA                79294628
## 4 1960 United States of America  USA                90692928
##   christianity_romancatholic
## 1                   38716742
## 2                   42635882
## 3                   46402368
## 4                   50587880

Se consideran las siguientes naciones con su codigo:

Nnaciones <- cat("La cantidad posible de paises a analizar es: ",length(unique(naciones$code)))
## La cantidad posible de paises a analizar es:  200

Los codigos son los siguientes:

##   [1] USA CAN BHM CUB HAI DOM JAM TRI BAR DMA GRN SLU SVG AAB SKN MEX BLZ
##  [18] GUA HON SAL NIC COS PAN COL VEN GUY SUR ECU PER BRA BOL PAR CHL ARG
##  [35] URU UKG IRE NTH BEL LUX FRN MNC LIE SWZ SPN AND POR GMY GFR GDR POL
##  [52] AUS HUN CZE CZR SLO ITA SNM MLT ALB MNG MAC CRO YUG BOS KOS SLV GRC
##  [69] CYP BUL MLD ROM RUS EST LAT LIT UKR BLR ARM GRG AZE FIN SWD NOR DEN
##  [86] ICE CAP STP GNB EQG GAM MLI SEN BEN MAA NIR CDI GUI BFO LBR SIE GHA
## [103] TOG CAO NIG GAB CEN CHA CON DRC UGA KEN TAZ BUI RWA SOM DJI ETH ERI
## [120] ANG MZM ZAM ZIM MAW SAF NAM LES BOT SWA MAG COM MAS SEY MOR ALG TUN
## [137] LIB SUD IRN TUR IRQ EGY SYR LEB JOR ISR SAU YAR YEM YPR KUW BAH QAT
## [154] UAE OMA AFG TKM TAJ KYR UZB KZK CHN MON TAW PRK ROK JPN IND BHU PAK
## [171] BNG MYA SRI MAD NEP THI CAM LAO DRV RVN MAL SIN BRU PHI INS ETM AUL
## [188] PNG NEW VAN SOL KIR TUV FIJ TON NAU MSI PAL FSM WSM
## 200 Levels: AAB AFG ALB ALG AND ANG ARG ARM AUL AUS AZE BAH BAR BEL ... ZIM

Analisis en base a Guatemala

Como ya sabemos, Guatemala es un pais muy religioso, la mayoria de su poblacion hasta el momento tiene alguna religion. En esta parte del proyecto me enfocare en demostrar que nuestro país sigue siendo bastante religioso. Las religiones que predominan y bajo las que se hará el análisis son:

Catolicismo

Desarrollo de la religion Católica a lo largo de los años: 1945 - 2010

naciones %>%
  filter(code == "GUA") %>%
  ggplot(aes(x = year, y = christianity_romancatholic)) +
    geom_area(color="darkblue",
              fill="lightblue")

Protestantes

Desarrollo de la religion Evangelica Protestante a lo largo de los años: 1945 - 2010

naciones %>%
  filter(code == "GUA") %>%
  ggplot(aes(x = year, y = christianity_protestant)) +
    geom_area(color="blue",
              fill="#cc6666")

Sin Religion

Desarrollo de la poblacion que no profesa ninguna religion a lo largo de los años: 1945 - 2010

naciones %>%
  filter(code == "GUA") %>%
  ggplot(aes(x = year, y = noreligion_all)) +
    geom_area(color="#ff1d18",
              fill="#a4f161")

Otra Religion

Desarrollo de otras religiones a lo largo de los años: 1945 - 2010

naciones %>%
  filter(code == "GUA") %>%
  ggplot(aes(x = year, y = otherreligion_all)) +
    geom_area(color="green",
              fill="pink", linetype="dashed")

#predecir el cristianimso total en base a las demas religiones y no creyentes
filtradoGT <- naciones %>% filter(code == "GUA")

model <- lm(christianity_all ~ noreligion_all + otherreligion_all + religion_all - christianity_all
            , data = filtradoGT )

p <- predict(model, filtradoGT, type = "response")
p
##        1        2        3        4        5        6        7        8 
##  2319503  2781650  3063812  3803746  4299602  4815835  5450729  6084408 
##        9       10       11       12       13       14 
##  7246651  8510173  9561763 11064031 12081214 13112234

Analisis en base a Regiones

Este análisis es en base a regiones, para el dataset de “Regional” se tomaron en cuenta solamente 5 regiones para hacer el analisis, son las siguientes:

unique(regional$region)
## [1] Africa    Asia      Europe    Mideast   West. Hem
## Levels: Africa Asia Europe Mideast West. Hem

Debido a que hay varias regiones y analizarlas por religion se vuelve muy complicado se agruparan las religiones para poder realizar un analisis mas preciso.

Religiones Abrahamicas

Se conforman por:

  • Cristianimso
  • Islam
  • Judaismo

El crecimiento de estas religiones a lo largo de la epoca de 1945 a 2010 ha sido el siguiente:

Cristianismo
regional %>%
  select(year, region, christianity_all, islam_all, judaism_all) %>%
    ggplot(aes(x = year,y = christianity_all,col = region, fill = region)) +
    geom_area()

Islam
regional %>%
  select(year, region, christianity_all, islam_all, judaism_all) %>%
    ggplot(aes(x = year,y = islam_all,col = region, fill = region)) +
    geom_area()

Judaismo
regional %>%
  select(year, region, christianity_all, islam_all, judaism_all) %>%
    ggplot(aes(x = year,y = judaism_all,col = region, fill = region)) +
    geom_area()

Al analizar las graficas podemos observarque el Cristianismo y el Islam han tenido una tendencia creciente. En el caso del cristianismo se puede observar que el aumento ha sido bastante significativo en las regiones de Asia, Hemisferio Occidental y Africa. En el caso de la region europea se ve un crecimiento muy leve.

Analizando la grafica del Judaismo, podemos observar que el crecimiento se ha mantenido estable y no ha aumentado drasticamente en comparacion con las otras dos religiones que estamos analizando. En el continente europeo es donde se puede ver que ha disminuido la cantidad de creyentes, por otro lado en la region de Oriente medio se ha visto el mayor crecimiento.

En cuanto a el Islam, podemos observar que en rango de tiempo de 1980-2005 aproximadamente, la region asiatica ha presentado un crecimiento bastante significativo y rapido, ya que en 25 años se ve que los seguidores han aumentado mas de 1.5 veces.

Religiones Indias

Por otro lado tenemos uno de los paises mas religiosos, India, es un pais que involucra muchas religiones, varias de ellas se originaron en este pais, las principales y las que deseo analizar son:

  • Hinduismo: se caracteriza por creer en la reencarnación y en la existencia de un Ser supremo (Brahma).
  • Sijismo: La doctrina básica del sijismo consiste en la creencia en un único Dios y en las enseñanzas de los diez gurús del sijismo. Es la 9na. religion con mas creyentes.
  • Jainismo: Esta doctrina pregona una vía salvadora filosófica no centrada en el culto de ningún dios.
Hinduismo

Utilizando una grafica de densidad para mejorar el analisis, como podemos observar el mayor crecimiento lo tiene la region asiatica, seguido por la region africana.

regional %>%
  select(year, region, hinduism_all, sikhism_all, jainism_all) %>%
  ggplot(aes(log10(hinduism_all), fill = region, colour = region)) +
  geom_density(alpha = 0.1, na.rm = FALSE)
## Warning: Removed 7 rows containing non-finite values (stat_density).

Sijismo

En cuanto al Sijismo, la mayor cantidad de creyentes se encuentra en la region asiatica, pero a lo largo del tiempo el continente europeo y el medio oriente se han acercado al mismo numero de seguidores, cabe mencionar que esta religion va en crecimiento y se ha llegado a posicionar como la novena religion con mas seguidores.

regional %>%
  select(year, region, hinduism_all, sikhism_all, jainism_all) %>%
  ggplot(aes(log10(sikhism_all), fill = region, colour = region)) +
  geom_density(alpha = 0.1)
## Warning: Removed 10 rows containing non-finite values (stat_density).

Jainismo

El Jainismo tuvo en cierto punto de la historia la mayoria de sus creyentes en Africa, actualmente esta religion tambien ha ganado muchos creyentes en la region asiatica.

regional %>%
  select(year, region, hinduism_all, sikhism_all, jainism_all) %>%
  ggplot(aes(log10(jainism_all), fill = region, colour = region)) +
  geom_density(alpha = 0.1, position="stack")
## Warning: Removed 25 rows containing non-finite values (stat_density).

Religiones Asiaticas del Este

Como religiones asiaticas del este tenemos las dos principales:

  • Budismo
  • Taoismo

Cada una de estas religiones presenta un crecimiento increible en nuestra epoca, el budismo se generó en India y se ha extendido por una gran parte de Asia. Y el Taoismo se generó en China, profesa las enseñanzas de Lao Tze, es mas conocida por promover el concepto de unidad absoluta y es muy identificable por utilizar el Ying Yang para ejemplificar sus creencias.

Budismo
regional %>%
  select(year, region, buddhism_all) %>%
    ggplot(aes(x = year,y = log10(buddhism_all),col = region, fill = region, shape = region, stroke = 5)) +
    geom_point()

Tal y como podemos observar en la grafica, las regiones con mayor crecimiento de creyentes son Africa y el Medio Oriente, en poco tiempo estas regiones han aumentado su numero de creyentes y siguen expandiendose. En cuanto a las demas regiones, se registra crecimiento, pero no es tan significativo como en las dos regiones antes mencionadas.

Taoismo
regional %>%
  select(year, region, taoism_all) %>%
    ggplot(aes(x = year,y = log10(taoism_all),col = region, fill = region)) +
    geom_step()

Tal y como la grafica lo incica, el Taoismo es una religion que se mantiene constante en su mayoria en la region Asiatica. En la region de Oriente medio tuvo bajas en sus creyentes de manera significativa aproximadamente en los años 1985 - 1990, se recupero aun en el siglo XX pero en nuestra epoca sigue disminuyendo.

Analisis Global

Modelacion y prediccion
reg1 <- lm(christianity_all ~ region
            , data = regional )
summary(reg1)
## 
## Call:
## lm(formula = christianity_all ~ region, data = regional)
## 
## Residuals:
##        Min         1Q     Median         3Q        Max 
## -268414833  -67056748   -1128742   68446682  268784796 
## 
## Coefficients:
##                   Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      191221045   30749220   6.219 4.06e-08 ***
## regionAsia       -38027502   43485964  -0.874    0.385    
## regionEurope     299255001   43485964   6.882 2.81e-09 ***
## regionMideast   -180357269   43485964  -4.147 9.95e-05 ***
## regionWest. Hem  329117232   43485964   7.568 1.71e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 115100000 on 65 degrees of freedom
## Multiple R-squared:  0.7633, Adjusted R-squared:  0.7488 
## F-statistic: 52.41 on 4 and 65 DF,  p-value: < 2.2e-16
p <- predict(model, mundial, type = "response")
p
##          1          2          3          4          5          6 
## 1479059998 2057332651 2256209868 2520772006 2821528273 3104563783 
##          7          8          9         10         11         12 
## 3375075430 3568925903 3924602165 4517851527 4905835433 5340801332 
##         13         14 
## 5735459728 6091761116
# christianity_all, judaism_all, islam_all, buddhism_all,  hinduism_all, #noreligion_all, otherreligion_all
Cristianismo a nivel Mundial en base a años vs Poblacion Mundial:
mundial%>%
  select(year,world_population,christianity_all) %>%
  ggplot(aes(x=year, y = world_population, fill = christianity_all)) +
  geom_raster()

Sabiendo que los conquistadores de America en su mayoria fueron de religion catolica, por logica podemos pensar que la region occidental en su mayoria esta conformada por creyentes que profesan una fe cristiana. La siguiente grafica demuestra que efectivamente el cristianismo es mas fuerte en la region Americana y Europea. Se evidencia con los datos.

regional %>%
  ggplot(aes(x=region,y=christianity_all, color= region)) +
    geom_col() +   
    geom_smooth(method=lm)

Islam a nivel Mundial en base a años vs Poblacion Mundial:
mundial%>%
  select(year,world_population,islam_all) %>%
  ggplot(aes(x=year, y = world_population, fill = islam_all)) +
  geom_raster()

El Islam como es sabido, se origino en la region Asiatica y no se ha propagado demasiado por el mundo, se conserva y no se propaga en gran manera a los distintos continentes. Tal y como la grafica lo muestra.

regional %>%
  ggplot(aes(x=region,y=islam_all, color= region)) +
    geom_col() +   
    geom_smooth(method=lm)

Budismo a nivel Mundial en base a años vs Poblacion Mundial:
mundial%>%
  select(year,world_population,buddhism_all) %>%
  ggplot(aes(x=year, y = world_population, fill = buddhism_all)) +
  geom_raster()

El budismo como ya sabemos, se concentra en su mayoria en la poblacion de la region asiatica, se ha propagado en pequeñas cantidades a los distintos continentes, el siguiente grafico da envidencia.

regional %>%
  ggplot(aes(x=region,y=buddhism_all, color= region)) +
    geom_col() +   
    geom_smooth(method=lm)

Hinduismo a nivel Mundial en base a años vs Poblacion Mundial:
mundial%>%
  select(year,world_population,hinduism_all) %>%
  ggplot(aes(x=year, y = world_population, fill = hinduism_all)) +
  geom_raster()

El hinduismo tambien es una religion que se ha propagado escasamente en los distintos continentes, ya que los que lo profesan mas son los paises cercanos a donde se tuvo el origen, es decir India. Por tanto en las demas regiones el hinduismo es escaso.

regional %>%
  ggplot(aes(x=region,y=hinduism_all, color= region)) +
    geom_col() +   
    geom_smooth(method=lm)

Sin religion a nivel Mundial en base a años vs Poblacion Mundial:
mundial%>%
  select(year,world_population,noreligion_all) %>%
  ggplot(aes(x=year, y = world_population, fill = noreligion_all)) +
  geom_raster()

La region que tiene a la mayoria de personas que no profesan una religion es Asia y Europa, el resto de regiones profesa en su mayoria una o varias religiones, estos datos quedan envidenciados en el modelo siguiente:

regional %>%
  ggplot(aes(x=region,y=noreligion_all, color= region)) +
    geom_col() +   
    geom_smooth(method=lm)