CORRELACIÓN ENTRE POBLACIÓN Y PERSONAS EMPLEADAS 🌷

 library(readxl)
 B1 <- read_excel("C:/Users/Laura Sofia/OneDrive/Escritorio/B1.xlsx")
 View(B1)
library(readxl)
B2 <- read_excel("C:/Users/Laura Sofia/OneDrive/Escritorio/B2.xlsx")
View(B2)

Correlación

library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
ggplot(data = B1) +
  aes(x = `POBLACION (MILLONES)`, y = `PERSONAS EMPLEADAS`, colour = "violetred4") +
  geom_point() +
  labs(title = "Correlacion entre poblacion y personas empleadas",
       x = "Poblacion (millones)",
       y = "Personas empleadas") +
  geom_smooth(method = "lm", colour = "violetred4") +
  theme_minimal() +
  theme(panel.background = element_rect(fill = "white", colour = "white"))
## `geom_smooth()` using formula = 'y ~ x'

EXPLICACIÓN

correlacion <- cor(B1$`POBLACION (MILLONES)`, B1$`PERSONAS EMPLEADAS`)
print(correlacion)
## [1] -0.38064

Obtuvimos en las variables población y personas empleadas una correlacion lineal decreciente fuerte entre ellas de \(r=-0.38064\) indica que existe una relación negativa considerable entre ambas.

CORELACIÓN ENTRE INVERSIÓN Y DEUDA

library(ggplot2)

ggplot(data = B2) +
  aes(x = inversion, y = deuda) +
  geom_point(colour = "mediumpurple4") +
  labs(title = "Correlacion entre inversion y deuda",
       x = "Inversion",
       y = "Deuda") +
  geom_smooth(method = "lm", colour = "mediumpurple4") +
  theme_minimal() +
  theme(panel.grid.major = element_blank(),
        panel.grid.minor = element_blank(),
        panel.background = element_rect(fill = "white", colour = "white",))
## `geom_smooth()` using formula = 'y ~ x'

EXPLICACIÓN

correlacion <- cor(B2$inversion, B2$deuda)
print(correlacion)
## [1] -0.2958556

Obtuvimos en las variables inversion y deuda una correlacion lineal decreciente fuerte entre ellas de \(r=-0.2958556\) indica que existe una relación negativa considerable entre ambas. Esto significa que a medida que la inversión aumenta, la deuda tiende a disminuir de forma considerable.

MATRIZ DE CORRELACIÓN

Datosnuevos <- cbind(B1$`POBLACION (MILLONES)`, B1$`PERSONAS EMPLEADAS`, B2$inversion, B2$deuda)
cor(Datosnuevos)
##            [,1]        [,2]        [,3]       [,4]
## [1,]  1.0000000 -0.38063998 -0.78691062  0.6171236
## [2,] -0.3806400  1.00000000 -0.01271568 -0.2887140
## [3,] -0.7869106 -0.01271568  1.00000000 -0.2958556
## [4,]  0.6171236 -0.28871401 -0.29585560  1.0000000

la matriz de correlación muestra que las variables Población y Deuda tienen la mayor correlación, con un valor de \(r=0.6171236\). A medida que la población aumenta, la deuda también tiende a aumentar.

GRÁFICO DE LA MATRIZ DE CORRELACIÓN

library(readxl)
B4 <- read_excel("C:/Users/Laura Sofia/OneDrive/Escritorio/B4.xlsx")
View(B4)
plot(B4[,-3], col = c(B4$`POBLACION (MILLONES)`, B4$`PERSONAS EMPLEADAS`, B4$inversion, B4$deuda)) 

DIAGRAMA DE CAJAS UNIVERSIDADES E INVERSIÓN

library(readxl)
B5 <- read_excel("C:/Users/Laura Sofia/OneDrive/Escritorio/B5.xlsx")
View(B5)
ggplot(B5, mapping = aes(x = factor(UNIVERSIDADES, levels = unique(UNIVERSIDADES), labels = unique(UNIVERSIDADES)), y = INVERSION)) +
  geom_boxplot(fill = "hotpink3", width = 0.6) + # Ajustar ancho de caja
  labs(title = "Diagrama de cajas universidades VS inversión", x = "UNIVERSIDADES") +
  coord_cartesian(expand = FALSE) +
  theme_classic() +
  # Rotar nombres de universidades para mejor visualización
  theme(axis.text.x = element_text(angle = 90, hjust = 0.5))

EXPLICACIÓN

El diagrama muestra que la distribución de la inversión es asimétrica a lo largo de los años, con una gran cantidad de universidades que reciben una inversión relativamente baja y un pequeño número de universidades que reciben una inversión muy alta en algunos años.

DIAGRAMA DE CAJAS POBLACIÓN Y RELIGIÓN PREDOMINANTE A TRAVÉS DE LOS AÑOS

library(readxl)
B7 <- read_excel("C:/Users/Laura Sofia/OneDrive/Escritorio/B7.xlsx")
View(B7)
ggplot(B7, mapping = aes(x = factor(RELIGION, levels = unique(RELIGION), labels = unique(RELIGION)), y = POBLACION)) +
  geom_boxplot(fill = "yellow", width = 0.6) + # Ajustar ancho de caja
  labs(title = "Diagrama de cajas poblacion VS religion", x = "RELIGION") +
  coord_cartesian(expand = FALSE) +
  theme_classic() +
  # Rotar nombres de universidades para mejor visualización
  theme(axis.text.x = element_text(angle = 90, hjust = 0.5))

EXPLICACIÓN

El diagrama de cajas muestra que la población creyente tiene una distribución similar a la población no creyente. La mediana de la población creyente es un poco más alta que la mediana de la población no creyente, lo que indica que los creyentes tienden a tener una población ligeramente mayor que los no creyentes. Sin embargo, la diferencia entre las dos medianas es pequeña.