Variable cualitativa nominal

Cargamos la tabla de datos o el dataset:

datos1<-read.csv("C:/Users/inesa/Downloads/Orientacion1.csv",
                 header = TRUE, sep = ",", dec=".")

Verificamos que rstudio nos lea correctamente los datos

str(datos1)
## 'data.frame':    14776 obs. of  1 variable:
##  $ Orientacion: chr  "ENE" "NE" "S" "NNE" ...

Extraemos la variable y verificamos el tamaño muestral

Orientacion<-datos1$Orientacion
length(Orientacion) #nuevo tamaño 
## [1] 14776

Tabla de Distribución De Frecuencias Simples:

TDFOrientacion <- table(Orientacion)
TDFOrientacion<- as.data.frame(TDFOrientacion)
TDFOrientacion
##    Orientacion Freq
## 1            E  646
## 2          ENE  583
## 3          ESE  624
## 4            N  922
## 5           NE  818
## 6          NNE  966
## 7          NNW 1366
## 8           NW 1258
## 9            S  623
## 10          SE  906
## 11         SSE  972
## 12         SSW  749
## 13          SW 1077
## 14           W 1209
## 15         WNW  854
## 16         WSW 1203

Agrupamos en las cuatro orientaciones geográficas

#Agrupacion:
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
TDFOrientacion$Orientacion <- ifelse(TDFOrientacion$Orientacion %in% c("N", "NNE", "NE", "NNW", "NW"), "Norte", 
                   ifelse(TDFOrientacion$Orientacion %in% c("E","ESE", "SE","ENE" ), "Este",
                   ifelse(TDFOrientacion$Orientacion %in% c("S", "SSW", "SSE"), "Sur",
              ifelse(TDFOrientacion$Orientacion %in% c("W", "WNW", "WSW", "SW"), "Oeste", "otros"))))
TDFOrientacion$Orientacion
##  [1] "Este"  "Este"  "Este"  "Norte" "Norte" "Norte" "Norte" "Norte" "Sur"  
## [10] "Este"  "Sur"   "Sur"   "Oeste" "Oeste" "Oeste" "Oeste"

Calculamos las frecuencias absolutas y relativas simples

TDFOrientacionFinal <- TDFOrientacion %>%
  group_by(Orientacion) %>%
  summarise(
    ni = sum(Freq), 
    hi = round((sum(ni) / sum(TDFOrientacion$Freq)) * 100) 
  )
TDFOrientacionFinal<-data.frame(TDFOrientacionFinal)
TDFOrientacionFinal
##   Orientacion   ni hi
## 1        Este 2759 19
## 2       Norte 5330 36
## 3       Oeste 4343 29
## 4         Sur 2344 16
#Comprobación del tamaño
sum(TDFOrientacionFinal$ni)
## [1] 14776
sum(TDFOrientacionFinal$hi)
## [1] 100

Construcción de la tabla completa final para mejor visualizacion

#Agregar Totales:
total_ni<-sum(TDFOrientacionFinal$ni)
total_hi<-100

TDFOrientacionFinCompleto<-rbind(TDFOrientacionFinal,
                data.frame(Orientacion="Total", ni = total_ni, hi =total_hi))

print(TDFOrientacionFinCompleto)
##   Orientacion    ni  hi
## 1        Este  2759  19
## 2       Norte  5330  36
## 3       Oeste  4343  29
## 4         Sur  2344  16
## 5       Total 14776 100
#Tabla Completa:
library(gt)
## Warning: package 'gt' was built under R version 4.4.3
library(dplyr)

# Crear la tabla 
tabla_orientacion<-TDFOrientacionFinCompleto %>%
  gt() %>%
  tab_header(
    title = md("**Tabla Nro. 1**"),
    subtitle = md("**Tabla de Distribución de Frecuencias Absolutas y Relativas Simples
                  de la Orientación de los Sismos en el Subcontinente Indio (2000-2024)**")
  ) %>%
  tab_source_note(
    source_note = md("Autor: Grupo1")
  ) %>%
  tab_options(
    table.border.top.color = "black",
    table.border.bottom.color = "black",
    table.border.top.style = "solid",
    table.border.bottom.style = "solid",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    row.striping.include_table_body = TRUE,
    heading.border.bottom.color = "black",
    heading.border.bottom.width = px(2),
    table_body.hlines.color = "gray",
    table_body.border.bottom.color = "black"
  )  %>%
  tab_style(
    style = cell_text(weight = "bold"),
    locations = cells_body(
      rows = TDFOrientacionFinCompleto$Orientacion == "Total"
    )
  ) 

tabla_orientacion
Tabla Nro. 1
Tabla de Distribución de Frecuencias Absolutas y Relativas Simples de la Orientación de los Sismos en el Subcontinente Indio (2000-2024)
Orientacion ni hi
Este 2759 19
Norte 5330 36
Oeste 4343 29
Sur 2344 16
Total 14776 100
Autor: Grupo1

Gráficas

Creamos el diagrama de barras con la frecuencia absoluta

#FRECUENCIAS ABSOLUTAS LOCAL(ni)
barplot(TDFOrientacionFinal$ni, main="Grafica Nº1.1: Distribución de la 
        Orientación de los Sismos en el Subcontinente Indio (Local) ",
        xlab = "Orientación", ylab = "Cantidad",
        col ="grey",  names.arg = TDFOrientacionFinal$Orientacion,
       cex.names=1)

#FRECUENCIAS ABSOLUTAS GLOBAL(ni)
barplot(TDFOrientacionFinal$ni,main="Gráfica Nº1.2:Distribución de la
        Orientación de los Sismos en el                  
        Subcontinente Indio (Global) ",
        xlab = "Orientación", ylab = "Cantidad",
        col ="grey",  names.arg = TDFOrientacionFinal$Orientacion,
         cex.names=1, ylim=c(0, 14776))

Creamos el diagrama de barras con la frecuencia relativa

#FRECUENCIAS RELATIVAS LOCAL(hi)
barplot(TDFOrientacionFinal$hi,
        main="Gráfica Nº1.3: Porcentaje de la Orientación de los Sismos en el                  
        Subcontinente Indio (Local)",
        xlab = "Orientación", ylab = "Porcentaje (%)",
        col ="grey",  names.arg = TDFOrientacionFinal$Orientacion,
        cex.names=1)

#FRECUENCIAS RELATIVAS BLOBAL(hi)
barplot(TDFOrientacionFinal$hi,
        main="Gráfica Nº1.4: Porcentaje de la Orientación de los Sismos en el                  
        Subcontinente Indio (Global)",
        xlab = "Orientación", ylab = "Porcentaje (%)",
        col ="grey",  names.arg = TDFOrientacionFinal$Orientacion,
        cex.names=1,ylim=c(0,100))

Creamos el sector circular para tener una mejor visualización del porcentaje de incidencia de un echo o fenómeno, usando la frecuencia relativa.

#DIAGRAMA CIRCULAR (hi)
Colores <- colorRampPalette(c("lightskyblue", "darkblue"))
etiquetas <- paste(round(TDFOrientacionFinal$hi),'%', sep="")
pie(TDFOrientacionFinal$hi, radius=1, col= Colores(4), 
    main = "Gráfica Nº1.5: Porcentaje de la Orientación de los Sismos en el                  
        Subcontinente Indio", 
    labels = etiquetas)
legend("bottomright", title="Leyenda",legend = TDFOrientacionFinal$Orientacion,
       cex = 0.9, fill =  Colores(4), title.cex = 1)

Conclusiones

La variable Orientación de los Sismos ocurridos en el Subcontinente Indio , es de tipo nominal, sin embargo, para simplificación del análisis, se agrupo en las cuatro orientaciones geográficas, donde el valor que más se repite es “Norte”, con una ocurrencia de 36%.