Datos geológicos

Contexto:

Esta base de datos muestra información sobre caracteristicas de muestras de rocas (igneas, metamorficas y sedimentarias), como el tipo de roca, densidad, precencia de fosiles, etc.

el archivo cuenta con 50 filas y 6 columnas en las cuales se encuentran los datos de profundidad, tipo de roca, densidad, % porcentaje de silice y presencia de fosiles de manera aleatoria.

library(readxl)
df <- read_excel("Base_Datos_Geologia.xlsx")
df
## # A tibble: 50 × 6
##       ID `Profundidad (m)` `Tipo de Roca` `% de SiO2` `Densidad (g/cm³)`
##    <dbl>             <dbl> <chr>                <dbl>              <dbl>
##  1     1               120 Sedimentaria          65.2               2.65
##  2     2               230 Ígnea                 72.4               2.7 
##  3     3                85 Metamórfica           68.3               2.75
##  4     4               150 Sedimentaria          71.1               2.68
##  5     5               300 Ígnea                 62                 2.6 
##  6     6               210 Metamórfica           69.5               2.72
##  7     7                95 Sedimentaria          66.8               2.66
##  8     8               275 Ígnea                 73                 2.71
##  9     9               140 Metamórfica           64.5               2.64
## 10    10               310 Sedimentaria          70.3               2.69
## # ℹ 40 more rows
## # ℹ 1 more variable: `Presencia de Fósiles` <chr>

Muestra

Sí, existe una muestra. La muestra consiste en las diferentes filas de datos que representan las características de cada tipo de roca y por los registros específicos de rocas que se han analizado, con datos sobre su profundidad, tipo, composición química y otras propiedades.

Población objetivo

la poblacion objetivo sería los grupos de rocas en la región geológica estudiada, teniendo en cuenta sus características como la profundidad, tipo de roca, composición química, densidad y la presencia de fósiles. Esta población representa el conjunto o grupo total de elementos sobre los que buscamos información para poder analizar la base de datos.

Parámetro:

Un parámetro en este estudio podría ser el porcentaje de SiO2 en las muestras de roca. Este es un valor que describe una característica específica de la población objetivo (las rocas).

Estadístico

Un estadístico podría ser la media del porcentaje de SiO2 en las muestras de roca. Este es un valor calculado a partir del conjunto de resultados brindados por las muestras.

Clasificación de cada una de las variables de acuerdo con su naturaleza y nivel de medición

library(readxl)
dx <- read_excel("tabla de variables.xlsx")
dx
## # A tibble: 9 × 2
##   variables                       naturaleza de la variable y nivel de medició…¹
##   <chr>                           <chr>                                         
## 1 Profundidad del yacimiento      Cuantitativa                                  
## 2 <NA>                            <NA>                                          
## 3 Composición química (% de SiO2) Cuantitativa                                  
## 4 <NA>                            <NA>                                          
## 5 Tipo de roca                    Cualitativa                                   
## 6 <NA>                            <NA>                                          
## 7 Presencia de fosiles            Cualitativa                                   
## 8 <NA>                            <NA>                                          
## 9 Densidad de mineral (g/cm³)     Cuantitativa                                  
## # ℹ abbreviated name: ¹​`naturaleza de la variable y nivel de medición`

Tabla de frecuencias de dato categórico

Tipo de roca

#Creamos la tabla de frecuencia
tabla_frecuencias_roca <- as.data.frame(table(df$`Tipo de Roca`))

# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_roca$Frecuencia_Relativa <- tabla_frecuencias_roca$Freq / sum(tabla_frecuencias_roca$Freq)
tabla_frecuencias_roca$Porcentaje <- tabla_frecuencias_roca$Frecuencia_Relativa * 100

# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_roca) <- c("Tipo de Roca", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")

tabla_frecuencias_roca
##   Tipo de Roca Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1        Ígnea                  16                0.32         32
## 2  Metamórfica                  16                0.32         32
## 3 Sedimentaria                  18                0.36         36

Se pueden identificar tres tipos de rocas en la muestra, las Ígneas, Metamórficas y Sedimentarias, las cuales en su frecuencia absoluta que representa la cantidad de registros en la base de datos para cada tipo de roca pudimos evidenciar que hay 16 muestras de roca ígnea, 16 muestras de roca metamórfica y 18 muestras de roca sedimentaria; luego sacamos la Frecuencia Relativa que se obtiene dividiendo la frecuencia absoluta entre el total de registros, identificando que la roca ígnea y la metamórfica representan 0.32 (32%) cada una, y por otro lado la roca sedimentaria representa 0.36 (36%) del total de la muestra.

En conclusión la muestra está relativamente equilibrada entre los tres tipos de rocas, con una pequeña predominancia de rocas sedimentarias. Que quizá esto podría indicar que la región estudiada tiene una mayor proporción de este tipo de roca en comparación con las ígnas y  metamórficas.

Tabla de frecuencias de presencia de fosiles

#Creamos la tabla de frecuencia
tabla_frecuencias_fosil <- as.data.frame(table(df$`Presencia de Fósiles`))

# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_fosil$Frecuencia_Relativa <- tabla_frecuencias_fosil$Freq / sum(tabla_frecuencias_fosil$Freq)
tabla_frecuencias_fosil$Porcentaje <- tabla_frecuencias_fosil$Frecuencia_Relativa * 100

# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_fosil) <- c("Presencia de fosiles", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")

tabla_frecuencias_fosil
##   Presencia de fosiles Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1                   No                  25                 0.5         50
## 2                   Sí                  25                 0.5         50

La distribución de la presencia de fósiles es equitativa ya que se obtuvo un 50% de rocas que contienen fósiles y un 50% que no, lo que sugiere que las condiciones de preservación de materia orgánica han sido variables, probablemente dependiendo de factores ambientales y geológico específicos.

Tabla de frecuencias de profundidad(m)

#Creamos la tabla de frecuencia
tabla_frecuencias_prof <- as.data.frame(table(df$`Profundidad (m)`))

# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_prof$Frecuencia_Relativa <- tabla_frecuencias_prof$Freq / sum(tabla_frecuencias_prof$Freq)
tabla_frecuencias_prof$Porcentaje <- tabla_frecuencias_prof$Frecuencia_Relativa * 100

# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_prof) <- c("profundidad", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")

tabla_frecuencias_prof
##    profundidad Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1           85                   5                 0.1         10
## 2           95                   5                 0.1         10
## 3          120                   5                 0.1         10
## 4          140                   5                 0.1         10
## 5          150                   5                 0.1         10
## 6          210                   5                 0.1         10
## 7          230                   5                 0.1         10
## 8          275                   5                 0.1         10
## 9          300                   5                 0.1         10
## 10         310                   5                 0.1         10

Diagrama circular para clasificacion de tipos de roca

Este grafico nos muestra la distribución de los tipos de roca de las muestrs analizadas, representadas mediante un diagrama circular. El diagrama nos permite identificar la proporción de cada categoría de las muestras, facilitando así el análisis de la información.

library(ggplot2)
ggplot(df, aes(x = "", fill = df$`Tipo de Roca`)) +
  geom_bar(width = 1, position = "fill") +
  coord_polar("y") +
  theme_void() +
  labs(title = "Distribución de Tipo de Roca")
## Warning: Use of `` df$`Tipo de Roca` `` is discouraged.
## ℹ Use `Tipo de Roca` instead.

#fill: Color de relleno de las barras.
#coord_polar: Convierte el gráfico a coordenadas polares (para diagramas circulares).
#theme_void: Elimina prácticamente todos los elementos visuales del gráfico, dejando solo los datos.

Histograma de Profundidad

El histograma muestra cómo se distribuyen las profundidades del yacimiento. Hay intervalos donde la frecuencia es mayor, lo que indica que esas profundidades son más comunes. La curva de densidad suaviza la distribución, ayudando a ver de una mejor manera los datos de profundidad y densidad.

ggplot(df, aes(x = df$`Profundidad (m)`)) +
  geom_histogram(aes(y = ..density..), binwidth = 10, fill = "blue", color = "black") +
  geom_density(color = "red", size = 1) +
  labs(title = "Histograma de Profundidad del Yacimiento",
       x = "Profundidad (m)",
       y = "Densidad") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Use of `` df$`Profundidad (m)` `` is discouraged.
## ℹ Use `Profundidad (m)` instead.
## Use of `` df$`Profundidad (m)` `` is discouraged.
## ℹ Use `Profundidad (m)` instead.

 #binwidth: Define el ancho de las barras según tus datos
 #linewidth = 1: Grosor de la línea.
 #geom_histogram: Dibuja el histograma.

Diagrama de cajas del Tipo de Roca y porcentaje químico

El gráfico de cajas y bigotes muestra cómo cambia la composición química de las rocas. La caja indica los valores más comunes, la línea marca la mitad de los datos y los bigotes muestran los valores más altos y bajos. Así es fácil ver las diferencias y detectar valores fuera de lo normal.

ggplot(df, aes(x = df$`Tipo de Roca`, y = df$`% de SiO2`)) +
  geom_boxplot(fill = "lightblue", color = "darkblue") +
  labs(title = "Diagrama de cajas de la composición química de las rocas",
       x = "Tipo de Roca",
       y = "Concentración del Componente") +
  theme_minimal()
## Warning: Use of `` df$`Tipo de Roca` `` is discouraged.
## ℹ Use `Tipo de Roca` instead.
## Warning: Use of `` df$`% de SiO2` `` is discouraged.
## ℹ Use `% de SiO2` instead.

Tabla resumen

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
resumen <- df %>%
  summarise(
    Min_Profundidad = min(`Profundidad (m)`),
    Max_Profundidad = max(`Profundidad (m)`),
    Media_Profundidad = mean(`Profundidad (m)`),
    Mediana_Profundidad = median(`Profundidad (m)`),
    SD_Profundidad = sd(`Profundidad (m)`),
    
    Min_SiO2 = min(`% de SiO2`),
    Max_SiO2 = max(`% de SiO2`),
    Media_SiO2 = mean(`% de SiO2`),
    Mediana_SiO2 = median(`% de SiO2`),
    SD_SiO2 = sd(`% de SiO2`),

    Min_Densidad = min(`Densidad (g/cm³)`),
    Max_Densidad = max(`Densidad (g/cm³)`),
    Media_Densidad = mean(`Densidad (g/cm³)`),
    Mediana_Densidad = median(`Densidad (g/cm³)`),
    SD_Densidad = sd(`Densidad (g/cm³)`)
  )
print(resumen)
## # A tibble: 1 × 15
##   Min_Profundidad Max_Profundidad Media_Profundidad Mediana_Profundidad
##             <dbl>           <dbl>             <dbl>               <dbl>
## 1              85             310              192.                 180
## # ℹ 11 more variables: SD_Profundidad <dbl>, Min_SiO2 <dbl>, Max_SiO2 <dbl>,
## #   Media_SiO2 <dbl>, Mediana_SiO2 <dbl>, SD_SiO2 <dbl>, Min_Densidad <dbl>,
## #   Max_Densidad <dbl>, Media_Densidad <dbl>, Mediana_Densidad <dbl>,
## #   SD_Densidad <dbl>

Tabla de frecuencia de datos cualitativos

# Frecuencia absoluta
tabla_roca <- table(df$`Tipo de Roca`)
tabla_fosiles <- table(df$`Presencia de Fósiles`)

# Frecuencia relativa en porcentaje
porcentaje_roca <- prop.table(tabla_roca) * 100
porcentaje_fosiles <- prop.table(tabla_fosiles) * 100

# Mostrar resultados
tabla_roca
## 
##        Ígnea  Metamórfica Sedimentaria 
##           16           16           18
porcentaje_roca
## 
##        Ígnea  Metamórfica Sedimentaria 
##           32           32           36
tabla_fosiles
## 
## No Sí 
## 25 25
porcentaje_fosiles
## 
## No Sí 
## 50 50
#prop.table: porcentaje que representa cada valor respecto al total.

El análisis de estadísticas descriptivas ayuda a entender la composición y origen de las rocas, clave para la exploración geológica. La profundidad indica dónde se encuentran ciertos tipos de rocas, el % de sílice revela su origen magmático o sedimentario, y la densidad aporta pistas sobre su formación. La presencia de fósiles señala antiguos ambientes con vida, útiles para buscar recursos como hidrocarburos. Todo esto permite reconstruir la historia geológica y guiar la búsqueda de minerales o yacimientos.