Esta base de datos muestra información sobre caracteristicas de muestras de rocas (igneas, metamorficas y sedimentarias), como el tipo de roca, densidad, precencia de fosiles, etc.
el archivo cuenta con 50 filas y 6 columnas en las cuales se encuentran los datos de profundidad, tipo de roca, densidad, % porcentaje de silice y presencia de fosiles de manera aleatoria.
library(readxl)
df <- read_excel("Base_Datos_Geologia.xlsx")
df
## # A tibble: 50 × 6
## ID `Profundidad (m)` `Tipo de Roca` `% de SiO2` `Densidad (g/cm³)`
## <dbl> <dbl> <chr> <dbl> <dbl>
## 1 1 120 Sedimentaria 65.2 2.65
## 2 2 230 Ígnea 72.4 2.7
## 3 3 85 Metamórfica 68.3 2.75
## 4 4 150 Sedimentaria 71.1 2.68
## 5 5 300 Ígnea 62 2.6
## 6 6 210 Metamórfica 69.5 2.72
## 7 7 95 Sedimentaria 66.8 2.66
## 8 8 275 Ígnea 73 2.71
## 9 9 140 Metamórfica 64.5 2.64
## 10 10 310 Sedimentaria 70.3 2.69
## # ℹ 40 more rows
## # ℹ 1 more variable: `Presencia de Fósiles` <chr>
Sí, existe una muestra. La muestra consiste en las diferentes filas de datos que representan las características de cada tipo de roca y por los registros específicos de rocas que se han analizado, con datos sobre su profundidad, tipo, composición química y otras propiedades.
la poblacion objetivo sería los grupos de rocas en la región geológica estudiada, teniendo en cuenta sus características como la profundidad, tipo de roca, composición química, densidad y la presencia de fósiles. Esta población representa el conjunto o grupo total de elementos sobre los que buscamos información para poder analizar la base de datos.
Un parámetro en este estudio podría ser el porcentaje de SiO2 en las muestras de roca. Este es un valor que describe una característica específica de la población objetivo (las rocas).
Un estadístico podría ser la media del porcentaje de SiO2 en las muestras de roca. Este es un valor calculado a partir del conjunto de resultados brindados por las muestras.
library(readxl)
dx <- read_excel("tabla de variables.xlsx")
dx
## # A tibble: 9 × 2
## variables naturaleza de la variable y nivel de medició…¹
## <chr> <chr>
## 1 Profundidad del yacimiento Cuantitativa
## 2 <NA> <NA>
## 3 Composición química (% de SiO2) Cuantitativa
## 4 <NA> <NA>
## 5 Tipo de roca Cualitativa
## 6 <NA> <NA>
## 7 Presencia de fosiles Cualitativa
## 8 <NA> <NA>
## 9 Densidad de mineral (g/cm³) Cuantitativa
## # ℹ abbreviated name: ¹`naturaleza de la variable y nivel de medición`
#Creamos la tabla de frecuencia
tabla_frecuencias_roca <- as.data.frame(table(df$`Tipo de Roca`))
# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_roca$Frecuencia_Relativa <- tabla_frecuencias_roca$Freq / sum(tabla_frecuencias_roca$Freq)
tabla_frecuencias_roca$Porcentaje <- tabla_frecuencias_roca$Frecuencia_Relativa * 100
# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_roca) <- c("Tipo de Roca", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")
tabla_frecuencias_roca
## Tipo de Roca Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1 Ígnea 16 0.32 32
## 2 Metamórfica 16 0.32 32
## 3 Sedimentaria 18 0.36 36
Se pueden identificar tres tipos de rocas en la muestra, las Ígneas, Metamórficas y Sedimentarias, las cuales en su frecuencia absoluta que representa la cantidad de registros en la base de datos para cada tipo de roca pudimos evidenciar que hay 16 muestras de roca ígnea, 16 muestras de roca metamórfica y 18 muestras de roca sedimentaria; luego sacamos la Frecuencia Relativa que se obtiene dividiendo la frecuencia absoluta entre el total de registros, identificando que la roca ígnea y la metamórfica representan 0.32 (32%) cada una, y por otro lado la roca sedimentaria representa 0.36 (36%) del total de la muestra.
En conclusión la muestra está relativamente equilibrada entre los tres tipos de rocas, con una pequeña predominancia de rocas sedimentarias. Que quizá esto podría indicar que la región estudiada tiene una mayor proporción de este tipo de roca en comparación con las ígnas y metamórficas.
#Creamos la tabla de frecuencia
tabla_frecuencias_fosil <- as.data.frame(table(df$`Presencia de Fósiles`))
# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_fosil$Frecuencia_Relativa <- tabla_frecuencias_fosil$Freq / sum(tabla_frecuencias_fosil$Freq)
tabla_frecuencias_fosil$Porcentaje <- tabla_frecuencias_fosil$Frecuencia_Relativa * 100
# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_fosil) <- c("Presencia de fosiles", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")
tabla_frecuencias_fosil
## Presencia de fosiles Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1 No 25 0.5 50
## 2 Sí 25 0.5 50
La distribución de la presencia de fósiles es equitativa ya que se obtuvo un 50% de rocas que contienen fósiles y un 50% que no, lo que sugiere que las condiciones de preservación de materia orgánica han sido variables, probablemente dependiendo de factores ambientales y geológico específicos.
#Creamos la tabla de frecuencia
tabla_frecuencias_prof <- as.data.frame(table(df$`Profundidad (m)`))
# usamos codigos para colocar el contenido de la tabla
tabla_frecuencias_prof$Frecuencia_Relativa <- tabla_frecuencias_prof$Freq / sum(tabla_frecuencias_prof$Freq)
tabla_frecuencias_prof$Porcentaje <- tabla_frecuencias_prof$Frecuencia_Relativa * 100
# Renombrar columnas para entender mejor la información
colnames(tabla_frecuencias_prof) <- c("profundidad", "Frecuencia Absoluta", "Frecuencia Relativa", "Porcentaje")
tabla_frecuencias_prof
## profundidad Frecuencia Absoluta Frecuencia Relativa Porcentaje
## 1 85 5 0.1 10
## 2 95 5 0.1 10
## 3 120 5 0.1 10
## 4 140 5 0.1 10
## 5 150 5 0.1 10
## 6 210 5 0.1 10
## 7 230 5 0.1 10
## 8 275 5 0.1 10
## 9 300 5 0.1 10
## 10 310 5 0.1 10
Este grafico nos muestra la distribución de los tipos de roca de las muestrs analizadas, representadas mediante un diagrama circular. El diagrama nos permite identificar la proporción de cada categoría de las muestras, facilitando así el análisis de la información.
library(ggplot2)
ggplot(df, aes(x = "", fill = df$`Tipo de Roca`)) +
geom_bar(width = 1, position = "fill") +
coord_polar("y") +
theme_void() +
labs(title = "Distribución de Tipo de Roca")
## Warning: Use of `` df$`Tipo de Roca` `` is discouraged.
## ℹ Use `Tipo de Roca` instead.
#fill: Color de relleno de las barras.
#coord_polar: Convierte el gráfico a coordenadas polares (para diagramas circulares).
#theme_void: Elimina prácticamente todos los elementos visuales del gráfico, dejando solo los datos.
El histograma muestra cómo se distribuyen las profundidades del yacimiento. Hay intervalos donde la frecuencia es mayor, lo que indica que esas profundidades son más comunes. La curva de densidad suaviza la distribución, ayudando a ver de una mejor manera los datos de profundidad y densidad.
ggplot(df, aes(x = df$`Profundidad (m)`)) +
geom_histogram(aes(y = ..density..), binwidth = 10, fill = "blue", color = "black") +
geom_density(color = "red", size = 1) +
labs(title = "Histograma de Profundidad del Yacimiento",
x = "Profundidad (m)",
y = "Densidad") +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: Use of `` df$`Profundidad (m)` `` is discouraged.
## ℹ Use `Profundidad (m)` instead.
## Use of `` df$`Profundidad (m)` `` is discouraged.
## ℹ Use `Profundidad (m)` instead.
#binwidth: Define el ancho de las barras según tus datos
#linewidth = 1: Grosor de la línea.
#geom_histogram: Dibuja el histograma.
El gráfico de cajas y bigotes muestra cómo cambia la composición química de las rocas. La caja indica los valores más comunes, la línea marca la mitad de los datos y los bigotes muestran los valores más altos y bajos. Así es fácil ver las diferencias y detectar valores fuera de lo normal.
ggplot(df, aes(x = df$`Tipo de Roca`, y = df$`% de SiO2`)) +
geom_boxplot(fill = "lightblue", color = "darkblue") +
labs(title = "Diagrama de cajas de la composición química de las rocas",
x = "Tipo de Roca",
y = "Concentración del Componente") +
theme_minimal()
## Warning: Use of `` df$`Tipo de Roca` `` is discouraged.
## ℹ Use `Tipo de Roca` instead.
## Warning: Use of `` df$`% de SiO2` `` is discouraged.
## ℹ Use `% de SiO2` instead.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
resumen <- df %>%
summarise(
Min_Profundidad = min(`Profundidad (m)`),
Max_Profundidad = max(`Profundidad (m)`),
Media_Profundidad = mean(`Profundidad (m)`),
Mediana_Profundidad = median(`Profundidad (m)`),
SD_Profundidad = sd(`Profundidad (m)`),
Min_SiO2 = min(`% de SiO2`),
Max_SiO2 = max(`% de SiO2`),
Media_SiO2 = mean(`% de SiO2`),
Mediana_SiO2 = median(`% de SiO2`),
SD_SiO2 = sd(`% de SiO2`),
Min_Densidad = min(`Densidad (g/cm³)`),
Max_Densidad = max(`Densidad (g/cm³)`),
Media_Densidad = mean(`Densidad (g/cm³)`),
Mediana_Densidad = median(`Densidad (g/cm³)`),
SD_Densidad = sd(`Densidad (g/cm³)`)
)
print(resumen)
## # A tibble: 1 × 15
## Min_Profundidad Max_Profundidad Media_Profundidad Mediana_Profundidad
## <dbl> <dbl> <dbl> <dbl>
## 1 85 310 192. 180
## # ℹ 11 more variables: SD_Profundidad <dbl>, Min_SiO2 <dbl>, Max_SiO2 <dbl>,
## # Media_SiO2 <dbl>, Mediana_SiO2 <dbl>, SD_SiO2 <dbl>, Min_Densidad <dbl>,
## # Max_Densidad <dbl>, Media_Densidad <dbl>, Mediana_Densidad <dbl>,
## # SD_Densidad <dbl>
# Frecuencia absoluta
tabla_roca <- table(df$`Tipo de Roca`)
tabla_fosiles <- table(df$`Presencia de Fósiles`)
# Frecuencia relativa en porcentaje
porcentaje_roca <- prop.table(tabla_roca) * 100
porcentaje_fosiles <- prop.table(tabla_fosiles) * 100
# Mostrar resultados
tabla_roca
##
## Ígnea Metamórfica Sedimentaria
## 16 16 18
porcentaje_roca
##
## Ígnea Metamórfica Sedimentaria
## 32 32 36
tabla_fosiles
##
## No Sí
## 25 25
porcentaje_fosiles
##
## No Sí
## 50 50
#prop.table: porcentaje que representa cada valor respecto al total.
El análisis de estadísticas descriptivas ayuda a entender la composición y origen de las rocas, clave para la exploración geológica. La profundidad indica dónde se encuentran ciertos tipos de rocas, el % de sílice revela su origen magmático o sedimentario, y la densidad aporta pistas sobre su formación. La presencia de fósiles señala antiguos ambientes con vida, útiles para buscar recursos como hidrocarburos. Todo esto permite reconstruir la historia geológica y guiar la búsqueda de minerales o yacimientos.