¿Cuál es la población objetivo?
¿Existe una muestra? ¿Cuál es?
Mencione un parámetro y un estadístico en este estudio, si es posible.
Clasifique cada una de las variables de acuerdo con su naturaleza y nivel de medición.
Solución
La población objetivo en este estudio serían todas las rocas presentes en la región o zona geológica de interés para la exploración y explotación de recursos naturales.
En este caso, la muestra son las 20 rocas donde se tomaron los datos.
En el estudio, se está trabajando con un estadístico en lugar de un parámetro porque estamos trabajando con una muestra, no con toda la población (ya que no que está evaluando con la totalidad de las capas de rocas en la Tierra), por ende, los valores calculados a partir de estos datos, es decir la media de densidad, el porcentaje promedio de SiO₂, la profundidad, el tipo de roca, presencia de fósiles, son estadísticos.
# Decidimos crear una tabla para la respuesta del punto 4
tabla_variables <- data.frame(
Variable = c("Profundidad del yacimiento", "Composición química (% de SiO2)",
"Tipo de roca", "Presencia de fósiles", "Densidad de mineral (g/cm³)"),
Naturaleza = c("Cuantitativa", "Cuantitativa", "Cualitativa", "Cualitativa", "Cuantitativa"),
Nivel_de_Medicion = c("Razón", "Razón", "Nominal", "Nominal", "Razón")
)
# Aquí mostramos la tabla
print(tabla_variables)
## Variable Naturaleza Nivel_de_Medicion
## 1 Profundidad del yacimiento Cuantitativa Razón
## 2 Composición química (% de SiO2) Cuantitativa Razón
## 3 Tipo de roca Cualitativa Nominal
## 4 Presencia de fósiles Cualitativa Nominal
## 5 Densidad de mineral (g/cm³) Cuantitativa Razón
5. Organización de datos en tablas de frecuencia
# Cargar paquetes necesarios
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(ggplot2)
# Crear el dataframe
datos <- data.frame(
ID = 1:20,
Profundidad_m = c(120, 230, 85, 150, 300, 210, 95, 275, 140, 310,
120, 230, 85, 150, 300, 210, 95, 275, 140, 310),
Tipo_de_Roca = c("Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea",
"Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria",
"Ígnea", "Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica",
"Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea"),
Presencia_de_Fósiles = c("Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No",
"Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No"),
Region_Geologica = c("Norte", "Sur", "Este", "Oeste", "Norte", "Sur", "Este", "Oeste", "Norte", "Sur",
"Este", "Oeste", "Norte", "Sur", "Este", "Oeste", "Norte", "Sur", "Este", "Oeste"),
SiO2 = c(65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3,
65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3)
)
# Tablas de frecuencia para variables categóricas
tabla_tipo_roca <- as.data.frame(table(datos$Tipo_de_Roca))
names(tabla_tipo_roca) <- c("Tipo de Roca", "Frecuencia")
tabla_fosiles <- as.data.frame(table(datos$Presencia_de_Fósiles))
names(tabla_fosiles) <- c("Presencia de Fósiles", "Frecuencia")
tabla_region <- as.data.frame(table(datos$Region_Geologica))
names(tabla_region) <- c("Región Geológica", "Frecuencia")
# Tabla de frecuencia agrupada para la variable Profundidad
datos$Intervalo_Profundidad <- cut(datos$Profundidad_m,
breaks = c(0, 100, 200, 300, 400),
labels = c("0-100", "101-200", "201-300", "301-400"),
include.lowest = TRUE)
tabla_profundidad <- as.data.frame(table(datos$Intervalo_Profundidad))
names(tabla_profundidad) <- c("Intervalo de Profundidad", "Frecuencia")
# Imprimir tablas
tabla_tipo_roca
## Tipo de Roca Frecuencia
## 1 Ígnea 7
## 2 Metamórfica 6
## 3 Sedimentaria 7
tabla_fosiles
## Presencia de Fósiles Frecuencia
## 1 No 10
## 2 Sí 10
tabla_region
## Región Geológica Frecuencia
## 1 Este 5
## 2 Norte 5
## 3 Oeste 5
## 4 Sur 5
tabla_profundidad
## Intervalo de Profundidad Frecuencia
## 1 0-100 4
## 2 101-200 6
## 3 201-300 8
## 4 301-400 2
Distribución del Tipo de Roca: La mayoría de las muestras están equilibradas entre rocas sedimentarias, ígneas y metamórficas, lo que significa que tenemos una diversidad geológica en la zona.
Presencia de Fósiles: La cantidad de muestras con fósiles es igual a las que no los tienen, indicando que la formacion incluye unidades de roca que se formaron en diferentes momentos del tiempo geologico.
Región Geológica: Las muestras están distribuidas de forma equitativa entre las cuatro regiones (Norte, Sur, Este y Oeste), lo que permite analizar cada region.
Profundidad del Yacimiento: La mayoría de los yacimientos se encuentran entre 101 y 300 metros de profundidad, lo que nos podria ser util para una futura extracción de recursos.
6. Organización de datos en gráficos
# Gráfico 1: Diagrama circular de Tipo de Roca con solo porcentajes
tabla_tipo_roca$Porcentaje <- round(tabla_tipo_roca$Frecuencia / sum(tabla_tipo_roca$Frecuencia) * 100, 1)
ggplot(tabla_tipo_roca, aes(x = "", y = Frecuencia, fill = `Tipo de Roca`)) +
geom_bar(stat = "identity", width = 1) +
coord_polar("y", start = 0) +
labs(title = "Distribución de Tipos de Roca", fill = "Tipo de Roca") +
theme_minimal() +
geom_text(aes(label = paste0(Porcentaje, "%")),
position = position_stack(vjust = 0.5), size = 5)
# Gráfico 2: Histograma de profundidad con polígono de frecuencia
ggplot(datos, aes(x = Profundidad_m)) +
geom_histogram(binwidth = 50, fill = "skyblue", color = "black", alpha = 0.7) +
geom_density(aes(y = ..count.. * 50), color = "red", size = 1) +
labs(title = "Histograma de la Profundidad del Yacimiento", x = "Profundidad (m)", y = "Frecuencia") +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
# Gráfico 3: Diagrama de cajas y bigotes para el % de SiO2
ggplot(datos, aes(y = SiO2)) +
geom_boxplot(fill = "lightcoral") +
labs(title = "Diagrama de Cajas y Bigotes para el % de SiO2", y = "% de SiO2") +
theme_minimal()
7. Cálculo de estadísticas descriptivas
# Cargar paquetes necesarios
library(dplyr)
# Crear el dataframe con los datos proporcionados
datos <- data.frame(
ID = 1:20,
Profundidad_m = c(120, 230, 85, 150, 300, 210, 95, 275, 140, 310,
120, 230, 85, 150, 300, 210, 95, 275, 140, 310),
Tipo_de_Roca = c("Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea",
"Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria",
"Ígnea", "Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica",
"Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea"),
SiO2 = c(65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3,
65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3),
Densidad_gcm3 = c(2.65, 2.7, 2.75, 2.68, 2.6, 2.72, 2.66, 2.71, 2.64, 2.69,
2.65, 2.7, 2.75, 2.68, 2.6, 2.72, 2.66, 2.71, 2.64, 2.69),
Presencia_de_Fósiles = c("Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No",
"Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No")
)
# Cálculo de estadísticas descriptivas para variables cuantitativas
estadisticas <- datos %>%
summarise(
Min_Profundidad = min(Profundidad_m),
Max_Profundidad = max(Profundidad_m),
Media_Profundidad = mean(Profundidad_m),
Mediana_Profundidad = median(Profundidad_m),
SD_Profundidad = sd(Profundidad_m),
Min_SiO2 = min(SiO2),
Max_SiO2 = max(SiO2),
Media_SiO2 = mean(SiO2),
Mediana_SiO2 = median(SiO2),
SD_SiO2 = sd(SiO2),
Min_Densidad = min(Densidad_gcm3),
Max_Densidad = max(Densidad_gcm3),
Media_Densidad = mean(Densidad_gcm3),
Mediana_Densidad = median(Densidad_gcm3),
SD_Densidad = sd(Densidad_gcm3)
)
# Tablas de frecuencia para variables cualitativas
tabla_tipo_roca <- as.data.frame(table(datos$Tipo_de_Roca))
names(tabla_tipo_roca) <- c("Tipo de Roca", "Frecuencia")
tabla_fosiles <- as.data.frame(table(datos$Presencia_de_Fósiles))
names(tabla_fosiles) <- c("Presencia de Fósiles", "Frecuencia")
#
# Crear el dataframe con los datos proporcionados
datos <- data.frame(
ID = 1:20,
Profundidad_m = c(120, 230, 85, 150, 300, 210, 95, 275, 140, 310,
120, 230, 85, 150, 300, 210, 95, 275, 140, 310),
Tipo_de_Roca = c("Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea",
"Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria",
"Ígnea", "Metamórfica", "Sedimentaria", "Ígnea", "Metamórfica",
"Sedimentaria", "Ígnea", "Metamórfica", "Sedimentaria", "Ígnea"),
SiO2 = c(65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3,
65.2, 72.4, 68.3, 71.1, 62.0, 69.5, 66.8, 73.0, 64.5, 70.3),
Densidad_gcm3 = c(2.65, 2.7, 2.75, 2.68, 2.6, 2.72, 2.66, 2.71, 2.64, 2.69,
2.65, 2.7, 2.75, 2.68, 2.6, 2.72, 2.66, 2.71, 2.64, 2.69),
Presencia_de_Fósiles = c("Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No",
"Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No", "Sí", "No")
)
# Cálculo de estadísticas descriptivas para variables cuantitativas
estadisticas <- datos %>%
summarise(
Min_Profundidad = min(Profundidad_m),
Max_Profundidad = max(Profundidad_m),
Media_Profundidad = mean(Profundidad_m),
Mediana_Profundidad = median(Profundidad_m),
SD_Profundidad = sd(Profundidad_m),
Min_SiO2 = min(SiO2),
Max_SiO2 = max(SiO2),
Media_SiO2 = mean(SiO2),
Mediana_SiO2 = median(SiO2),
SD_SiO2 = sd(SiO2),
Min_Densidad = min(Densidad_gcm3),
Max_Densidad = max(Densidad_gcm3),
Media_Densidad = mean(Densidad_gcm3),
Mediana_Densidad = median(Densidad_gcm3),
SD_Densidad = sd(Densidad_gcm3)
)
# Tablas de frecuencia para variables cualitativas
tabla_tipo_roca <- as.data.frame(table(datos$Tipo_de_Roca))
names(tabla_tipo_roca) <- c("Tipo de Roca", "Frecuencia")
tabla_fosiles <- as.data.frame(table(datos$Presencia_de_Fósiles))
names(tabla_fosiles) <- c("Presencia de Fósiles", "Frecuencia")
print(estadisticas)
## Min_Profundidad Max_Profundidad Media_Profundidad Mediana_Profundidad
## 1 85 310 191.5 180
## SD_Profundidad Min_SiO2 Max_SiO2 Media_SiO2 Mediana_SiO2 SD_SiO2
## 1 82.55939 62 73 68.31 68.9 3.526874
## Min_Densidad Max_Densidad Media_Densidad Mediana_Densidad SD_Densidad
## 1 2.6 2.75 2.68 2.685 0.04255028
print(tabla_tipo_roca)
## Tipo de Roca Frecuencia
## 1 Ígnea 7
## 2 Metamórfica 6
## 3 Sedimentaria 7
print(tabla_fosiles)
## Presencia de Fósiles Frecuencia
## 1 No 10
## 2 Sí 10
Interpretación geológica
Los datos estadísticos obtenidos permiten identificar tendencias en la composición mineral y las profundidades a las que se encuentran ciertos tipos de rocas. Las estadísticas descriptivas ayudan a determinar la variabilidad de la profundidad de los yacimientos, la distribución del contenido de SiO2 y la densidad de los minerales, lo que es útil para inferir condiciones geológicas y potencial de exploración. Las tablas de frecuencia permiten entender la proporción de tipos de roca y la presencia de fósiles, lo que puede indicar procesos sedimentarios o eventos metamórficos relevantes para la exploración de recursos.