El lenguaje de programacion R es uno de los entornos más potentes y utilizados a nivel mundial para el análisis estadístico, la minería de datos y la investigación científica. Gracias a su naturaleza de código abierto, cuenta con una comunidad global activa que desarrolla continuamente paquetes especializados, facilitando desde la manipulación de datos en bruto hasta la creación de gráficos de alta calidad listos para publicación.En este documento, utilizaremos R para realizar un análisis exploratorio de datos básico. El objetivo principal es demostrar las capacidades de Quarto para integrar de forma fluida el código de programación, los resultados estadísticos, las fórmulas matemáticas y la narrativa textual en un único reporte completamente reproducible.
TipConsejo para el lector
Al explorar un dataset por primera vez, siempre es buena idea revisar su estructura general antes de realizar cualquier cálculo estadístico complejo.
1 Descripción del Dataset
Code
library(dplyr)# Estructura del datasetglimpse(iris)
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
El dataset contiene 150 filas y evalúa un total de 3 especies distintas de flores del género Iris.
Code
library(dplyr)library(knitr)iris_promedios <- iris %>%group_by(Species) %>%summarise(Promedio_Sepal_Length =mean(Sepal.Length),Promedio_Sepal_Width =mean(Sepal.Width),Promedio_Petal_Length =mean(Petal.Length),Promedio_Petal_Width =mean(Petal.Width) )kable(iris_promedios, caption ="Promedio de variables numéricas por especie de Iris")
Promedio de variables numéricas por especie de Iris
Species
Promedio_Sepal_Length
Promedio_Sepal_Width
Promedio_Petal_Length
Promedio_Petal_Width
setosa
5.006
3.428
1.462
0.246
versicolor
5.936
2.770
4.260
1.326
virginica
6.588
2.974
5.552
2.026
##Ecuaciones
\[
\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}
\]
\[
s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}}
\]