Mi Primer Reporte Estadístico en R

Author

Keyra Wagner

Published

June 10, 2026

##Introduccion

El lenguaje de programacion R es uno de los entornos más potentes y utilizados a nivel mundial para el análisis estadístico, la minería de datos y la investigación científica. Gracias a su naturaleza de código abierto, cuenta con una comunidad global activa que desarrolla continuamente paquetes especializados, facilitando desde la manipulación de datos en bruto hasta la creación de gráficos de alta calidad listos para publicación.En este documento, utilizaremos R para realizar un análisis exploratorio de datos básico. El objetivo principal es demostrar las capacidades de Quarto para integrar de forma fluida el código de programación, los resultados estadísticos, las fórmulas matemáticas y la narrativa textual en un único reporte completamente reproducible.

Consejo para el lector

Al explorar un dataset por primera vez, siempre es buena idea revisar su estructura general antes de realizar cualquier cálculo estadístico complejo.

1 Descripción del Dataset

Code

library(dplyr)

# Estructura del dataset
glimpse(iris)

Rows: 150
Columns: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, 4.…
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, 3.…
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, 1.…
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, 0.…
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa, s…

Code

# Resumen estadístico
summary(iris)

  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
       Species  
 setosa    :50  
 versicolor:50  
 virginica :50

El dataset contiene 150 filas y evalúa un total de 3 especies distintas de flores del género Iris.

Code

library(dplyr)
library(knitr)

iris_promedios <- iris %>%
  group_by(Species) %>%
  summarise(
    Promedio_Sepal_Length = mean(Sepal.Length),
    Promedio_Sepal_Width = mean(Sepal.Width),
    Promedio_Petal_Length = mean(Petal.Length),
    Promedio_Petal_Width = mean(Petal.Width)
  )

kable(iris_promedios, caption = "Promedio de variables numéricas por especie de Iris")

Promedio de variables numéricas por especie de Iris
Species	Promedio_Sepal_Length	Promedio_Sepal_Width	Promedio_Petal_Length	Promedio_Petal_Width
setosa	5.006	3.428	1.462	0.246
versicolor	5.936	2.770	4.260	1.326
virginica	6.588	2.974	5.552	2.026

##Ecuaciones

\[ \bar{x} = \frac{\sum_{i=1}^{n} x_i}{n} \]

\[ s = \sqrt{\frac{\sum_{i=1}^{n} (x_i - \bar{x})^2}{n - 1}} \]

\[ CV = \left( \frac{s}{\bar{x}} \right) \times 100 \]