Mi Primer Reporte Estadístico en R

Author

Adrian Rafael Guigni Guillen

Published

June 11, 2026

1 - Introducción:

R es un programa pensado para trabajar con datos, hacer cálculos estadísticos y crear gráficos. Se usa mucho en investigación, ciencia de datos, biología, economía y en cualquier área donde se analicen números o se hagan modelos.

Una de sus mayores ventajas es que permite manejar muchos datos sin volverse lento, y además es muy confiable. También tiene muchos paquetes que lo hacen aún mejor.

Tip

Mantener el código ordenado y limpio es una de las mejores prácticas tanto a corto como a largo plazo. Nos permite entender mejor el código y hace que sea mucho más fácil de mantener.

2 - Descripción Del Dataset:

Code
library(tibble)
#glimpse(iris)

knitr::kable(
  head(iris, 10),
  caption = "Primeras 10 observaciones del dataset Iris",
  digits = 2,
  align = "c")
Primeras 10 observaciones del dataset Iris
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
5.1 3.5 1.4 0.2 setosa
4.9 3.0 1.4 0.2 setosa
4.7 3.2 1.3 0.2 setosa
4.6 3.1 1.5 0.2 setosa
5.0 3.6 1.4 0.2 setosa
5.4 3.9 1.7 0.4 setosa
4.6 3.4 1.4 0.3 setosa
5.0 3.4 1.5 0.2 setosa
4.4 2.9 1.4 0.2 setosa
4.9 3.1 1.5 0.1 setosa
Code
knitr::kable(
  as.data.frame(summary(iris)),
  caption = "Resumen estadístico del dataset Iris",
  align = "c")
Resumen estadístico del dataset Iris
Var1 Var2 Freq
Sepal.Length Min. :4.300
Sepal.Length 1st Qu.:5.100
Sepal.Length Median :5.800
Sepal.Length Mean :5.843
Sepal.Length 3rd Qu.:6.400
Sepal.Length Max. :7.900
Sepal.Width Min. :2.000
Sepal.Width 1st Qu.:2.800
Sepal.Width Median :3.000
Sepal.Width Mean :3.057
Sepal.Width 3rd Qu.:3.300
Sepal.Width Max. :4.400
Petal.Length Min. :1.000
Petal.Length 1st Qu.:1.600
Petal.Length Median :4.350
Petal.Length Mean :3.758
Petal.Length 3rd Qu.:5.100
Petal.Length Max. :6.900
Petal.Width Min. :0.100
Petal.Width 1st Qu.:0.300
Petal.Width Median :1.300
Petal.Width Mean :1.199
Petal.Width 3rd Qu.:1.800
Petal.Width Max. :2.500
Species setosa :50
Species versicolor:50
Species virginica :50
Species NA
Species NA
Species NA

El dataset contiene: medidas de sépalos y pétalos de 150 filas de flores y contiene 3 especies distintas.

3 - Estadística Descriptiva:

Code
# Calcule el promedio con aggregate
tabla_datos <- aggregate(. ~ Species, data = iris, FUN = mean)

knitr::kable(
  tabla_datos,
  caption = "Promedio por especie",
  digits = 2,
  align = "c"
)
Promedio por especie
Species Sepal.Length Sepal.Width Petal.Length Petal.Width
setosa 5.01 3.43 1.46 0.25
versicolor 5.94 2.77 4.26 1.33
virginica 6.59 2.97 5.55 2.03

4 - Ecuaciones:

La formula de la media aritmética es:

\[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i \]

La formula de la desviación estándar es:

\[s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}\]

La formula del coeficiente de variación es:

\[CV = \frac{s}{\bar{x}} \times 100\%\]

Code
media_aritm <- mean(iris$Sepal.Length)
desviacion_stndr <- sd(iris$Sepal.Length)
coeficiente_vrcn <- (desviacion_stndr / media_aritm) * 100

La media aritmética: 5.84

La desviación estándar: 0.83

El coeficiente de variación es: 14.17 %