Mi Primer Reporte Estadístico en R

Author

Adrian Rafael Guigni Guillen

Published

May 22, 2026

1 - Introducción:

R es un programa pensado para trabajar con datos, hacer cálculos estadísticos y crear gráficos. Se usa mucho en investigación, ciencia de datos, biología, economía y en cualquier área donde se analicen números o se hagan modelos.

Una de sus mayores ventajas es que permite manejar muchos datos sin volverse lento, y además es muy confiable. También tiene muchos paquetes que lo hacen aún mejor.

Tip

Mantener el código ordenado y limpio es una de las mejores prácticas tanto a corto como a largo plazo. Nos permite entender mejor el código y hace que sea mucho más fácil de mantener.

2 - Descripción Del Dataset:

Code
library(tibble)
glimpse(iris)
Rows: 150
Columns: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, 4.…
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, 3.…
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, 1.…
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, 0.…
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa, s…
Code
summary(iris)
  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
       Species  
 setosa    :50  
 versicolor:50  
 virginica :50  
                
                
                

El dataset contiene: medidas de sépalos y pétalos de 150 filas de flores y contiene 3 especies distintas.

3 — Estadística Descriptiva:

Code
# Calcule el  promedios con aggregate
tabla_datos <- aggregate(. ~ Species, data = iris, FUN = mean)

knitr::kable(tabla_datos, 
             caption = "Promedio por especie")
Promedio por especie
Species Sepal.Length Sepal.Width Petal.Length Petal.Width
setosa 5.006 3.428 1.462 0.246
versicolor 5.936 2.770 4.260 1.326
virginica 6.588 2.974 5.552 2.026

4 — Ecuaciones:

La formula de la media aritmética es: \[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i \] La formula de la desviación estándar es: \[s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}\] La formula del coeficiente de variación es: \[CV = \frac{s}{\bar{x}} \times 100\%\]

Code
media_aritm <- mean(iris$Sepal.Length)
desviacion_stndr <- sd(iris$Sepal.Length)
coeficiente_vrcn <- (desviacion_stndr / media_aritm) * 100

La media aritmética: 5.8433333

La desviación estandar: 0.8280661

El coeficiente de variación es: 14.171126