Mi Primer Reporte Estadístico en R

Author

Rubi Pineda

Published

09 Jun 2026

1 Introducción:

R es un lenguaje de programación y un entorno de software ampliamente utilizado en el análisis estadístico y la ciencia de datos. Permite realizar cálculos, visualizaciones y modelos estadísticos de forma eficiente, lo que lo convierte en una herramienta fundamental para investigadores, analistas y estudiantes.

En este reporte se utilizará R para explorar, analizar y resumir datos de manera estructurada. El objetivo principal es aplicar técnicas básicas de estadística descriptiva y visualización para comprender mejor el comportamiento de los datos.

Tip

Consejo profesional: organiza siempre tu análisis en secciones claras, como introducción, datos, análisis y conclusiones, para que tu reporte sea más fácil de leer y reproducir.

2 Descripción del Dataset:

Code
library(dplyr)

glimpse(iris)
Rows: 150
Columns: 5
$ Sepal.Length <dbl> 5.1, 4.9, 4.7, 4.6, 5.0, 5.4, 4.6, 5.0, 4.4, 4.9, 5.4, 4.…
$ Sepal.Width  <dbl> 3.5, 3.0, 3.2, 3.1, 3.6, 3.9, 3.4, 3.4, 2.9, 3.1, 3.7, 3.…
$ Petal.Length <dbl> 1.4, 1.4, 1.3, 1.5, 1.4, 1.7, 1.4, 1.5, 1.4, 1.5, 1.5, 1.…
$ Petal.Width  <dbl> 0.2, 0.2, 0.2, 0.2, 0.2, 0.4, 0.3, 0.2, 0.2, 0.1, 0.2, 0.…
$ Species      <fct> setosa, setosa, setosa, setosa, setosa, setosa, setosa, s…
Code
summary(iris)
  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
       Species  
 setosa    :50  
 versicolor:50  
 virginica :50  
                
                
                

El dataset iris presenta información sobre flores de 3 especies que son: setosa, versicolor y virginica. Tiene medidas como el largo y ancho de sus pétalos y sépalos, que son partes de la flor.

El dataset iris tiene 150 filas.

3 Estadística Descriptiva: Promedio de Cada Variable

Code
library(dplyr)

iris %>%
  group_by(Species) %>%
  summarise(
    Sepal_Length = mean(Sepal.Length),
    Sepal_Width = mean(Sepal.Width),
    Petal_Length = mean(Petal.Length),
    Petal_Width = mean(Petal.Width)
  ) %>%
  knitr::kable()
Species Sepal_Length Sepal_Width Petal_Length Petal_Width
setosa 5.006 3.428 1.462 0.246
versicolor 5.936 2.770 4.260 1.326
virginica 6.588 2.974 5.552 2.026

4 Ecuaciones

La fórmula de la Media Aritmética es \[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i \] La fórmula de la Desviación Estándar es \[ s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2} \] La fórmula del Coeficiente de Variación es \[ CV = \frac{s}{\bar{x}} \times 100\% \]

Code
Media <- mean(iris$Sepal.Length)
Desviacion_Estandar <- sd(iris$Sepal.Length)
Coeficiente_de_Variacion <- (Desviacion_Estandar/Media) * 100

Para la variable Sepal.Length, la media aritmética es 5.84, la desviación estándar es 0.83 y el coeficiente de variación es 14.17%.