R es un lenguaje de programación especializado en análisis estadístico, visualización de datos y ciencia de datos. Es ampliamente utilizado en investigaciones científicas, análisis empresariales y proyectos académicos debido a su gran capacidad para procesar información y generar resultados reproducibles.
En este reporte se realizará un análisis básico utilizando el dataset iris, uno de los conjuntos de datos más conocidos en estadística y aprendizaje automático. A través de este análisis se explorará la estructura de los datos, se calcularán estadísticas descriptivas y se aplicarán fórmulas matemáticas utilizando LaTeX en Quarto.
El objetivo principal es aprender a combinar texto, código y resultados en un solo documento reproducible utilizando Quarto y R.
Tip
Aprender Quarto permite crear reportes automáticos y profesionales donde los resultados se actualizan automáticamente cada vez que cambian los datos.
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
El dataset iris contiene información sobre diferentes medidas de flores pertenecientes a tres especies distintas de iris.
Este conjunto de datos posee 150 filas y 3 especies diferentes. Las variables numéricas representan medidas del largo y ancho del sépalo y pétalo de cada flor.
3 Estadística Descriptiva
Code
promedios <- iris %>%group_by(Species) %>%summarise(Promedio_Sepal_Length =mean(Sepal.Length),Promedio_Sepal_Width =mean(Sepal.Width),Promedio_Petal_Length =mean(Petal.Length),Promedio_Petal_Width =mean(Petal.Width) )knitr::kable(promedios,caption ="Promedio de variables numéricas agrupadas por especie")
Promedio de variables numéricas agrupadas por especie
Species
Promedio_Sepal_Length
Promedio_Sepal_Width
Promedio_Petal_Length
Promedio_Petal_Width
setosa
5.006
3.428
1.462
0.246
versicolor
5.936
2.770
4.260
1.326
virginica
6.588
2.974
5.552
2.026
La tabla anterior muestra el promedio de cada variable numérica para cada especie presente en el dataset.
media <-mean(iris$Sepal.Length)desviacion <-sd(iris$Sepal.Length)coef_variacion <- (desviacion / media) *100
La media aritmética de la variable Sepal.Length es 5.84.
La desviación estándar de Sepal.Length es 0.83.
El coeficiente de variación de Sepal.Length es 14.17%.
5 Conclusión
En este reporte se utilizaron herramientas básicas de Quarto y R para desarrollar un análisis estadístico reproducible. Se exploró el dataset iris, se calcularon estadísticas descriptivas y se integraron ecuaciones matemáticas utilizando LaTeX.
Quarto facilita la creación de documentos profesionales que combinan narrativa, código y resultados en un mismo archivo, permitiendo automatizar reportes de forma eficiente.