R es un lenguaje de programación y un entorno de software ampliamente utilizado en el análisis estadístico y la ciencia de datos. Permite realizar cálculos, visualizaciones y modelos estadísticos de forma eficiente, lo que lo convierte en una herramienta fundamental para investigadores, analistas y estudiantes.
En este reporte se utilizará R para explorar, analizar y resumir datos de manera estructurada. El objetivo principal es aplicar técnicas básicas de estadística descriptiva y visualización para comprender mejor el comportamiento de los datos.
Tip
Consejo profesional: organiza siempre tu análisis en secciones claras, como introducción, datos, análisis y conclusiones, para que tu reporte sea más fácil de leer y reproducir.
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
El dataset iris presenta información sobre flores de 3 especies que son: setosa, versicolor y virginica. Tiene medidas como el largo y ancho de sus pétalos y sépalos, que son partes de la flor.
El dataset iris tiene 150 filas.
3 Estadística Descriptiva: Promedio de Cada Variable
La fórmula de la Media Aritmética es \[
\bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i
\] La fórmula de la Desviación Estándar es \[
s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}
\] La fórmula del Coeficiente de Variación es \[
CV = \frac{s}{\bar{x}} \times 100\%
\]
Code
Media <-mean(iris$Sepal.Length)Desviacion_Estandar <-sd(iris$Sepal.Length)Coeficiente_de_Variacion <- (Desviacion_Estandar/Media) *100
Para la variable Sepal.Length, la media aritmética es 5.84, la desviación estándar es 0.83 y el coeficiente de variación es 14.17%.