R es un programa pensado para trabajar con datos, hacer cálculos estadísticos y crear gráficos. Se usa mucho en investigación, ciencia de datos, biología, economía y en cualquier área donde se analicen números o se hagan modelos.
Una de sus mayores ventajas es que permite manejar muchos datos sin volverse lento, y además es muy confiable. También tiene muchos paquetes que lo hacen aún mejor.
Tip
Mantener el código ordenado y limpio es una de las mejores prácticas tanto a corto como a largo plazo. Nos permite entender mejor el código y hace que sea mucho más fácil de mantener.
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
El dataset contiene: medidas de sépalos y pétalos de 150 filas de flores y contiene 3 especies distintas.
3 — Estadística Descriptiva:
Code
# Calcule el promedios con aggregatetabla_datos <-aggregate(. ~ Species, data = iris, FUN = mean)knitr::kable(tabla_datos, caption ="Promedio por especie")
Promedio por especie
Species
Sepal.Length
Sepal.Width
Petal.Length
Petal.Width
setosa
5.006
3.428
1.462
0.246
versicolor
5.936
2.770
4.260
1.326
virginica
6.588
2.974
5.552
2.026
4 — Ecuaciones:
La formula de la media aritmética es: \[ \bar{x} = \frac{1}{n}\sum_{i=1}^{n} x_i \] La formula de la desviación estándar es: \[s = \sqrt{\frac{1}{n-1}\sum_{i=1}^{n}(x_i - \bar{x})^2}\] La formula del coeficiente de variación es: \[CV = \frac{s}{\bar{x}} \times 100\%\]