This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
La estadística descriptiva es una rama de la estadística que se encarga de resumir, organizar y presentar datos de manera clara, sin hacer inferencias ni predicciones. Su objetivo es mostrar cómo se comportan los datos mediante medidas numéricas y representaciones gráficas.
Se divide en varias categorías:
Supongamos que tenemos un conjunto de datos de edades:
# Datos de ejemplo
edades <- c(18, 20, 22, 19, 21, 20, 23, 25, 19, 20)
# Medidas de tendencia central
mean(edades) # Media
median(edades) # Mediana
# Medidas de dispersión
var(edades) # Varianza
sd(edades) # Desviación estándar
range(edades) # Rango (mínimo y máximo)
# Resumen completo
summary(edades)
Salida esperada: - Media ≈ 20.7
- Mediana = 20
- Varianza ≈ 4.23
- Desviación estándar ≈ 2.05
- Rango = 18 a 25
- El summary() muestra mínimo, cuartiles y máximo.
dplyr y tidyverseSi trabajamos con un data frame:
library(dplyr)
# Ejemplo con datos ficticios
datos <- data.frame(
nombre = c("Ana", "Luis", "María", "Pedro", "Sofía"),
edad = c(22, 25, 20, 23, 21),
peso = c(55, 70, 60, 80, 58)
)
# Estadísticas descriptivas por variable
datos %>%
summarise(
media_edad = mean(edad),
mediana_edad = median(edad),
sd_peso = sd(peso),
max_peso = max(peso)
)
Esto devuelve un resumen con la media y mediana de edad, y la desviación estándar y máximo del peso.
La estadística descriptiva en R es muy flexible: puedes usar
funciones básicas (mean, sd,
summary) o paquetes más avanzados como
skimr,
summarytools o
Hmisc para obtener reportes completos.
¿Quieres que te prepare un ejemplo aplicado a datos agrícolas (por ejemplo, rendimientos de cultivos), para que lo veas en un contexto más cercano a tu carrera?