R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

¡Claro! La estadística descriptiva es la rama de la estadística que se encarga de resumir, organizar y presentar los datos de manera informativa.

En lugar de intentar sacar conclusiones sobre una población entera (eso lo hace la estadística inferencial), la descriptiva simplemente nos dice qué hay en el conjunto de datos que tenemos delante. Se basa principalmente en tres pilares:

  1. Medidas de tendencia central: ¿Dónde está el centro? (Media, mediana, moda).
  2. Medidas de dispersión: ¿Qué tan regados están los datos? (Desviación estándar, rango, varianza).
  3. Visualización: Histogramas, diagramas de caja (boxplots), etc.

Ejemplo Práctico: Notas de un examen

Imagina que tienes las notas de 10 estudiantes en un examen (del 1 al 10).

Código en R

Aquí tienes cómo calcular lo básico y generar un gráfico rápido:

# 1. Crear el conjunto de datos (las notas)
notas <- c(8, 7, 9, 10, 5, 6, 8, 7, 8, 4)

# 2. Medidas de Tendencia Central
media <- mean(notas)      # Promedio
mediana <- median(notas)  # El valor central
moda <- as.numeric(names(sort(table(notas), decreasing = TRUE)[1])) # El que más se repite

# 3. Medidas de Dispersión
desviacion <- sd(notas)   # Qué tanto varían respecto al promedio

# 4. Mostrar resultados
print(paste("Media:", media))
print(paste("Mediana:", mediana))
print(paste("Moda:", moda))
print(paste("Desviación Estándar:", round(desviacion, 2)))

# 5. Visualización simple
hist(notas, main="Distribución de Notas", col="skyblue", xlab="Calificaciones")

¿Qué nos dice esto?

  • Si la media es 7.2, sabemos que al grupo le fue bien en general.
  • Si la desviación estándar es baja, significa que casi todos sacaron notas parecidas; si es alta, hubo algunos que sacaron 10 y otros que reprobaron feo.

¿Te gustaría que te ayude a interpretar algún conjunto de datos específico o que profundicemos en cómo hacer gráficos más avanzados con ggplot2?