R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

summary(cars)
##      speed           dist       
##  Min.   : 4.0   Min.   :  2.00  
##  1st Qu.:12.0   1st Qu.: 26.00  
##  Median :15.0   Median : 36.00  
##  Mean   :15.4   Mean   : 42.98  
##  3rd Qu.:19.0   3rd Qu.: 56.00  
##  Max.   :25.0   Max.   :120.00

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.

##Estadistica Descriptiva

Te lo voy a explicar paso a paso, claro y aplicado, como a ti te gusta 💛 La estadística descriptiva sirve para resumir, organizar y entender datos, pero sin sacar conclusiones generales (eso ya es estadística inferencial).

En R es MUY práctica porque casi todo ya viene con funciones listas.


📊 1. ¿Qué es la estadística descriptiva?

Se divide en 3 partes principales:

  1. Medidas de tendencia central
  2. Medidas de dispersión
  3. Medidas de posición
  4. Representaciones gráficas

Vamos con ejemplos en R 👇


🔢 Supongamos estos datos

Ejemplo: notas de 10 estudiantes

notas <- c(3.5, 4.0, 2.8, 4.5, 3.9, 3.2, 4.8, 2.5, 3.7, 4.1)

1️⃣ Medidas de tendencia central

📌 Media (promedio)

Fórmula: [ {x} = ]

En R:

mean(notas)

👉 Resultado: promedio del grupo.


📌 Mediana

Es el valor que queda en el centro cuando ordenamos los datos.

median(notas)

💡 Importante: La mediana no se afecta tanto por valores extremos.


📌 Moda

R no trae función directa, pero la puedes crear:

moda <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

moda(notas)

2️⃣ Medidas de dispersión

Nos dicen qué tan separados están los datos.


📌 Rango

[ R = max - min]

max(notas) - min(notas)

📌 Varianza

Mide qué tanto se alejan los datos de la media.

var(notas)

📌 Desviación estándar

Es la raíz de la varianza.

sd(notas)

💡 Si es pequeña → los datos están concentrados 💡 Si es grande → están muy dispersos


3️⃣ Medidas de posición


📌 Cuartiles

Dividen los datos en 4 partes.

quantile(notas)

Te da:

  • Q1 (25%)
  • Q2 (mediana)
  • Q3 (75%)

📌 Percentiles

quantile(notas, probs = 0.90)

Eso te da el percentil 90.


4️⃣ Resumen completo automático

R tiene una función que te resume TODO:

summary(notas)

Te da:


📈 Gráficas en estadística descriptiva

📌 Histograma

hist(notas)

Sirve para ver la distribución.


📌 Diagrama de caja (Boxplot)

boxplot(notas)

Te muestra:

  • Mediana
  • Cuartiles
  • Valores atípicos

🎯 Ejemplo aplicado a tu contexto (emprendimiento)

Supón que quieres analizar ventas diarias:

ventas <- c(25, 30, 28, 35, 40, 20, 22, 38, 33, 29)

summary(ventas)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   25.75   29.50   30.00   34.50   40.00
sd(ventas)
## [1] 6.599663
boxplot(ventas)

Así puedes saber:

Eso es estadística descriptiva aplicada a negocio real 🔥


📌 En resumen

La estadística descriptiva en R consiste en:


Tú dime qué necesitas 💛