This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.
When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:
summary(cars)
## speed dist
## Min. : 4.0 Min. : 2.00
## 1st Qu.:12.0 1st Qu.: 26.00
## Median :15.0 Median : 36.00
## Mean :15.4 Mean : 42.98
## 3rd Qu.:19.0 3rd Qu.: 56.00
## Max. :25.0 Max. :120.00
You can also embed plots, for example:
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.
##Estadistica Descriptiva
Te lo voy a explicar paso a paso, claro y aplicado, como a ti te gusta 💛 La estadística descriptiva sirve para resumir, organizar y entender datos, pero sin sacar conclusiones generales (eso ya es estadística inferencial).
En R es MUY práctica porque casi todo ya viene con funciones listas.
Se divide en 3 partes principales:
Vamos con ejemplos en R 👇
Ejemplo: notas de 10 estudiantes
notas <- c(3.5, 4.0, 2.8, 4.5, 3.9, 3.2, 4.8, 2.5, 3.7, 4.1)
Fórmula: [ {x} = ]
En R:
mean(notas)
👉 Resultado: promedio del grupo.
Es el valor que queda en el centro cuando ordenamos los datos.
median(notas)
💡 Importante: La mediana no se afecta tanto por valores extremos.
R no trae función directa, pero la puedes crear:
moda <- function(x) {
ux <- unique(x)
ux[which.max(tabulate(match(x, ux)))]
}
moda(notas)
Nos dicen qué tan separados están los datos.
[ R = max - min]
max(notas) - min(notas)
Mide qué tanto se alejan los datos de la media.
var(notas)
Es la raíz de la varianza.
sd(notas)
💡 Si es pequeña → los datos están concentrados 💡 Si es grande → están muy dispersos
Dividen los datos en 4 partes.
quantile(notas)
Te da:
quantile(notas, probs = 0.90)
Eso te da el percentil 90.
R tiene una función que te resume TODO:
summary(notas)
Te da:
hist(notas)
Sirve para ver la distribución.
boxplot(notas)
Te muestra:
Supón que quieres analizar ventas diarias:
ventas <- c(25, 30, 28, 35, 40, 20, 22, 38, 33, 29)
summary(ventas)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 20.00 25.75 29.50 30.00 34.50 40.00
sd(ventas)
## [1] 6.599663
boxplot(ventas)
Así puedes saber:
Eso es estadística descriptiva aplicada a negocio real 🔥
La estadística descriptiva en R consiste en:
Crear el vector de datos
Usar funciones como:
mean()median()var()sd()quantile()summary()hist()boxplot()Tú dime qué necesitas 💛