Estadística descriptiva
Estadística para las Ciencias Sociales
Diego Solís Delgadillo
Para datos categóricos hacemos una lista de las categorías y mostramos su frecuencia
Se reportan las proporciones y porcentajes
Frecuencia relativa
Especie | Frecuencia | Proporción | Porcentaje |
---|---|---|---|
Adelie | 152 | 0.44 | 44.18 |
Chimpstrap | 68 | 0.20 | 19.76 |
Gentoo | 124 | 0.36 | 36.04 |
Total | 344 | 1.00 | 100 |
Tip
Una manera más simple de presentar los datos
Presenta formas rectangulares sobre cada categoría
Distribución de Frecuencia de body_mass_g | |||||
Class limits | f | rf | rf(%) | cf | cf(%) |
---|---|---|---|---|---|
[2673,3042) | 11.00 | 0.03 | 3.20 | 11.00 | 3.20 |
[3042,3411) | 47.00 | 0.14 | 13.66 | 58.00 | 16.86 |
[3411,3780) | 71.00 | 0.21 | 20.64 | 129.00 | 37.50 |
[3780,4149) | 53.00 | 0.15 | 15.41 | 182.00 | 52.91 |
[4149,4518) | 45.00 | 0.13 | 13.08 | 227.00 | 65.99 |
[4518,4887) | 41.00 | 0.12 | 11.92 | 268.00 | 77.91 |
[4887,5256) | 28.00 | 0.08 | 8.14 | 296.00 | 86.05 |
[5256,5625) | 26.00 | 0.08 | 7.56 | 322.00 | 93.60 |
[5625,5994) | 16.00 | 0.05 | 4.65 | 338.00 | 98.26 |
[5994,6363) | 4.00 | 0.01 | 1.16 | 342.00 | 99.42 |
Tip
Tip
Distribuciones simétricas
Distribuciones asimétricas
\[\bar{x} = \frac{\sum_{i=1}^{n} x_i}{n}\]
Donde \(n\) es el tamaño de la muestra
Tip
\[ \text{Mediana} = {\frac{n+1}{2}} \]
Important
\[ \text{Mediana} = {\frac{15+1}{2}}=8 \]
Warning
Tip
Estudios | Frecuencia | Porcentaje | Porcentaje acumulado |
---|---|---|---|
Sin preparatoria | 30 | 17.14 | 17.4 |
Preparatoria | 56 | 32 | 49.14 |
Superior trunca | 38 | 21.71 | 70.86 |
Superior | 32 | 18.28 | 89.13 |
Maestría | 13 | 7.42 | 96.55 |
Doctorado | 6 | 3.42 | 99.97 |
175 | 100 |
En distribuciones simétricas la media y la mediana son iguales
En distribuciones sesgadas, la media se encuentra en la dirección del sesgo
Tip
Generalmente es utilizada para describir variables categóricas y discretas
- La categoría o número con mayor frecuencia
Tip
Warning
Las medidas centrales nos dice el valor típico
Pero no qué tan dispersos están los valores de este punto
La figura de la derecha muestra un salario hipotético para EE.UU y Dinamarca
Tip
Tip
Warning
\(s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}}\)
\[s = \sqrt{\frac{\sum_{i=1}^{n}(x_i - \bar{x})^2}{n-1}}\]
\[s = \sqrt{\frac{14435.6}{15-1}}= 32.11\]
Tip
Important
Percentiles
Ejemplo
Cuartiles
\[ Q_{k}=\frac{k(n+1)}{4} \]
Ejemplo
\[ Q_{1}=\frac{1(11+1)}{4}= 3 \]
\[ Q_{2}=\frac{2(11+1)}{4}= 6 \]
\[ Q_{3}=\frac{3(11+1)}{4}= 9 \]
Observación | Valor | Cuartil |
---|---|---|
x1 | 14 | |
x2 | 14 | |
x3 | 15 | Q1 |
x4 | 16 | |
x5 | 17 | |
x6 | 17 | Q2 |
x7 | 18 | |
x8 | 19 | |
x9 | 21 | Q3 |
x10 | 21 | |
x11 | 23 |
\[ Q_{k}=\frac{k(n)}{4} \]
\[ Q_{1}=\frac{1(10)}{4}=2.5 \]
\[ Q_{2}=\frac{2(10)}{4}=5 \]
\[ Q_{3}=\frac{3(10)}{4}=7.5 \]
Observación | Valor | Cuartil |
---|---|---|
x1 | 14 | |
x2 | 14 | Q1=(14+15)/2= 14.5 |
x3 | 15 | |
x4 | 16 | |
x5 | 17 | Q2= (17+17)/2=17 |
x6 | 17 | |
x7 | 18 | Q3= (18+19)/2=18.5 |
x8 | 19 | |
x9 | 21 | |
x10 | 21 |
Note
Important
Ejemplo
Valor mínimo=0 Q1= 135 Mediana= 180 Q3= 205 Valor máximo= 340
\(RI= 205-135=70\)
Elementos
Valor mínimo Primer cuartil Mediana Tercer cuartil Valor máximo
Note
Warning
Los bigotes se extienden hasta el mínimo y máximo excluyendo a los outliers
Important
Note
\[ z=(\frac{x-\bar{x}}{s}) \]
\[ z=(\frac{100-84}{16})=1 \] ## Ejercicio