| ID | EDAD | ID | EDAD | ID | EDAD | ID | EDAD |
|---|---|---|---|---|---|---|---|
| CLT-01 | 61 | CLT-11 | 44 | CLT-21 | 53 | CLT-31 | 71 |
| CLT-02 | 46 | CLT-12 | 48 | CLT-22 | 50 | CLT-32 | 50 |
| CLT-03 | 66 | CLT-13 | 65 | CLT-23 | 54 | CLT-33 | 57 |
| CLT-04 | 42 | CLT-14 | 49 | CLT-24 | 64 | CLT-34 | 55 |
| CLT-05 | 89 | CLT-15 | 57 | CLT-25 | 73 | CLT-35 | 63 |
| CLT-06 | 63 | CLT-16 | 66 | CLT-26 | 61 | CLT-36 | 60 |
| CLT-07 | 49 | CLT-17 | 63 | CLT-27 | 53 | CLT-37 | 50 |
| CLT-08 | 64 | CLT-18 | 64 | CLT-28 | 73 | CLT-38 | 64 |
| CLT-09 | 64 | CLT-19 | 50 | CLT-29 | 68 | CLT-39 | 63 |
| CLT-10 | 72 | CLT-20 | 58 | CLT-30 | 55 | CLT-40 | 65 |
¿Cuál es la mejor manera de describir estos resultados?
El principal interés en la exploración y descripción de variables cuantitativas se enfoca en dos puntos:
Su objetivo es tener una visión adecuada de los datos.
Tabla 1. Edades de pacientes
| 18 | 22 | 24 | 26 | 27 | 29 | 30 | 32 | 37 | 40 | 43 | 47 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 19 | 23 | 24 | 26 | 27 | 29 | 31 | 33 | 37 | 40 | 43 | 48 |
| 20 | 23 | 25 | 26 | 28 | 29 | 31 | 34 | 37 | 40 | 44 | 48 |
| 21 | 23 | 25 | 27 | 28 | 30 | 31 | 34 | 38 | 41 | 45 | 48 |
| 22 | 24 | 26 | 27 | 28 | 30 | 31 | 34 | 38 | 41 | 45 | 49 |
| 22 | 24 | 26 | 27 | 29 | 30 | 32 | 36 | 39 | 42 | 46 | 50 |
| 30 | 33 | 37 | 40 | 43 | 47 | 51 | 31 | 33 | 37 | 40 | 44 |
¿Es una representación adecuada?
Se gana rapidez pero se pierde exactitud conforme aumentan las clases
El número de clases es una desición del responsable del estudio, aunque pueden emplearse formulas y guías
Se puede estimar frecuencia absoluta, frecuencia relativa, frecuencia acumulada etc.
| Clases | Intervalos de clase | \(fa\) | \(fr\) | \(Fa\) | \(Fr\) |
|---|---|---|---|---|---|
| C1 | 10.5-16-5 | 5 | 0.17 | 5 | 0.17 |
| C2 | 16.6-22.5 | 3 | 0.10 | 8 | 0.27 |
| C3 | 22.4-28.5 | 7 | 0.23 | 15 | 0.50 |
| C4 | 28.4-34.5 | 7 | 0.23 | 22 | 0.73 |
| C5 | 34.4-40.5 | 5 | 0.90 | 27 | 0.90 |
| C6 | 40.5-46.5 | 3 | 0.10 | 30 | 1.00 |
¿Cuáles son las principales caracteristicas de esta tabla? ¿Qué le hace falta?
| Intervalos de clase | Frecuencia | Frecuencia acumulada | Frecuencia relativa | Frecuenci relativa acumulada |
|---|---|---|---|---|
| 10-19 | 4 | 4 | 0.0237 | 0.0237 |
| 20-29 | 66 | 70 | 0.3905 | 0.4142 |
| 30-39 | 47 | 117 | 0.2781 | 0.6923 |
| 40-49 | 36 | 153 | 0.2130 | 0.9054 |
| 50-59 | 12 | 165 | 0.0710 | 0.9764 |
| 60-69 | 4 | 169 | 0.0237 | 1.0000 |
| Total | 169 | 1.0000 |
La representación gráfica de variables cuantitativas puede ser muy variada. Los gráficos que más se utilizan son:
Dado el siguiente conjunto de datos realice un histograma en la consola de \(R\)
| 18 | 22 | 24 | 26 | 27 | 29 | 30 | 32 | 37 | 40 | 43 | 47 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 19 | 23 | 24 | 26 | 27 | 29 | 31 | 33 | 37 | 40 | 43 | 48 |
| 20 | 23 | 25 | 26 | 28 | 29 | 24 | 26 | 27 | 29 | 30 | 40 |
Pasos 1. Cree un objeto
x<- c(18,22,24,26,27,29,30,32,37,40,43,47,19,23,24,26,
27,29,31,33,37,40,43,48,20,23,25,26,28,29) #Creación de un objeto (paso 1)\(f _{c} = p_{c} /w_{c}\)
En donde:
x<- c(18,22,24,26,27,29,30,32,37,40,43,47,19,23,
24,26,27,29,31,33,37,40,
43,48,20,23,25,26,28,29)###Crear objeto dado un conjunto de datos
h<-hist( x ) # asignamos a un objeto h el histograma de x
h$counts<-cumsum(h$counts) #reemplazamos
#los conteos del histograma por el conteo acumulado
plot( h )Se refiere al valor que tendría cada elemento de la serie de datos si todos tuvieran el mismo valor
La media aritmetica de los datos: 2,4,6,8 y 9 es:
\(\bar{x}=\displaystyle\sum_{i=1}^n \frac{x_i}{n}=\frac{(2+4+6+8+9)}{5}=5.8\)
En \(R\) para calcular la media se utiliza la función:
Dado el conjunto de datos estime la media en la consola de R:
| 18 | 22 | 24 | 26 | 27 | 29 | 30 | 32 | 37 | 40 | 43 | 47 |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 19 | 23 | 24 | 26 | 27 | 29 | 31 | 33 | 37 | 40 | 43 | 48 |
| 20 | 23 | 25 | 26 | 28 | 29 | 24 | 26 | 27 | 29 | 30 | 40 |
En \(R\) para calcular la media se utiliza la función: 1. Crear un objeto con los datos
## [1] 30.2
\(\bar{x_p}= \frac {\displaystyle\sum_{i=1}^n {k_i}{x_i}}{\displaystyle\sum_{i=1}^n {k_i}} = \frac{{{k_1}{k_1}}+{{k_2}{k_2}}...{{k_n}{k_in}}}{{k_1}+{k_2}...{k_n}}\)
En la evaluación de un servicio sanitario, han sido calculados tres índices. La evaluación total del servicio se obtiene calculando la media ponderada de los índices yq que no tienen el mismo valor. Los pesos asignados son 3 al primer índice, 5 al segundo y 9 al tercero
Los datos que se obtuvieron son los siguientes:
| Primer índice | 7 |
|---|---|
| Segundo índice | 8 |
| Tercer índice | 7 |
\(\bar{x_p}= \frac{(3x7+5x8+9x7)}{3+5+9}=7.29\)
Calcular la media geométrica de los datos siguientes: 4, 5, 6, 8, 9, 12
La media geométrica sólo es preferible a la aritmética en los casos que se presentan progresion geométricas. por ejemplo (cromatografía líquidos, citometría)
## [1] 10
## [1] 14.5
Las medidas más utilizadas de dispersión más utilizadas son: - Rango o recorrido - Desviación media - Varianza - Desviación típica o desviación estándar - Coeficiente de variación