En esta sección el estudiante comprenderá:
Para planear la demanda de los servicios de salud y adicionalmente hacer una detección temprana de la enfermedad, el gerente de una EPS quiere saber cuál es el resultado de la mamografía de las mujeres afiliadas y que tienen más de 50 años.
Pregunta de investigación ¿Cuál es la prevalencia de BIRADS 4,5 y 6 en las mujeres mayores de 50 años, en dicha EPS?
Población: Conjunto de unidades de una misma naturaleza.
Variable: Característica que varía de una unidad a otra dentro de la poclación.
Medición: Valor asignado u observado de la variable(expresión cualitativa o cuantitativa).
Población: Mujeres mayores de 50 años afiliadas a la EPS
| Variable | Medición | Escala de medición |
|---|---|---|
| BIRADS | 0,1,2,3,4,5,6 | Ordinal |
| Edad | ||
| Raza | ||
| Estatura |
| \(C_j\) | \(n_j\) |
|---|---|
| \(C_1\) | \(n_1\) |
| \(C_2\) | \(n_2\) |
| … | … |
| \(C_j\) | \(n_j\) |
| … | … |
| \(C_m\) | \(n_m\) |
| ——— | ——— |
| Total | \(n\) |
Las frecuencias relativas son la proporción de casos que pertenecen a determinada clase:
\[h_j=\frac{n_j}{n}\]
Complete la tabla de contingencia
| BIRADS | \(n_j\) | \(h_j\) |
|---|---|---|
| 0 | 145 | |
| 1 | 2415 | |
| 2 | 3456 | |
| 3 | 852 | |
| 4 | 0.0603 | |
| 5 | 157 | |
| 6 | ||
| ——– | ——– | —— |
| Total | 7614 |
En general las variables categóricas y las cuantitativas discretas se grafican en diagramas de barras: - eje \(x\): Categorías de la característica observada - eje \(y\): Frecuencia absoluta o frecuencia relativa
Se miden dos o más características (variables) en cada individuo
| \(C_j\)~\(B_k\) | \(B_1\) | … | \(B_k\) | … | \(B_w\) | Total |
|---|---|---|---|---|---|---|
| \(C_1\) | \(n_{11}\) | \(n_{1k}\) | \(n_{1w}\) | \(n_{1.}\) | ||
| \(C_2\) | \(n_{21}\) | \(n_{2k}\) | \(n_{2w}\) | \(n_{2.}\) | ||
| … | … | … | … | … | ||
| \(C_j\) | \(n_{j1}\) | \(n_{jk}\) | \(n_{jw}\) | \(n_{j.}\) | ||
| … | … | … | … | … | ||
| \(C_m\) | \(n_{m1}\) | \(n_{mk}\) | \(n_{mw}\) | \(n_{m.}\) | ||
| ——— | ——- | … | … | … | ||
| Total | \(n_{.1}\) | \(n_{.k}\) | \(n_{.w}\) | \(n_{..}\) |
Las frecuencias relativas son la proporción de casos que pertenecen simultáneamenta a \(C_j\) y \(B_k\) :
\[h_{jk}=\frac{n_{jk}}{n}\] ### Propiedades \(h_{jk}\)
Las frecuencias relativas condicionales describen el comportamiento de una categoría limitando la población a un grupo específico:
\[h_{k|j}=\frac{n_{jk}}{n_j.}\] - Comportamiento de \(C_j\) en la categoría \(B_k\) (¿De los \(B_k\) qué proporción son \(C_j\)?-Perfil columna):
\[h_{j|k}=\frac{n_{jk}}{n_{.k}}\] ### Ejercicio: Problema de investigación Suponga además que se quiere mirar la distribución del BIRADS de acuerdo a si ha amamantado o no, econtrándose lo siguiente:
| \(C_j\)~\(B_k\) | Si | No | Total |
|---|---|---|---|
| \(0\) | \(76\) | \(69\) | |
| \(1\) | \(1670\) | \(745\) | |
| \(2\) | \(1975\) | \(1481\) | |
| \(3\) | \(394\) | \(458\) | |
| \(4\) | \(95\) | \(364\) | |
| \(5\) | \(54\) | \(103\) | |
| \(6\) | \(41\) | \(89\) | |
| ——— | —– | —- | —- |
| Total |
Las características a evaluar son: \(C\): BIRADS
\(B\): Lactancia
# No olviden direccionar a la carpeta en donde se encuentra grabado el archivo, en mi caso:
#setwd("C:\\Users\\lange\\Google Drive\\Sabana 2019\\II-2019\\Electiva")
geriatra<-read.table("geriatra.txt")
colnames(geriatra)<-c("caidas","intervencion","sexo","balance","fuerza")
#Tabla de frecuencias absolutas
t_sexo<-table(geriatra$sexo)
names(t_sexo)<-c("femenino","masculino")
t_sexo## femenino masculino
## 47 53
#Tabla de frecuencias relativas
#El total de datos en la tabla podemos obtenerlo de dos formas:
dim(geriatra)## [1] 100 5
## [1] 100
## [1] 5
## [1] 100
#De tal forma que las frecuencias relativas podemos obtenerlas así:
tr_sexo<-table(geriatra$sexo)/dim(geriatra)[1]
names(tr_sexo)<-c("femenino","masculino")
tr_sexo## femenino masculino
## 0.47 0.53
#diagrama de barras con frecuencias relativas
barplot(tr_sexo, xlab="Sexo", ylab="hj", col=c("light blue", "blue"), ylim=c(0,1))#Tabla de frecuencias absolutas a dos vías
#La primera variable estará en las filas y la segunda en las columnas
t_int_sexo<-table(geriatra$intervencion,geriatra$sexo)
t_int_sexo##
## 0 1
## 0 28 22
## 1 19 31
#Diagrama de barras para una tabla a dos vías
geriatra$intervencion<-as.factor(geriatra$intervencion)
levels(geriatra$intervencion)<-c("No", "Si")
table(geriatra$intervencion)##
## No Si
## 50 50
geriatra$sexo<-as.factor(geriatra$sexo)
levels(geriatra$sexo)<-c("f","m")
barplot(table(geriatra$sexo,geriatra$intervencion), legend.text = T, xlab="Intervención", ylab="n_jk")#Es posible obtener las frecuencias relativas condicionadas por fila o por columna con el comando prop.table.
#Para condicionar por fila:
tf_int_sexo<-prop.table(t_int_sexo,1)
row.names(tf_int_sexo)<-c("No int","Si int")
colnames(tf_int_sexo)<-c("femenino","masculino")
tf_int_sexo##
## femenino masculino
## No int 0.56 0.44
## Si int 0.38 0.62
#Para condicionar por columna:
tc_int_sexo<-prop.table(t_int_sexo,2)
row.names(tc_int_sexo)<-c("No int","Si int")
colnames(tc_int_sexo)<-c("femenino","masculino")
tc_int_sexo##
## femenino masculino
## No int 0.5957447 0.4150943
## Si int 0.4042553 0.5849057