En esta sección el estudiante comprenderá:
Para planear la demanda de los servicios de salud y adicionalmente hacer una detección temprana de la enfermedad, el gerente de una EPS quiere saber cuál es el resultado de la mamografía de las mujeres afiliadas y que tienen más de 50 años.
Pregunta de investigación ¿Cuál es la prevalencia de BIRADS 4,5 y 6 en las mujeres mayores de 50 años, en dicha EPS?
Población: Conjunto de unidades de una misma naturaleza.
Variable: Característica que varía de una unidad a otra dentro de la poclación.
Medición: Valor asignado u observado de la variable(expresión cualitativa o cuantitativa).
Población: Mujeres mayores de 50 años afiliadas a la EPS
Variable | Medición | Escala de medición |
---|---|---|
BIRADS | 0,1,2,3,4,5,6 | Ordinal |
Edad | ||
Raza | ||
Estatura |
\(C_j\) | \(n_j\) |
---|---|
\(C_1\) | \(n_1\) |
\(C_2\) | \(n_2\) |
… | … |
\(C_j\) | \(n_j\) |
… | … |
\(C_m\) | \(n_m\) |
——— | ——— |
Total | \(n\) |
Las frecuencias relativas son la proporción de casos que pertenecen a determinada clase:
\[h_j=\frac{n_j}{n}\]
Complete la tabla de contingencia
BIRADS | \(n_j\) | \(h_j\) |
---|---|---|
0 | 145 | |
1 | 2415 | |
2 | 3456 | |
3 | 852 | |
4 | 0.0603 | |
5 | 157 | |
6 | ||
——– | ——– | —— |
Total | 7614 |
En general las variables categóricas y las cuantitativas discretas se grafican en diagramas de barras: - eje \(x\): Categorías de la característica observada - eje \(y\): Frecuencia absoluta o frecuencia relativa
Se miden dos o más características (variables) en cada individuo
\(C_j\)~\(B_k\) | \(B_1\) | … | \(B_k\) | … | \(B_w\) | Total |
---|---|---|---|---|---|---|
\(C_1\) | \(n_{11}\) | \(n_{1k}\) | \(n_{1w}\) | \(n_{1.}\) | ||
\(C_2\) | \(n_{21}\) | \(n_{2k}\) | \(n_{2w}\) | \(n_{2.}\) | ||
… | … | … | … | … | ||
\(C_j\) | \(n_{j1}\) | \(n_{jk}\) | \(n_{jw}\) | \(n_{j.}\) | ||
… | … | … | … | … | ||
\(C_m\) | \(n_{m1}\) | \(n_{mk}\) | \(n_{mw}\) | \(n_{m.}\) | ||
——— | ——- | … | … | … | ||
Total | \(n_{.1}\) | \(n_{.k}\) | \(n_{.w}\) | \(n_{..}\) |
Las frecuencias relativas son la proporción de casos que pertenecen simultáneamenta a \(C_j\) y \(B_k\) :
\[h_{jk}=\frac{n_{jk}}{n}\] ### Propiedades \(h_{jk}\)
Las frecuencias relativas condicionales describen el comportamiento de una categoría limitando la población a un grupo específico:
\[h_{k|j}=\frac{n_{jk}}{n_j.}\] - Comportamiento de \(C_j\) en la categoría \(B_k\) (¿De los \(B_k\) qué proporción son \(C_j\)?-Perfil columna):
\[h_{j|k}=\frac{n_{jk}}{n_{.k}}\] ### Ejercicio: Problema de investigación Suponga además que se quiere mirar la distribución del BIRADS de acuerdo a si ha amamantado o no, econtrándose lo siguiente:
\(C_j\)~\(B_k\) | Si | No | Total |
---|---|---|---|
\(0\) | \(76\) | \(69\) | |
\(1\) | \(1670\) | \(745\) | |
\(2\) | \(1975\) | \(1481\) | |
\(3\) | \(394\) | \(458\) | |
\(4\) | \(95\) | \(364\) | |
\(5\) | \(54\) | \(103\) | |
\(6\) | \(41\) | \(89\) | |
——— | —– | —- | —- |
Total |
Las características a evaluar son: \(C\): BIRADS
\(B\): Lactancia
# No olviden direccionar a la carpeta en donde se encuentra grabado el archivo, en mi caso:
#setwd("C:\\Users\\lange\\Google Drive\\Sabana 2019\\II-2019\\Electiva")
geriatra<-read.table("geriatra.txt")
colnames(geriatra)<-c("caidas","intervencion","sexo","balance","fuerza")
#Tabla de frecuencias absolutas
t_sexo<-table(geriatra$sexo)
names(t_sexo)<-c("femenino","masculino")
t_sexo
## femenino masculino
## 47 53
#Tabla de frecuencias relativas
#El total de datos en la tabla podemos obtenerlo de dos formas:
dim(geriatra)
## [1] 100 5
## [1] 100
## [1] 5
## [1] 100
#De tal forma que las frecuencias relativas podemos obtenerlas así:
tr_sexo<-table(geriatra$sexo)/dim(geriatra)[1]
names(tr_sexo)<-c("femenino","masculino")
tr_sexo
## femenino masculino
## 0.47 0.53
#diagrama de barras con frecuencias relativas
barplot(tr_sexo, xlab="Sexo", ylab="hj", col=c("light blue", "blue"), ylim=c(0,1))
#Tabla de frecuencias absolutas a dos vías
#La primera variable estará en las filas y la segunda en las columnas
t_int_sexo<-table(geriatra$intervencion,geriatra$sexo)
t_int_sexo
##
## 0 1
## 0 28 22
## 1 19 31
#Diagrama de barras para una tabla a dos vías
geriatra$intervencion<-as.factor(geriatra$intervencion)
levels(geriatra$intervencion)<-c("No", "Si")
table(geriatra$intervencion)
##
## No Si
## 50 50
geriatra$sexo<-as.factor(geriatra$sexo)
levels(geriatra$sexo)<-c("f","m")
barplot(table(geriatra$sexo,geriatra$intervencion), legend.text = T, xlab="Intervención", ylab="n_jk")
#Es posible obtener las frecuencias relativas condicionadas por fila o por columna con el comando prop.table.
#Para condicionar por fila:
tf_int_sexo<-prop.table(t_int_sexo,1)
row.names(tf_int_sexo)<-c("No int","Si int")
colnames(tf_int_sexo)<-c("femenino","masculino")
tf_int_sexo
##
## femenino masculino
## No int 0.56 0.44
## Si int 0.38 0.62
#Para condicionar por columna:
tc_int_sexo<-prop.table(t_int_sexo,2)
row.names(tc_int_sexo)<-c("No int","Si int")
colnames(tc_int_sexo)<-c("femenino","masculino")
tc_int_sexo
##
## femenino masculino
## No int 0.5957447 0.4150943
## Si int 0.4042553 0.5849057