El investigador elige los casos que considera más
representativos o informativos.
Se usa en estudios cualitativos o en investigaciones donde se busca un
perfil específico.
Participantes
La muestra de este estudio será tomada del Estudio “Secuelas cognitivas, comportamentales y emocionales con relación a la funcionalidad endocrina en el paciente con Trauma Craneoencefálico moderado y severo ocasionado por accidentes de tránsito”, este estudio complementa la limitación respecto a la validación en esta condición clínica. Un total de 104 participantes: 34 con diagnóstico de TCE y 70 controles cognitivamente sanos, se tuvieron en cuenta los siguientes criterios clínicos:
Criterios de exclusión para los dos grupos TCE y controles:
Mujeres en estado de gestación.
Consumo activo de sustancias psicoactivas (SPA).
Historial neurológico y/o psiquiátrico.
Comorbilidades (diabetes, hipertensión arterial, dislipidemia) y/o alteraciones hormonales.
Historia clínica pre-mórbida de aprendizaje (se tendrá en cuenta la resistencia escolar).
Trastornos perceptivos visuales, auditivos o motores que imposibilitan el desarrollo de la evaluación.
Criterios de inclusión grupo clínico TCE - Hombres y mujeres entre los 18 a 50 años de edad.
Traumatismo craneoencefálico (TCE) secundario a accidente de tránsito, con puntuación en la escala de Glasgow en el rango moderado a severo.
Criterios de inclusión grupo control
Hombres y mujeres entre los 18 a 50 años de edad.
library(readxl)
## Warning: package 'readxl' was built under R version 4.5.2
Datos <- read_excel("DatosTCE_talleres.xlsx", sheet = 1)
Es importante dejar claro que, para este ejercicio únicamente haremos uso del grupo clínico.
TCE = 34 participantes, grupo clínico con TCE moderado y severo
Variables a trabajar:
Edad
Sexo
Escolaridad
Clasificación TCE
datos <- read_excel("DatosTCE_talleres.xlsx")
edad <- datos$EDAD
media_estimada <- mean(edad)
media_estimada
## [1] 29.5
escolaridad <- datos$Escolaridad_años
media_estimada <- mean(escolaridad)
media_estimada
## [1] 8.794118
La edad media de los participantes con traumatismo craneoencefálico es de 29.5 años con una media escolar de 8.79 años.
varianza_estimada <- var(edad)
varianza_estimada
## [1] 87.04545
Se obtuvo una varianza poblacional de la edad de 87.05 años², lo que evidencia una variabilidad moderada en la distribución etaria de los participantes. En términos prácticos, las edades difieren en promedio alrededor de 9.3 años respecto a la media, lo que sugiere una muestra relativamente homogénea en cuanto a edad.
proporcion_por_Sexo <- table(datos$Sexo) / nrow(datos)
proporcion_por_Sexo
##
## Femenino Masculino
## 0.2058824 0.7941176
De acuerdo con los resultados, la mayoría de los participantes con TCE son de sexo masculino (79.4%), mientras que solo el 20.6% corresponde al sexo femenino.
proporcion_por_Clasificación_TCE <- table(datos$Clasificación_TCE) / nrow(datos)
proporcion_por_Clasificación_TCE
##
## Moderado Severo
## 0.5588235 0.4411765
De los participantes con diagnóstico de traumatismo craneoencefálico (TCE) ingresados al Hospital Universitario Moncaleano, el 55.9% fueron clasificados como casos moderados, mientras que el 44.1% correspondieron a casos severos, según la puntuación obtenida en la Escala de Coma de Glasgow (GCS).
proporcion_declive_moderado <- sum(datos$Clasificación_TCE == "Moderado" &
datos$Deterioro_clínico == "Sí") /
sum(datos$Clasificación_TCE == "Moderado")
proporcion_declive_moderado
## [1] 0.2105263
sin embargo, del 55.9% de pacientes con TCE moderado, el 21.1% presentó deterioro clínico pasando pasando a TCE severo, según la GCS.
media_moderado <- mean(datos$EDAD[datos$Clasificación_TCE == "Moderado"], na.rm = TRUE)
media_severo <- mean(datos$EDAD[datos$Clasificación_TCE == "Severo"], na.rm = TRUE)
diferencia_medias <- media_moderado - media_severo
media_moderado
## [1] 28.78947
media_severo
## [1] 30.4
diferencia_medias
## [1] -1.610526
En promedio, los pacientes con TCE moderado tenían 28.8 años, y aquellos con TCE severo 30.4 años. Esto refleja una diferencia de edad de aproximadamente 1.6 años, siendo los casos severos ligeramente más mayores que los moderados, aunque la diferencia no parece clínicamente significativa.
media_moderado <- mean(datos$Escolaridad_años
[datos$Clasificación_TCE == "Moderado"], na.rm = TRUE)
media_severo <- mean(datos$Escolaridad_años
[datos$Clasificación_TCE == "Severo"], na.rm = TRUE)
diferencia_medias <- media_moderado - media_severo
media_moderado
## [1] 9.263158
media_severo
## [1] 8.2
diferencia_medias
## [1] 1.063158
La media de años de escolaridad en el grupo de pacientes con traumatismo craneoencefálico (TCE) moderado fue de 9.26 años, mientras que en el grupo con TCE severo fue de 8.20 años. La diferencia de medias fue de 1.06 años, lo que indica que, en promedio, los pacientes con TCE moderado tenían un mayor nivel educativo que aquellos con TCE severo. Esta diferencia sugiere una posible asociación entre el nivel de escolaridad y la gravedad del TCE.
hombres_moderado <- sum(datos$Clasificación_TCE == "Moderado" & datos$Sexo == "Masculino", na.rm = TRUE)
hombres_severo <- sum(datos$Clasificación_TCE == "Severo" & datos$Sexo == "Masculino", na.rm = TRUE)
total_moderado <- sum(datos$Clasificación_TCE == "Moderado", na.rm = TRUE)
total_severo <- sum(datos$Clasificación_TCE == "Severo", na.rm = TRUE)
p1 <- hombres_moderado / total_moderado
p2 <- hombres_severo / total_severo
diferencia_p <- p1 - p2
prop.test(c(hombres_moderado, hombres_severo),
c(total_moderado, total_severo))
## Warning in prop.test(c(hombres_moderado, hombres_severo), c(total_moderado, :
## Chi-squared approximation may be incorrect
##
## 2-sample test for equality of proportions with continuity correction
##
## data: c(hombres_moderado, hombres_severo) out of c(total_moderado, total_severo)
## X-squared = 0.25248, df = 1, p-value = 0.6153
## alternative hypothesis: two.sided
## 95 percent confidence interval:
## -0.4517669 0.1921178
## sample estimates:
## prop 1 prop 2
## 0.7368421 0.8666667
En el análisis de la distribución por sexo, se observó que la proporción de hombres fue del 73.7 % en el grupo con traumatismo craneoencefálico (TCE) moderado y del 86.7 % en el grupo con TCE severo. Aunque la proporción de hombres fue mayor entre los casos severos, la diferencia de proporciones (p₁ − p₂ = −0.13) no resultó estadísticamente significativa (p = 0.615; IC 95 %: −0.45 a 0.19). Esto indica que, dentro de esta muestra, la distribución por sexo fue similar entre los pacientes con TCE moderado y severo.
Variable: Estado_Civil
estado_civil <- as.factor(datos$Estado_Civil)
table(estado_civil)
## estado_civil
## Casados Solteros Unión_libre
## 3 21 10
Un estimador insesgado de una proporción p es la proporción muestral (p̂ = x/n)
prop_civil <- prop.table(table(estado_civil))
cat("\n=== INSSESGADEZ ===\n")
##
## === INSSESGADEZ ===
cat("Proporciones muestrales por categoría:\n")
## Proporciones muestrales por categoría:
print(prop_civil)
## estado_civil
## Casados Solteros Unión_libre
## 0.08823529 0.61764706 0.29411765
cat("→ Las proporciones muestrales son estimadores insesgados de las proporciones poblacionales.\n")
## → Las proporciones muestrales son estimadores insesgados de las proporciones poblacionales.
Las proporciones muestrales de Estado_Civil representan correctamente a la población, ya que no tienden a sobrestimar ni subestimar las verdaderas proporciones. Esto significa que los resultados de la muestra son un reflejo fiel de la realidad poblacional.
En variables categóricas, la eficiencia se evalúa por la varianza del estimador de proporción: Var(p̂) = [p * (1 - p)] / n
n <- length(estado_civil)
varianza_prop <- prop_civil * (1 - prop_civil) / n
cat("\n=== EFICIENCIA ===\n")
##
## === EFICIENCIA ===
cat("Varianza de los estimadores de proporción (menor = más eficiente):\n")
## Varianza de los estimadores de proporción (menor = más eficiente):
print(varianza_prop)
## estado_civil
## Casados Solteros Unión_libre
## 0.002366171 0.006945858 0.006106249
cat("→ Las categorías con proporciones extremas (muy altas o bajas) tienen menor varianza, por tanto mayor eficiencia.\n")
## → Las categorías con proporciones extremas (muy altas o bajas) tienen menor varianza, por tanto mayor eficiencia.
Las proporciones de Estado_Civil con valores más extremos, como “Casados”, presentan menor varianza, lo que indica mayor eficiencia del estimador. En otras palabras, esas proporciones son más precisas y se dispersan menos alrededor del valor verdadero de la población.
La proporción muestral es consistente: al aumentar n, se aproxima a p real.
set.seed(123)
n_vals <- seq(10, n, by = 10)
prop_evol <- sapply(n_vals, function(k) {
muestra <- sample(estado_civil, k, replace = TRUE)
prop.table(table(muestra))["Solteros"]
})
plot(n_vals, prop_evol, type = "b", pch = 19, col = "darkblue",
main = "Consistencia del estimador de proporción (Solteros)",
xlab = "Tamaño de muestra", ylab = "Proporción estimada de Solteros")
abline(h = prop_civil["Solteros"], col = "red", lty = 2)
cat("\n=== CONSISTENCIA ===\n")
##
## === CONSISTENCIA ===
cat("Observa el gráfico: la proporción estimada de Solteros se estabiliza conforme aumenta n.\n")
## Observa el gráfico: la proporción estimada de Solteros se estabiliza conforme aumenta n.
A medida que aumenta el número de datos en la muestra, la proporción de personas “Solteras” se mantiene estable. Esto indica que el estimador es consistente, ya que con muestras más grandes se aproxima cada vez más al valor real de la población.
En una distribución binomial/multinomial, el conteo de éxitos (o frecuencias) es un estimador suficiente para p.
cat("\n=== SUFICIENCIA ===\n")
##
## === SUFICIENCIA ===
cat("Para una variable categórica (multinomial), las frecuencias observadas son suficientes para estimar las proporciones poblacionales.\n")
## Para una variable categórica (multinomial), las frecuencias observadas son suficientes para estimar las proporciones poblacionales.
cat("→ La tabla de frecuencias contiene toda la información necesaria sobre p.\n")
## → La tabla de frecuencias contiene toda la información necesaria sobre p.
Las frecuencias observadas de cada categoría de Estado_Civil contienen toda la información necesaria para estimar las proporciones poblacionales. Es decir, con la tabla de frecuencias basta para representar fielmente la distribución del estado civil en la población con TCE.
Para categorías, la robustez se interpreta como estabilidad frente a errores de clasificación.
cat("\n=== Robustez ===\n")
##
## === Robustez ===
cat("La proporción muestral es moderadamente robusta.\n")
## La proporción muestral es moderadamente robusta.
cat("Si existen pocos errores de clasificación en 'Estado_Civil', las proporciones cambian poco.\n")
## Si existen pocos errores de clasificación en 'Estado_Civil', las proporciones cambian poco.
El estimador de proporciones para Estado_Civil es robusto, porque los pequeños errores de clasificación no alteran los resultados globales de manera importante.
set.seed(123)
estado_mod <- estado_civil
indices <- sample(1:n, size = 0.05*n)
estado_mod[indices] <- sample(levels(estado_civil), length(indices), replace = TRUE)
prop_original <- prop.table(table(estado_civil))
prop_modificada <- prop.table(table(estado_mod))
cat("\nProporciones originales:\n")
##
## Proporciones originales:
print(prop_original)
## estado_civil
## Casados Solteros Unión_libre
## 0.08823529 0.61764706 0.29411765
cat("Proporciones con 5% de errores:\n")
## Proporciones con 5% de errores:
print(prop_modificada)
## estado_mod
## Casados Solteros Unión_libre
## 0.08823529 0.61764706 0.29411765
cat("→ Cambios pequeños indican robustez del estimador.\n")
## → Cambios pequeños indican robustez del estimador.
Si al introducir 5% de errores, diríamos que el estimador no es robusto, porque pequeñas perturbaciones en los datos generan grandes cambios en las estimaciones.