La información recogida contiene un conjunto de datos con información detallada sobre los costes médicos de las personas durante el periodo comprendido entre 2010 y 2020. Incluye diversos atributos como la edad, el sexo, el IMC, el número de hijos, el hábito de fumar y la región. Estos atributos son esenciales para comprender los factores que influyen en los costes médicos y pueden utilizarse para modelos predictivos, análisis estadísticos y fines de investigación.
Concepto: Datos detallados de los costes médicos para diversos grupos demográficos de 2010 a 2020, incluye varios atributos, como la edad, el sexo, el IMC, el número de hijos, el hábito de fumar y la región.
Población: Población estadounidense de diferentes regiones.
Tamaño de la muestra: 10000 registros.
Instrumento de recolección: La base de datos fue tomado de Medical Costs (kaggle.com)
Ubicación espacio temporal: Datos tomados desde 01/01/2010 hasta el 12/31/2020, el conjunto de datos abarca individuos de varias regiones de Estados Unidos, incluidas las regiones noreste, noroeste, sureste y suroeste.
Unidad estadística: Pacientes que usan servicios médicos en diferentes regiones de los Estados Unidos
Variables de interés:
Cualitativas: Género, Fumador (SI/NO), Región.
Cuantitativas: Edad, Costos médicos, Cantidad de hijos, Indice masa corporal.
Se puede notar, que la población encuestada es una población balanceada,es decir, la distribución de la muestra es representativa y equitativa en términos de género, lo cual es crucial para asegurar que los resultados del estudio no estén sesgados hacia un género en particular.
Se puede evidenciar una paridad notable entre la población, ya que la diferencia entre los pacientes fumadores con respecto a los no fumadores es de tan solo 0.16%, es decir,se cuenta con una distribución balanceada, lo que fortalece la validez de cualquier análisis que se realice entre ambos grupos.