Column.

Ficha técnica.

La información recogida contiene un conjunto de datos con información detallada sobre los costes médicos de las personas durante el periodo comprendido entre 2010 y 2020. Incluye diversos atributos como la edad, el sexo, el IMC, el número de hijos, el hábito de fumar y la región. Estos atributos son esenciales para comprender los factores que influyen en los costes médicos y pueden utilizarse para modelos predictivos, análisis estadísticos y fines de investigación.

Concepto: Datos detallados de los costes médicos para diversos grupos demográficos de 2010 a 2020, incluye varios atributos, como la edad, el sexo, el IMC, el número de hijos, el hábito de fumar y la región.

Población: Población estadounidense de diferentes regiones.

Tamaño de la muestra: 10000 registros.

Instrumento de recolección: La base de datos fue tomado de Medical Costs (kaggle.com)

Ubicación espacio temporal: Datos tomados desde 01/01/2010 hasta el 12/31/2020, el conjunto de datos abarca individuos de varias regiones de Estados Unidos, incluidas las regiones noreste, noroeste, sureste y suroeste.

Unidad estadística: Pacientes que usan servicios médicos en diferentes regiones de los Estados Unidos

Variables de interés:

  • Cualitativas: Género, Fumador (SI/NO), Región.

  • Cuantitativas: Edad, Costos médicos, Cantidad de hijos, Indice masa corporal.

Column.

Distribución por géneros.

Se puede notar, que la población encuestada es una población balanceada,es decir, la distribución de la muestra es representativa y equitativa en términos de género, lo cual es crucial para asegurar que los resultados del estudio no estén sesgados hacia un género en particular.

Histograma de las edades de los pacientes.

Cantidad de pacientes fumadores y no fumadores.

Se puede evidenciar una paridad notable entre la población, ya que la diferencia entre los pacientes fumadores con respecto a los no fumadores es de tan solo 0.16%, es decir,se cuenta con una distribución balanceada, lo que fortalece la validez de cualquier análisis que se realice entre ambos grupos.

Distribución por regiones.

Se presenta uniformidad entre las cuatro regiones, esta distribución casi equitativa sugiere que no hay una región que domine significativamente en términos de frecuencia, lo que puede reflejar una distribución equilibrada de la población.

Column

Promedio costos médicos.

$11,898.93

Cantidad total de hijos cubiertos por el seguro médico.

25017

Promedio índice de masa corporal.

27.4

Edad promedio.

41.68