INFORME LABORATORIO 3
INTRODUCCIÓN
Este informe explica el proceso y sintetiza el análisis, las conclusiones y los métodos pertinentes que se realizaron con ayuda del programa Rstudio para su procesamiento. La Base de datos países.xls, contiene información acerca de las condiciones de natalidad, mortalidad y capacidad de producción de 97 países alrededor del mundo. Las variables que se registran en la base de datos son (Tasa de Natalidad, Tasa de Mortalidad, Tasa de Mortalidad Infantil, Esperanza de Vida, Producto Interno Bruto), adicionalmente los países son clasificados según en 6 grupos: (AFRICA, ASIA, EO-NA_JAPON_AUSTR_NZ, EUROPA ORIENTAL , IBEROAMERICA, ORIENTE MEDIO)
El Preprocesamiento Y Limpieza De Los Datos.
Haciendo uso del programa Rstudio y sus herramientas, se decide estudiar la muestra para identificar los datos faltantes, por lo que se realizó un gráfico que nos ayudara a visulizar esta problematica.
Grafico 1
Visualizacion De Datos Faltantes
Al darnos cuenta de los datos faltantes pasamos a la fase de imputacion de datos que lo realizamos a travez de el metodo de la media, este subestimará la varianza, alterará las relaciones entre las variables, sesgará casi cualquier estimación que no sea la media y sesgará la estimación de la media cuando los datos no sean MCAR. Al estar la imputación realizada comprobamos de que sea cierto mediante el mismo grafico
Grafico 2
Visualizacion De Datos Faltantes
Visualización De Datos
1. ¿Cómo esta conformada la muestra de países según grupo?
Respuesta: Para saber de que manera esta conformada la muestra de los países según su grupo se realizó una grafica de pastel acompañada del porcentaje que representa cada grupo de países
Grafico 3
Diagrama Circular De La Muestra
Para resumir, podemos observar la distribución de nuestra grafica y como se puede ver tenemos en primer lugar a AFRICA con un 27.84% de los datos, NA_JAPON_AUSTR_NZ, EUROPA ORIENTAL con el 19.59%, Asia con el 17.53% que son los que mas datos contienen de la muestra.
2. En un solo esquema gráfico, analice la existencia de diferencia en los indicadores (Tasas de Mortalidad, Tasa de Natalidad, Mortalidad Infantil) evaluados para los países que conforman los diferentes grupos.
Respuesta: Para tener claro lo que son estas tasas y lo que representa cada una de ellas, haremos una breve definición de estas:
Tasa de mortalidad infantil: La Tasa de Mortalidad Infantil es el número de defunciones de niños menores de 1 año por cada 1.000 nacidos vivos para un año dado, en un determinado país, territorio o área geográfica.
Tasa de mortalidad: La tasa de mortalidad es la proporción de defunciones registradas, con respecto a la cantidad de individuos total que habita en una población, ciudad o país; en un año.
Tasa de natalidad: La tasa de natalidad se define como el número de nacimientos registrados por cada mil habitantes en un tiempo determinado, normalmente un año.
Luego de tener claro estas definiciones vemos la grafica y podemos sacar algunas conclusiones de esta
Grafico 4
Grafico De Barras De Las Tasas Por Grupo
Como podemos observar de la grafica la tasa de mortalidad infantil es bastante alta respecto a las demás. Las mayores causas de muerte de niños en los países pobres son las patologías perinatales, las infecciones de las vías respiratorias inferiores, las enfermedades diarreicas, la malaria, el sarampión, las anomalías congénitas, el sida, la tosferina, el tétanos y la malnutrición proteico-energética además de que la tasa de natalidad también es proporción con la tasa de mortalidad infantil es alta, esto debido principalmente porque las mujeres africanas todavía tienen tantos hijos, por la edad en la que se convierten en madres por primera vez, que es más de cuatro años antes que el promedio mundial. Este análisis se puede hacer para cada uno de los grupos y será proporciónal en la mayoría de sus casos y es puede concluir de que en los países pobres estas tasas son cada vez mas altas.
3. Genere una nueva variable denominada PNB per cápita, que equivale al cociente entre PNB/# habitantes. Grafique esta variable (en un solo esquema gráfico) para cada uno de los grupos e interprete los resultados.
Grafico 5
Diagrama De Caja y Bigotes
Conocemos el PNB Per Cápita como el indicador del ingreso que cada persona tendría si el PNB se dividiera en partes iguales, que también se denomina ingreso per cápita, pero esto solo resulta útil para medir la productividad económica, no el bienestar de la población, ni el éxito de un país en su intento de mejorar su desarrollo, tampoco indica de que manera esta distribuido el ingreso de un país entre sus ciudadanos, no toma en cuenta el trabajo no remunerado que realiza en los hogares o las comunidades, con los conceptos claros podemos ver el grafico y darnos cuenta de que tomando como referencia a oriente medio en donde se pueden encontrar países como arabia saudita, Catar y Emiratos Árabes que son países en los que se tiene mucho dinero y su población es relativamente baja, contrastando con lo que es África, un continente con países en los que su extrema pobreza y gran cantidad de habitantes es uno de sus principales problemas a la hora de analizar este indicador.
4. Sobre la nueva variable calculada, calcule los respectivos Cuartiles, Generando 4 grupos que cumplan con las siguientes condiciones:
Bajo= conformado por el 25% más pobre
Medio Bajo= Conformado por los países que superan el percentil 25% pero son inferiores al 50%
Medio Alto= Conformado por los países que superan el percentil 50% pero son inferiores al 75%
Alto= Conformado por el 25% Más rico.
Para cada grupo de países (Variable Grupos existente en la base de datos), calcule el porcentaje de países que son clasificados en los diferentes niveles de pobreza (Alto, Medio Alto, Medio Bajo, Bajo), represente en una tabla de frecuencia y genere un gráfico que resuma tal tabla. ¿Cree que el nivel de riqueza está asociado con el grupo de clasificación?
TABLA 1
Tabla De Cuartiles
Los cuartiles son valores que dividen una muestra de datos en cuatro partes iguales. Utilizando los cuartiles podemos evaluar rápidamente la dispersión y la tendencia central de un conjunto de datos, en este caso el cuartil uno quiere decir que por debajo o igual del 0,0270 se encuentra el 25% de los datos que cumple con la condición de BAJO, el segundo cuartil que es mayor que 0.0270 y menor o igual que 0.1338 encontramos la mediana lo que quiere decir que por debajo de este esta el 50 % de los datos, entre el primer cuartil y el segundo se encuentran los de categoría MEDIO BAJO, en el cuartil 3 que por debajo de este esta el 75% de los datos se ubica en 0.7923 donde se encuentra la categoría MEDIO ALTO, ya por encima de este se encuentra el otro 25% de los datos los cuales entran en la categoría ALTO
TABLA 2
Tabla De Frecuencia
Grafico 6
Grafico De Barras
Como podemos ver en la tabla de frecuencias, se resalta que en Africa más de la mitad de su poblacion es muy pobre (BAJO), tan solo el 12% aproximadamente tiene tiene un nivel Alto en cuanto a recursos (no pobres) otro que cabe resaltar a diferencia de africa y es de los que más contrasta, es que el 52% de la población en EO_NA_JAPON_NZ son adinerados en su mayoria tiene un 0% en la clasificacion (BAJO); esta situación se repite en oriente medio que como deciamos en el punto anterior, en su mayoria los paises son muy ricos, como lo son: Catar, Emiratos Arabes o Dubai. Ya analzando todos los casos anteroriores, podemos afirmar que el nivel de pobreza de los paises sí esta asociado con su grupo de clasificación.