Evaluación 3

Activar librería Car y las demás librerías a usar

library(car)

## Loading required package: carData

library(Hmisc)

## Loading required package: lattice

## Loading required package: survival

## Loading required package: Formula

## Loading required package: ggplot2

## 
## Attaching package: 'Hmisc'

## The following objects are masked from 'package:base':
## 
##     format.pval, units

Seleccionar la data Prestige

data <- Prestige

1.Realizar cambio a los datos

colnames(data) <- c("educ","ing","mujeres","prestigio","cod","tipo")
nombres <-  c("Promedio de años de estudio deltrabajador nombrado",
              "Promedio de ingreso en dólares del nombrado",
              "Porcentaje de mujeres nombradas",
              "Valoración de prestigio dePineo-Porter",
              "Código de ocupación en el censo",
              "Tipo de ocupación en 3 niveles")
label(data$educ)= nombres[1] 
label(data$ing)= nombres[2] 
label(data$mujeres)= nombres[3] 
label(data$prestigio)= nombres[4] 
label(data$cod)= nombres[5] 
label(data$tipo)= nombres[6]

2.Realizar un cambio de variable o recodificación en la variable tipo con las siguientes características

  data$tipo=factor(data$tipo,labels = c("1","2","3"))

3.Hecho el paso 2, aplicar sobre la variable tipo un cambio a factor, en donde se genere las siguientes etiquetas de valor

data$tipo=factor(data$tipo,labels = c("Cuello azul","Profesional","Cuello blanco"))

4.En el word o pdf generado haz un resumen de no más de tres lineas de cada una de las definiciones de cuello azul y cuello blanco.

Cuello Azul ( blue collar): Son las personas que hacen trabajos manuales, su labor es percebido como de menor importancia y relacionado a tareas que no requieren de un conocimiento especializado.
Cuello Blanco ( white collar): Personas que realizan un trabajo mental más que físico. Usualmente tienen un salario mas elevados que los cuellos azules y están relacionados a cargos administrativos, mejor educación y con el stigma de una mejor posición social.
##### 5.Define las características y diferencias entre los comando rbind, merge y Reduce.

rbind

Combina vectores, matrices o data frames por filas ##### merge Puedes combinar sólo 2 data frames a la vez ##### Reduce Puedes combinar más de 2 data frames ##### 6.Realizar un gráfico pie para la variable tipo.

pcg <- round((table(data$tipo)/sum(table(data$tipo)))*100,2)
lbls<- paste0(pcg,"%")
pie(pcg,labels = lbls, col=1:3,
    main="Tipo de ocupación",
    radius = 1)
legend("topright",c("Cuello azul","Profesional","Cuello blanco"),fill =1:3 ,cex = 0.6)

7. Elaborar un histograma, y un histograma de densidad junto con la linea de función de distribución normal sobre las variables educación e ingreso.

+educación

hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
     col="green")
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)

hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
     col="green",probability = T)
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)

+ingresos

hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
     col="green")
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)

hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
     col="green",probability = T)
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)

8.Elaborar un diagrama de cajas sobre la variable mujeres y dar la interpretación

boxplot(data$mujeres,main= "Diagrama de cajas \n de la variable mujeres",col = "pink")

La mayoría de los datos estan agruapados en los valores inciales haciendo que haya muchos outliers en el extremo superior(datos fuera del boxplot)

9. Haz un gráfico de dispersion sobre las variable prestigio (“y”) e ingreso (“x”),junto con su linea regresora

plot(data$ing,
     data$prestigio, 
     xlab = "Ingreosos",
     ylab = "Prestigio",
     main = "Nivel de prestigio por cantidad de ingresos")
abline(lm(prestigio~ing,data = data),col="red")

10.Elabora una matriz de dispersiones sobre la base de datos con todas las variables

pairs(Prestige)