Activar librerƭa Car y las demƔs librerƭas a usar

library(car)
## Loading required package: carData
library(Hmisc)
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## Loading required package: ggplot2
## 
## Attaching package: 'Hmisc'
## The following objects are masked from 'package:base':
## 
##     format.pval, units

Seleccionar la data Prestige

data <- Prestige

1.Realizar cambio a los datos

colnames(data) <- c("educ","ing","mujeres","prestigio","cod","tipo")
nombres <-  c("Promedio de aƱos de estudio deltrabajador nombrado",
              "Promedio de ingreso en dólares del nombrado",
              "Porcentaje de mujeres nombradas",
              "Valoración de prestigio dePineo-Porter",
              "Código de ocupación en el censo",
              "Tipo de ocupación en 3 niveles")
label(data$educ)= nombres[1] 
label(data$ing)= nombres[2] 
label(data$mujeres)= nombres[3] 
label(data$prestigio)= nombres[4] 
label(data$cod)= nombres[5] 
label(data$tipo)= nombres[6] 

2.Realizar un cambio de variable o recodificación en la variable tipo con las siguientes características

  data$tipo=factor(data$tipo,labels = c("1","2","3"))

3.Hecho el paso 2, aplicar sobre la variable tipo un cambio a factor, en donde se genere las siguientes etiquetas de valor

data$tipo=factor(data$tipo,labels = c("Cuello azul","Profesional","Cuello blanco"))

4.En el word o pdf generado haz un resumen de no mƔs de tres lineas de cada una de las definiciones de cuello azul y cuello blanco.

Cuello Azul ( blue collar): Son las personas que hacen trabajos manuales, su labor es percebido como de menor importancia y relacionado a tareas que no requieren de un conocimiento especializado.
Cuello Blanco ( white collar): Personas que realizan un trabajo mental mÔs que físico. Usualmente tienen un salario mas elevados que los cuellos azules y estÔn relacionados a cargos administrativos, mejor educación y con el stigma de una mejor posición social.
##### 5.Define las caracterĆ­sticas y diferencias entre los comando rbind, merge y Reduce.

rbind

Combina vectores, matrices o data frames por filas ##### merge Puedes combinar sólo 2 data frames a la vez ##### Reduce Puedes combinar mÔs de 2 data frames ##### 6.Realizar un grÔfico pie para la variable tipo.

pcg <- round((table(data$tipo)/sum(table(data$tipo)))*100,2)
lbls<- paste0(pcg,"%")
pie(pcg,labels = lbls, col=1:3,
    main="Tipo de ocupación",
    radius = 1)
legend("topright",c("Cuello azul","Profesional","Cuello blanco"),fill =1:3 ,cex = 0.6)

7. Elaborar un histograma, y un histograma de densidad junto con la linea de función de distribución normal sobre las variables educación e ingreso.

+educación

hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
     col="green")
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)

hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
     col="green",probability = T)
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)

+ingresos

hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
     col="green")
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)

hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
     col="green",probability = T)
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)

8.Elaborar un diagrama de cajas sobre la variable mujeres y dar la interpretación
boxplot(data$mujeres,main= "Diagrama de cajas \n de la variable mujeres",col = "pink")

La mayorĆ­a de los datos estan agruapados en los valores inciales haciendo que haya muchos outliers en el extremo superior(datos fuera del boxplot)

9. Haz un grĆ”fico de dispersion sobre las variable prestigio (ā€œyā€) e ingreso (ā€œxā€),junto con su linea regresora
plot(data$ing,
     data$prestigio, 
     xlab = "Ingreosos",
     ylab = "Prestigio",
     main = "Nivel de prestigio por cantidad de ingresos")
abline(lm(prestigio~ing,data = data),col="red")

10.Elabora una matriz de dispersiones sobre la base de datos con todas las variables
pairs(Prestige)