library(car)
## Loading required package: carData
library(Hmisc)
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## Loading required package: ggplot2
##
## Attaching package: 'Hmisc'
## The following objects are masked from 'package:base':
##
## format.pval, units
Seleccionar la data Prestige
data <- Prestige
colnames(data) <- c("educ","ing","mujeres","prestigio","cod","tipo")
nombres <- c("Promedio de aƱos de estudio deltrabajador nombrado",
"Promedio de ingreso en dólares del nombrado",
"Porcentaje de mujeres nombradas",
"Valoración de prestigio dePineo-Porter",
"Código de ocupación en el censo",
"Tipo de ocupación en 3 niveles")
label(data$educ)= nombres[1]
label(data$ing)= nombres[2]
label(data$mujeres)= nombres[3]
label(data$prestigio)= nombres[4]
label(data$cod)= nombres[5]
label(data$tipo)= nombres[6]
data$tipo=factor(data$tipo,labels = c("1","2","3"))
data$tipo=factor(data$tipo,labels = c("Cuello azul","Profesional","Cuello blanco"))
Cuello Azul ( blue collar): Son las personas que hacen trabajos manuales, su labor es percebido como de menor importancia y relacionado a tareas que no requieren de un conocimiento especializado.
Cuello Blanco ( white collar): Personas que realizan un trabajo mental mĆ”s que fĆsico. Usualmente tienen un salario mas elevados que los cuellos azules y estĆ”n relacionados a cargos administrativos, mejor educación y con el stigma de una mejor posición social.
##### 5.Define las caracterĆsticas y diferencias entre los comando rbind, merge y Reduce.
Combina vectores, matrices o data frames por filas ##### merge Puedes combinar sólo 2 data frames a la vez ##### Reduce Puedes combinar mÔs de 2 data frames ##### 6.Realizar un grÔfico pie para la variable tipo.
pcg <- round((table(data$tipo)/sum(table(data$tipo)))*100,2)
lbls<- paste0(pcg,"%")
pie(pcg,labels = lbls, col=1:3,
main="Tipo de ocupación",
radius = 1)
legend("topright",c("Cuello azul","Profesional","Cuello blanco"),fill =1:3 ,cex = 0.6)
+educación
hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
col="green")
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)
hist(data$educ,xlab = label(data$educ),main="Histograma de Educ",
col="green",probability = T)
curve(dnorm(x, mean = mean(data$educ), sd=sd(data$educ)), col="darkblue", add = TRUE)
+ingresos
hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
col="green")
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)
hist(data$ing,xlab = label(data$ing),main="Histograma de Ing",
col="green",probability = T)
curve(dnorm(x, mean = mean(data$ing), sd=sd(data$ing)), col="darkblue", add = TRUE)
boxplot(data$mujeres,main= "Diagrama de cajas \n de la variable mujeres",col = "pink")
La mayorĆa de los datos estan agruapados en los valores inciales haciendo que haya muchos outliers en el extremo superior(datos fuera del boxplot)
plot(data$ing,
data$prestigio,
xlab = "Ingreosos",
ylab = "Prestigio",
main = "Nivel de prestigio por cantidad de ingresos")
abline(lm(prestigio~ing,data = data),col="red")
pairs(Prestige)