Para poder accerder a la base de datos Prestige, el cual tendra en su contenido las etapas en su contenido las etapas iniciales que formaran parte del desarrollo o aplicacion de los temas enseñados tenemos que seguir los paso siguientes pasos:
library(car)
## Loading required package: carData
data <- Prestige
head(data)
## education income women prestige census type
## gov.administrators 13.11 12351 11.16 68.8 1113 prof
## general.managers 12.26 25879 4.02 69.1 1130 prof
## accountants 12.77 9271 15.70 63.4 1171 prof
## purchasing.officers 11.42 8865 9.11 56.8 1175 prof
## chemists 14.62 8403 11.68 73.5 2111 prof
## physicists 15.64 11030 5.13 77.6 2113 prof
Con la base de datos “data”, realizar un cambio de variables y las etiquetas de tal modo que se presenten de la siguiente manera
#Primero renombramos con la libreria
library(plyr)
data <- rename(data, c(education= "educ" , income="ing",
women="mujeres", prestige="prestigio",
census="cod", type="tipo"))
library(Hmisc)
label(data$educ)="Promedio de años de estudio del trabajador nombrado"
label(data$ing)="Promedio de ingresos en dolares del nombrado"
label(data$mujeres)="Porcentajes de mujeres nombradas"
label(data$prestigio)="Valor de prestigio Pineo-Porteer"
label(data$cod)="Codigo de ocupacion en el censo"
label(data$tipo)= "Tipo de ocupacion en 3 niveles"
head(data)
## educ ing mujeres prestigio cod tipo
## gov.administrators 13.11 12351 11.16 68.8 1113 prof
## general.managers 12.26 25879 4.02 69.1 1130 prof
## accountants 12.77 9271 15.70 63.4 1171 prof
## purchasing.officers 11.42 8865 9.11 56.8 1175 prof
## chemists 14.62 8403 11.68 73.5 2111 prof
## physicists 15.64 11030 5.13 77.6 2113 prof
#View(data)
#Con este comando visualizamos la data con su label
Realizar un cambio de varuable o recodifiacion en la variable tipo con la siguientes caractristicas
Si es bc, entonces 1
Si es prof, entonces 2
Si es wc, entonces 3
data$Tipo[data$tipo=="bc"]= 1
data$Tipo[data$tipo=="prof"]= 2
data$Tipo[data$tipo=="wc"]= 3
table(data$Tipo) #tabla d frecuncias d cuantos 1,2,3 hay
##
## 1 2 3
## 44 31 23
head(data$Tipo,n=50) #mustra los primeros 50 datos y vemos que si se cambio
## [1] 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
## [26] 2 2 1 2 2 3 2 3 NA 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
Hecho el paso 2, aplicar sobre la variable tipo un cambio a factor, en donde se genere las siguientes etiquetas de valor:
“Cuello azul” si es 1
“Profesional” si es 2
“Cuello blanco” si es 3
data$TIPO[data$Tipo==1]="Cuello azul"
data$TIPO[data$Tipo==2]="Profesional"
data$TIPO[data$Tipo==3]="Cuello Blanco"
head(data$TIPO, n=50)
## [1] "Profesional" "Profesional" "Profesional" "Profesional"
## [5] "Profesional" "Profesional" "Profesional" "Profesional"
## [9] "Profesional" "Profesional" "Profesional" "Profesional"
## [13] "Profesional" "Profesional" "Profesional" "Profesional"
## [17] "Profesional" "Profesional" "Profesional" "Profesional"
## [21] "Profesional" "Profesional" "Profesional" "Profesional"
## [25] "Profesional" "Profesional" "Profesional" "Cuello azul"
## [29] "Profesional" "Profesional" "Cuello Blanco" "Profesional"
## [33] "Cuello Blanco" NA "Cuello Blanco" "Cuello Blanco"
## [37] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [41] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [45] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [49] "Cuello Blanco" "Cuello Blanco"
table(data$TIPO)
##
## Cuello azul Cuello Blanco Profesional
## 44 23 31
En el word o pdf generado haz un resumen de no mas de tres lineas de cada una de las definiciones de cuello azul y cuello blanco.
Al referirnos uellos blancos y azules entramos directamenta al estatus social y al estatus de trabajo; mientras que los cuellos blancos son ofinisitas y “de diferente lase soial(alta)”, los cuellos azules son los de manofacutra, agricultura "socialmente de clase inferior o baja). Con l avanze de la tecnologia esta gran brecha ahi cerrandose tambien porque los trabajos de los cuellos blancos se a ido saturando.
Defina las caracteristicas y diferencias entre los comandos rbind, merge, Reduce
Los comandos presentados son para unir bases de datos pero cada uno de ellos tiene una diferencia impotante:
rbind: este comando sirbe para unir bases de forma vertical es decir acomoda las bas de datos debajo de la base de dato “base” usando un ID.
merge: este comando une los datos de forma hoizontal con ota base de datos mediante el que uasmos unos identifiadore mediante “by” y si lo ponemos asi se omitiran los NA, pero para espcificar que no se eliminen ponemos ,“all=T”.
Reduce: complementando lo anterior el merge solo podia unir dos bases de datos, con el comando Reduce lo hacmos para ditinta bases de datos las desventajas es que se eliminaran los NA’s.
Realizar un grafico de pie para la variable tipo
xd = table(data$TIPO)/sum(table(data$TIPO))*100
xd=data.frame(xd)
xd$lbls <- with(xd,xd$Freq/sum(xd$Freq)*100)
xd=xd[,-2]
lbls=(paste0(xd[,1]," ",xd[,2],"","%"))
pie(table(data$TIPO), labels = lbls,
main = "GRAFICO PIe PARA TIPO",
radius = 1)
#PROFE ME OLVIDE DE COMO REDONDEAR ME PODRIA COMENTAR UNA FORMA DE REDONDEAR?
Elabora un histograma y un histograma de densidad junto con la linea de funcion de distribuion normal sobre las variables de educacion e ingreso.
hist(data$educ,
xlab = "Promedio de años estudiados",
col="yellow",
main="histograma de educacion")
#### histograma con linea distribucion normal
m=mean(data$ing)
s=sqrt(var(data$ing))
hist(data$ing,
xlab="ingreso promedio",
col="red",
main = "Histograma con linea de distribucion normal",
probability = TRUE)
curve(dnorm(x,mean = m,sd=s),col="darkblue", add =TRUE)
elaborar un diagrama de la variable mujeres y dar una interpretacion
boxplot(data$mujeres, col=rainbow(2), main ="Mujeres ")
library(moments)
kurtosis(data$mujeres)
## [1] 2.370462
skewness(data$mujeres)
## [1] 0.9121577
Vemos que no hay valores extremos(outlaiers) y la caja lo capta todos los datos vemos que la media al no estar en el centro presenta asimtria tambien los datos estan medios planos, ayudandonos con algunos estadisticos como asimetria que 0.9121 indicando qu hay una asimetria postiva indicando qu los dato son superiores a la media, una curtosis de 2.37 sindo menor que 3(curtosis de distribuion normal), lo cual indica que e platucurtica qu indica qu hay poca concentracion de datos en la media.
Haz un grafico de dispercion sobre la variable de prestigio(“y”) e ingreso (“X”) junto on linea regresora
plot(data$ing,data$prestigio,
xlab= "Promedio de ingreso",
ylab = "Valo de prestigio",
main ="Dispercion entree prestigio e ingreso",
xlim = c(0,25000))
abline(lm(data$prestigio~data$ing,data=data),col = "red")
cor(data$ing,data$prestigio)
## [1] 0.7149057
Elabora una matriz de dispersiones sobre la base de datos con todas las variables.
pairs(~educ + ing + mujeres + prestigio + cod + Tipo,
data = data,
main = "Matriz de dispersiones simple",
col="black")