Set de ejercicios

Para poder accerder a la base de datos Prestige, el cual tendra en su contenido las etapas en su contenido las etapas iniciales que formaran parte del desarrollo o aplicacion de los temas enseñados tenemos que seguir los paso siguientes pasos:

library(car)
## Loading required package: carData
data <- Prestige
head(data)
##                     education income women prestige census type
## gov.administrators      13.11  12351 11.16     68.8   1113 prof
## general.managers        12.26  25879  4.02     69.1   1130 prof
## accountants             12.77   9271 15.70     63.4   1171 prof
## purchasing.officers     11.42   8865  9.11     56.8   1175 prof
## chemists                14.62   8403 11.68     73.5   2111 prof
## physicists              15.64  11030  5.13     77.6   2113 prof

Pregunta 1)

Con la base de datos “data”, realizar un cambio de variables y las etiquetas de tal modo que se presenten de la siguiente manera

#Primero renombramos con la libreria 
library(plyr)
data <- rename(data, c(education= "educ" , income="ing", 
                       women="mujeres", prestige="prestigio",
                       census="cod", type="tipo"))
library(Hmisc)
label(data$educ)="Promedio de años de estudio del trabajador nombrado"
label(data$ing)="Promedio de ingresos en dolares del nombrado"
label(data$mujeres)="Porcentajes de mujeres nombradas"
label(data$prestigio)="Valor de prestigio Pineo-Porteer"
label(data$cod)="Codigo de ocupacion en el censo"
label(data$tipo)= "Tipo de ocupacion en 3 niveles"
head(data)
##                      educ   ing mujeres prestigio  cod tipo
## gov.administrators  13.11 12351   11.16      68.8 1113 prof
## general.managers    12.26 25879    4.02      69.1 1130 prof
## accountants         12.77  9271   15.70      63.4 1171 prof
## purchasing.officers 11.42  8865    9.11      56.8 1175 prof
## chemists            14.62  8403   11.68      73.5 2111 prof
## physicists          15.64 11030    5.13      77.6 2113 prof
#View(data)
#Con este comando visualizamos la data con su label 

Pregunta 2

Realizar un cambio de varuable o recodifiacion en la variable tipo con la siguientes caractristicas

data$Tipo[data$tipo=="bc"]= 1
data$Tipo[data$tipo=="prof"]= 2
data$Tipo[data$tipo=="wc"]= 3
table(data$Tipo) #tabla d frecuncias d cuantos 1,2,3 hay
## 
##  1  2  3 
## 44 31 23
head(data$Tipo,n=50) #mustra los primeros 50 datos y vemos que si se cambio
##  [1]  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2  2
## [26]  2  2  1  2  2  3  2  3 NA  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3  3

Pregunta 3

Hecho el paso 2, aplicar sobre la variable tipo un cambio a factor, en donde se genere las siguientes etiquetas de valor:

data$TIPO[data$Tipo==1]="Cuello azul"
data$TIPO[data$Tipo==2]="Profesional"
data$TIPO[data$Tipo==3]="Cuello Blanco"
head(data$TIPO, n=50)
##  [1] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
##  [5] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
##  [9] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
## [13] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
## [17] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
## [21] "Profesional"   "Profesional"   "Profesional"   "Profesional"  
## [25] "Profesional"   "Profesional"   "Profesional"   "Cuello azul"  
## [29] "Profesional"   "Profesional"   "Cuello Blanco" "Profesional"  
## [33] "Cuello Blanco" NA              "Cuello Blanco" "Cuello Blanco"
## [37] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [41] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [45] "Cuello Blanco" "Cuello Blanco" "Cuello Blanco" "Cuello Blanco"
## [49] "Cuello Blanco" "Cuello Blanco"
table(data$TIPO)
## 
##   Cuello azul Cuello Blanco   Profesional 
##            44            23            31

Ejercicio 4

En el word o pdf generado haz un resumen de no mas de tres lineas de cada una de las definiciones de cuello azul y cuello blanco.

RESUMEN

Al referirnos uellos blancos y azules entramos directamenta al estatus social y al estatus de trabajo; mientras que los cuellos blancos son ofinisitas y “de diferente lase soial(alta)”, los cuellos azules son los de manofacutra, agricultura "socialmente de clase inferior o baja). Con l avanze de la tecnologia esta gran brecha ahi cerrandose tambien porque los trabajos de los cuellos blancos se a ido saturando.

Ejercicio 5

Defina las caracteristicas y diferencias entre los comandos rbind, merge, Reduce

Los comandos presentados son para unir bases de datos pero cada uno de ellos tiene una diferencia impotante:

Ejercicio 6

Realizar un grafico de pie para la variable tipo

xd = table(data$TIPO)/sum(table(data$TIPO))*100
xd=data.frame(xd)
xd$lbls <- with(xd,xd$Freq/sum(xd$Freq)*100)
xd=xd[,-2]
lbls=(paste0(xd[,1]," ",xd[,2],"","%"))
pie(table(data$TIPO), labels = lbls,
    main = "GRAFICO PIe PARA TIPO",
    radius = 1)

#PROFE ME OLVIDE DE COMO REDONDEAR ME PODRIA COMENTAR UNA FORMA DE REDONDEAR?

Pregunta 7

Elabora un histograma y un histograma de densidad junto con la linea de funcion de distribuion normal sobre las variables de educacion e ingreso.

hist(data$educ,
     xlab = "Promedio de años estudiados",
     col="yellow",
     main="histograma de educacion")

#### histograma con linea distribucion normal
m=mean(data$ing)
s=sqrt(var(data$ing))
hist(data$ing,
     xlab="ingreso promedio",
     col="red",
     main = "Histograma con linea de distribucion normal",
     probability = TRUE)
curve(dnorm(x,mean = m,sd=s),col="darkblue", add =TRUE)

Pregunta 8

elaborar un diagrama de la variable mujeres y dar una interpretacion

boxplot(data$mujeres, col=rainbow(2), main ="Mujeres ")

library(moments)
kurtosis(data$mujeres)
## [1] 2.370462
skewness(data$mujeres)
## [1] 0.9121577

Vemos que no hay valores extremos(outlaiers) y la caja lo capta todos los datos vemos que la media al no estar en el centro presenta asimtria tambien los datos estan medios planos, ayudandonos con algunos estadisticos como asimetria que 0.9121 indicando qu hay una asimetria postiva indicando qu los dato son superiores a la media, una curtosis de 2.37 sindo menor que 3(curtosis de distribuion normal), lo cual indica que e platucurtica qu indica qu hay poca concentracion de datos en la media.

Ejercicio 9

Haz un grafico de dispercion sobre la variable de prestigio(“y”) e ingreso (“X”) junto on linea regresora

plot(data$ing,data$prestigio,
     xlab= "Promedio de ingreso",
     ylab = "Valo de prestigio",
     main ="Dispercion entree prestigio e ingreso",
     xlim = c(0,25000))

abline(lm(data$prestigio~data$ing,data=data),col = "red")

cor(data$ing,data$prestigio)
## [1] 0.7149057

Ejercicio 10

Elabora una matriz de dispersiones sobre la base de datos con todas las variables.

pairs(~educ + ing + mujeres + prestigio + cod + Tipo,
      data = data,
      main = "Matriz de dispersiones simple",
      col="black")