R Markdown

library(dplyr)

Datos_de_empleados<-as.data.frame(HR_Employee_Data)

head(Datos_de_empleados$satisfaction_level)

str(Datos_de_empleados$satisfaction_level)

tail(Datos_de_empleados$satisfaction_level)

#Resumen de datos….

summary(Datos_de_empleados\(satisfaction_level) summary(Datos_de_empleados\)last_evaluation) summary(Datos_de_empleados\(number_project) summary(Datos_de_empleados\)average_montly_hours) summary(Datos_de_empleados\(time_spend_company) summary(Datos_de_empleados\)Work_accident) summary(Datos_de_empleados\(left) summary(Datos_de_empleados\)promotion_last_5years) summary(Datos_de_empleados)

#Media o promedio …..

mean(Datos_de_empleados\(satisfaction_level) mean(Datos_de_empleados\)last_evaluation) mean(Datos_de_empleados\(number_project) mean(Datos_de_empleados\)average_montly_hours) mean(Datos_de_empleados\(time_spend_company) mean(Datos_de_empleados\)Work_accident) mean(Datos_de_empleados\(left) mean(Datos_de_empleados\)promotion_last_5years)

#Mediana …..

median(Datos_de_empleados\(satisfaction_level) median(Datos_de_empleados\)last_evaluation) median(Datos_de_empleados\(number_project) median(Datos_de_empleados\)average_montly_hours) median(Datos_de_empleados\(time_spend_company) median(Datos_de_empleados\)Work_accident) median(Datos_de_empleados\(left) median(Datos_de_empleados\)promotion_last_5years)

#Rango….

range(Datos_de_empleados\(satisfaction_level) range(Datos_de_empleados\)last_evaluation) range(Datos_de_empleados\(number_project) range(Datos_de_empleados\)average_montly_hours) range(Datos_de_empleados\(time_spend_company) range(Datos_de_empleados\)Work_accident) range(Datos_de_empleados\(left) range(Datos_de_empleados\)promotion_last_5years)

#Disperción….

diff(range(Datos_de_empleados\(satisfaction_level)) diff(range(Datos_de_empleados\)last_evaluation)) diff(range(Datos_de_empleados\(number_project)) diff(range(Datos_de_empleados\)average_montly_hours)) diff(range(Datos_de_empleados\(time_spend_company)) diff(range(Datos_de_empleados\)Work_accident)) diff(range(Datos_de_empleados\(left)) diff(range(Datos_de_empleados\)promotion_last_5years))

#Quartil…..

quantile(Datos_de_empleados\(satisfaction_level) quantile(Datos_de_empleados\)last_evaluation) quantile(Datos_de_empleados\(number_project) quantile(Datos_de_empleados\)average_montly_hours) quantile(Datos_de_empleados\(time_spend_company) quantile(Datos_de_empleados\)Work_accident) quantile(Datos_de_empleados\(left) quantile(Datos_de_empleados\)promotion_last_5years)

#Moda….. frecuencias <- data.frame(table(Datos_de_empleados\(satisfaction_level)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable Satistaction_level es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(last_evaluation)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable last_evluation es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(last_evaluation)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable last_evluation es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(number_project)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable number_project es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(average_montly_hours)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable average_montly_hours”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(time_spend_company)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable time_spend_company es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(Work_accident)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable Work_accident es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(left)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable left es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(promotion_last_5years)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable promotion_last_5years es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(Department)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable department es”, moda)

frecuencias <- data.frame(table(Datos_de_empleados\(salary)) moda <- frecuencias[which.max(frecuencias\)Freq),1]

paste(“La moda de la variable salary es”, moda)

#Varianza…..

var(Datos_de_empleados$satisfaction_level)

#Desviación de estandar….

sd(Datos_de_empleados$satisfaction_level)

#Tabla de frecuencia agrupada….

variable <- as.numeric(Datos_de_empleados$satisfaction_level)

Lista <- hist(variable,plot=FALSE); Lista

“Tabla de frecuencia” <- hist(“variable”, plot=FALSE)

“Tabla de frecuencia” <- hist(“satisfaction_level”, plot=FALSE)

#Grafico de barra

library(dlyr) library(dplyr) library(ggplot2) library(cowplot) library(fotcats)

#GRAFICO DE BARRA

grafBarras <- barplot(table(Datos_de_empleados$salary),main = ‘Gráfica de barras’, xlab = ‘Salary’, ylab = ‘Frecuencia’)


library(openxlsx) library(questionr) library(ggplot2) # frecuencia simple

Datos_de_empleados<-as.data.frame(HR_Employee_Data)

salary <- Datos_de_empleados[,11]

tabla_de_salarios<-freq(salary, cum=TRUE, sort=“dec”)

tipo_salarios<-c(“Low”,“Medium”,“High”) salario <- tabla_salarios[1:3,1] head(tipo_salarios) head(salario)

organizado_salario <- data.frame(tipo_salarios, salario)

head(organizado_salario)

#Diagrama de barras library(ggplot2) ggplot(data=organizado_salario, aes(x=tipo_salario, y=salario))+geom_bar(stat=“identity”)

frecuencia simple

tabla_salarios <- freq(salarios, cum=TRUE, sort=“dec”)

tipo_salario <- c(“Low”,“Medium”,“High”) salario <- tabla_salarios[1:3,1] head(tipo_salario) head(salario)

or_salario <- data.frame( tipo_salario, salario)

head(or_salario)

#Diagrama de barras library(ggplot2) ggplot(data=or_salario, aes(x=tipo_salario, y=salario))+geom_bar(stat=“identity”)

#Realización de un diagrama circular porcentaje <-tabla_salarios[,2] etiqueta <-paste(porcentaje,“%”,sep=” “) colores<- c(”purple”,“blue”,“skyblue”) pie(porcentaje,labels = etiqueta,clockwise = TRUE,col=colores, main=“Porcentaje de Salarios”) legend(“topright”,tipo_salario,cex=0.5,fill=colores) #ggplot(organizado_salario, aes(x=““, y=salario, fill=tipo_salario))+geom_bar(stat=”identity”, width = 1)+coord_polar(“y”,start=0)

Datos_de_empleados<-as.data.frame(HR_Employee_Data) satisfaction_level <- Datos_de_empleados[,2] #CLASE n_sturges=1+log(length(satisfaction_level))/log(2) n_sturgesc=ceiling(n_sturges) n_sturgesf=floor(n_sturges)

n_clases =0 if (n_sturges%%2==0){ n_clases=n_sturgesf } else{ n_clases = n_sturgesc } R=max(satisfaction_level)-min(satisfaction_level) w=ceiling(R/n_clases)

#Tabla de frecuencia
bins<- seq(min(satisfaction_level), max(satisfaction_level)+w,by=w)

View(bins)

nivel_satisfacción <- cut(satisfaction_level,bins) Tabla_frec <- transform(table(satisfaction_level),Rel_freq=prop.table(Freq), Cum_Freq=cumsum(Freq)) View(Tabla_frec)

#Histograma para la tabla de frecuencias agrupadas str(Tabla_frec)

organizado_satisfacción <- data.frame(x=Tabla_frec\(satisfaction_level,y=Tabla_frec\)Freq)

ggplot(data= organizado_satisfacción, aes(x=x,y=y))+ geom_bar(stat=“identity”,color=“blue”,fill=“red”)+ xlab(“Rango de satisfacción trabajadores”)+ ylab(“Frecuencia”)

#Histograma acumulado Frec_acumulada <- Tabla_frec[,3]

organizado_satisfacción <- data.frame(x=Tabla_frec\(satisfaction_level,y=Tabla_frec\)Cum_Freq)

ggplot(data= organizado_satisfacción, aes(x=x,y=y))+ geom_bar(stat=“identity”,color=“blue”,fill=“red”)+ xlab(“Rango de satisfacción trabajadores”)+ ylab(“Frecuencia”)

histogramaFreq = hist(NivelSat, breaks = “Sturges”, col = “ivory”, xlab = “Nivel de satisfacción”, ylab = “Frecuencia”, main = “Histograma de nivel de satisfacción + Diagrama poligonal”) lines(c(0, histogramaFreq\(mids), c(0,histogramaFreq\)counts), col = “red”, lwd = 2)

  1. Histograma de Frecuencias Acumuladas + Diagrama de Ojiva Datos_de_empleados<-as.data.frame(HR_Employee_Data)

histogramaAcum <- hist(Nivel, breaks = “Sturges”,plot=FALSE); histogramaAcum\(counts <- cumsum(histogramaAcum\)counts) plot(histogramaAcum, col = “ivory”, xlab = “Nivel de satisfacción”, ylab = “Frecuencia”, main = “Histograma de nivel de satisfacción + Diagrama poligonal”) lines(c(0, histogramaFreq\(mids), c(0,cumsum(histogramaFreq\)counts)), col = “red”, lwd = 2)

#Histograma de Frecuencias + Diagrama Poligonal*

histogramaFreq = hist(Nivel,breaks = “Sturges”, col = “ivory”, xlab = “Nivel de satisfacción”, ylab = “Frecuencia”, main = “Histograma de nivel de satisfacción + Diagrama poligonal”) lines(c(0, histogramaFreq\(mids), c(0,histogramaFreq\)counts), col = “red”, lwd = 2)

#Diagrama de caja y extensión*

boxplot(Nivel,horizontal = TRUE, main=“Diagrama de cajas y bigotes (Nivel de satisfacción)”,col = “ivory”)