Durante la realización de este trabajo se analizó una base de datos con la información de una empresa. Gracias a la toma de datos que se realizó anteriormente es posible sacar conclusiones con base en ellos.
Gracias a este estudio se pudieron determinar distintas medidas de tendencia central de los datos. También, se encontraron patrones y se organizaron los datos. Los própositos de este estudio fueron, principalmente, de estádistica descriptiva.
Una empresa especializada en el estudio de cuencas y cuerpos para el uso aprovechable de energía cambia de cuerpo directivo, y la nueva administración decide realizar un seguimiento acerca de las personas que trabajan en su empresa, así como sus salarios, con el propósito de optimizar y darles mejor calidad de empleo el cual fue bajo debido a ciertos manejos de la administración anterior
En primera instancia se importaron los datos que se hallaban en Excel.
datos <- read.xlsx("estadistica.xlsx")
Después de realizar esto se extrayeron los datos que necestibamos para analizar cómo era el salarios de las personas de esta empresa.
#Datos cuantitativos
#Tipo de salario
salarios <- datos[,11]
#departamentos
departamentos <-datos[,10]
#accidentes de trabajo
accidentes <- datos[,7]
#dato cuantitativo
#tiempo perdido
perdido <- datos[,6]
#número de proyectos
proyectos <-datos[,4]
Con los datos depurados y adecuadamente extraidos en un vector se realizó una tabla de frecuencia. De esta Será más fácil interpretar los datos y a su vez, visualizarlos.
#tabla de frecuencia simple para tabla de salarios
tabla_salarios <- freq(salarios, cum=TRUE, sort="dec")
head(tabla_salarios)
## n % val% %cum val%cum
## low 7316 48.8 48.8 48.8 48.8
## medium 6446 43.0 43.0 91.8 91.8
## high 1237 8.2 8.2 100.0 100.0
#tabla de frecuencia simple para tabla de departamentos
tabla_departamentos <- freq(departamentos, cum=TRUE, sort="dec")
head(tabla_departamentos)
## n % val% %cum val%cum
## sales 4140 27.6 27.6 27.6 27.6
## technical 2720 18.1 18.1 45.7 45.7
## support 2229 14.9 14.9 60.6 60.6
## IT 1227 8.2 8.2 68.8 68.8
## product_mng 902 6.0 6.0 74.8 74.8
## marketing 858 5.7 5.7 80.5 80.5
#tabla de frecuencia simple para tabla de departamentos
tabla_accidentes <- freq(accidentes, cum=TRUE, sort="dec")
head(tabla_accidentes)
## n % val% %cum val%cum
## 0 12830 85.5 85.5 85.5 85.5
## 1 2169 14.5 14.5 100.0 100.0
#tabla de frecuencia simple para tabla de departamentos
tabla_perdido <- freq(perdido, cum=TRUE, sort="dec")
head(tabla_perdido)
## n % val% %cum val%cum
## 3 6443 43.0 43.0 43.0 43.0
## 2 3244 21.6 21.6 64.6 64.6
## 4 2557 17.0 17.0 81.6 81.6
## 5 1473 9.8 9.8 91.5 91.5
## 6 718 4.8 4.8 96.2 96.2
## 10 214 1.4 1.4 97.7 97.7
#tabla de frecuencia simple para tabla de departamentos
tabla_proyectos <- freq(proyectos, cum=TRUE, sort="dec")
head(tabla_proyectos)
## n % val% %cum val%cum
## 4 4365 29.1 29.1 29.1 29.1
## 3 4055 27.0 27.0 56.1 56.1
## 5 2761 18.4 18.4 74.5 74.5
## 2 2388 15.9 15.9 90.5 90.5
## 6 1174 7.8 7.8 98.3 98.3
## 7 256 1.7 1.7 100.0 100.0
#
Se realizó también un diagrama de tallos y hojas para el conteo de datos cuantitativos correspondientes al número de proyectos realizados por trabajador y el tiempo perdido por cada empleado de la empresa.
#Diagrama de tallos y hojas para el número de proyectos realizados y tiempo perdido por empleado
stem(proyectos)
##
## The decimal point is at the |
##
## 2 | 00000000000000000000000000000000000000000000000000000000000000000000+2308
## 2 |
## 3 | 00000000000000000000000000000000000000000000000000000000000000000000+3975
## 3 |
## 4 | 00000000000000000000000000000000000000000000000000000000000000000000+4285
## 4 |
## 5 | 00000000000000000000000000000000000000000000000000000000000000000000+2681
## 5 |
## 6 | 00000000000000000000000000000000000000000000000000000000000000000000+1094
## 6 |
## 7 | 00000000000000000000000000000000000000000000000000000000000000000000+176
stem(perdido)
##
## The decimal point is at the |
##
## 2 | 00000000000000000000000000000000000000000000000000000000000000000000+3164
## 2 |
## 3 | 00000000000000000000000000000000000000000000000000000000000000000000+6363
## 3 |
## 4 | 00000000000000000000000000000000000000000000000000000000000000000000+2477
## 4 |
## 5 | 00000000000000000000000000000000000000000000000000000000000000000000+1393
## 5 |
## 6 | 00000000000000000000000000000000000000000000000000000000000000000000+638
## 6 |
## 7 | 00000000000000000000000000000000000000000000000000000000000000000000+108
## 7 |
## 8 | 00000000000000000000000000000000000000000000000000000000000000000000+82
## 8 |
## 9 |
## 9 |
## 10 | 00000000000000000000000000000000000000000000000000000000000000000000+134
Posteriormente se extrageron los datos de las dos primeras columnas para realizar una gráfica de barras que mostrase la frecuencia del tipo de salario.Lo mismo se hizo para los departamentos de la empresa. Es decir, la frecuencia del dato cualitativo. Todo esto se organizó también en un data.frame
#data farme tipo de salario
tipo_salario <- c("Low","Medium","High")
salarito <- tabla_salarios[1:3,1]
organizado_salario <- data.frame(
tipo_salario,
salarito)
#data frame para tipo de departamento
tipo_departamento <-c("sales","Technical", "support", "IT", "product_mng", "marketing")
departamentico <-tabla_departamentos[1:6,1]
organizado_departamento <-data.frame(
tipo_departamento,
departamentico
)
#data frame para los accidentes
tipo_accidente <-c("Sin accidente","Accidente")
accident <-tabla_accidentes[1:2,1]
organizado_accidentes <-data.frame(
tipo_accidente,
accident
)
Con estos data.frame fue posible obtener una gráfica de barras. Esta se muestra acontinuación.
#Diagrama de barras para el salario
library(ggplot2)
ggplot(data=organizado_salario, aes(x=tipo_salario, y=salarito))+geom_bar(stat="identity")
#Diagrama de barras para los tipos de departamentos
ggplot(data=organizado_departamento, aes(x=tipo_departamento, y=departamentico))+geom_bar(stat="identity")
#Diagrama de barras para la frecuencia de los accidentes en la empresa
ggplot(data=organizado_accidentes, aes(x=tipo_accidente, y=accident))+geom_bar(stat="identity")
Para poder entender mejor toda esta información otra determinación que se tomó en cuenta fue la de crear un gráfico circular. De esta manera sería posible también observar cuál era el porcentaje de empleados que recibía un sueldo bajo, alto o medio.
Para ello se creó un vector que recopilará los porcentajes y junto con los otros parámetros se desarrolló el siguiente gráfico de pastel.
#Realización de un diagrama circular para los salarios
porcentaje <-tabla_salarios[,2]
etiqueta <-paste(porcentaje,"%",sep=" ")
colores<- c("purple","blue","skyblue")
pie(porcentaje,labels = etiqueta,clockwise = TRUE,col=colores,
main="Porcentaje de Salarios")
legend("topright",tipo_salario,cex=0.5,fill=colores)
#Realización de un diagrama circular para los tipos de departamento
porcentaje_2 <-tabla_departamentos[,2]
etiqueta_2 <-paste(porcentaje_2,"%", sep=" ")
colores_2 <- c("aquamarine", "cyan", "blue", "red", "green", "darkgrey")
pie(porcentaje_2, labels=etiqueta_2,clockwise=TRUE, col=colores_2, main="Porcentaje de departamentos")
En la siguiente parte del trabajo se desarrlló el análisis de la sección que corresponde a la satisfacción de los empleados.
Los primero que hacemos es cargar los datos en un vector que nos muestré únicamente la satisfacción de los empleados. En segundo, realizaremos lo mismo pero para el desempeño según la última evaluación realizada por los mismos.Por último, también se realizó esto para las horas promedio mensual de horas invertidas de los empeados.
satisfacción <- datos[,2]
desempeño <- datos[,3]
horas <- datos[,5]
Para el tratamiento de datos cualitativos es pertinente realizar una tabla de frecuencia con datos agrupados Es por este motivo que se utilizó la regla de Sturges para definir el número de intervalos necesarios para la tabla. Además, para la creación esta tabla también fue necesario obtener el Rango y la Amplitud (w).
#Para los datos de satisfacción de los empleados
n_sturges=1+log(length(satisfacción))/log(2)
n_sturgesc=ceiling(n_sturges)
n_sturgesf=floor(n_sturges)
n_clases =0
if (n_sturges%%2==0){
n_clases=n_sturgesf
} else{
n_clases = n_sturgesc
}
R=max(satisfacción)-min(satisfacción)
w=ceiling(R/n_clases)
#Para los datos de desempeño de los empleados
n_sturge=1+log(length(desempeño))/log(2)
n_sturgec=ceiling(n_sturge)
n_sturgef=floor(n_sturge)
n_clase =0
if (n_sturge%%2==0){
n_clase=n_sturgef
} else{
n_clase = n_sturgec
}
Ri=max(desempeño)-min(desempeño)
wi=ceiling(R/n_clase)
#Para los datos de promedio de horas mensuales de cada empleado
n_sturg=1+log(length(horas))/log(2)
n_sturgc=ceiling(n_sturg)
n_sturgf=floor(n_sturg)
n_clas =0
if (n_sturg%%2==0){
n_clas=n_sturgf
} else{
n_clas = n_sturgc
}
Rii=max(horas)-min(horas)
wii=ceiling(R/n_clas)
Habiendo determinado esto fue posible hacer la tabla de frecuencia con datos agrupados.Y para ello se usó la siguiente lógica.
#Tabla de frecuencia con número de clase de satisfacción
bins<- seq(min(satisfacción), max(satisfacción)+w,by=w)
nivel_satisfacción <- cut(satisfacción,bins)
Tabla_frec <- transform(table(satisfacción),Rel_freq=prop.table(Freq), Cum_Freq=cumsum(Freq))
Tabla_frec
## satisfacción Freq Rel_freq Cum_Freq
## 1 0.09 195 0.013000867 195
## 2 0.1 358 0.023868258 553
## 3 0.11 335 0.022334822 888
## 4 0.12 30 0.002000133 918
## 5 0.13 54 0.003600240 972
## 6 0.14 73 0.004866991 1045
## 7 0.15 76 0.005067004 1121
## 8 0.16 79 0.005267018 1200
## 9 0.17 72 0.004800320 1272
## 10 0.18 63 0.004200280 1335
## 11 0.19 74 0.004933662 1409
## 12 0.2 69 0.004600307 1478
## 13 0.21 67 0.004466964 1545
## 14 0.22 60 0.004000267 1605
## 15 0.23 54 0.003600240 1659
## 16 0.24 80 0.005333689 1739
## 17 0.25 34 0.002266818 1773
## 18 0.26 30 0.002000133 1803
## 19 0.27 30 0.002000133 1833
## 20 0.28 31 0.002066804 1864
## 21 0.29 38 0.002533502 1902
## 22 0.3 39 0.002600173 1941
## 23 0.31 59 0.003933596 2000
## 24 0.32 50 0.003333556 2050
## 25 0.33 36 0.002400160 2086
## 26 0.34 48 0.003200213 2134
## 27 0.35 37 0.002466831 2171
## 28 0.36 139 0.009267284 2310
## 29 0.37 241 0.016067738 2551
## 30 0.38 189 0.012600840 2740
## 31 0.39 175 0.011667444 2915
## 32 0.4 209 0.013934262 3124
## 33 0.41 171 0.011400760 3295
## 34 0.42 155 0.010334022 3450
## 35 0.43 224 0.014934329 3674
## 36 0.44 211 0.014067605 3885
## 37 0.45 203 0.013534236 4088
## 38 0.46 95 0.006333756 4183
## 39 0.47 42 0.002800187 4225
## 40 0.48 149 0.009933996 4374
## 41 0.49 209 0.013934262 4583
## 42 0.5 229 0.015267685 4812
## 43 0.51 187 0.012467498 4999
## 44 0.52 196 0.013067538 5195
## 45 0.53 179 0.011934129 5374
## 46 0.54 185 0.012334156 5559
## 47 0.55 179 0.011934129 5738
## 48 0.56 187 0.012467498 5925
## 49 0.57 210 0.014000933 6135
## 50 0.58 182 0.012134142 6317
## 51 0.59 219 0.014600973 6536
## 52 0.6 193 0.012867525 6729
## 53 0.61 208 0.013867591 6937
## 54 0.62 188 0.012534169 7125
## 55 0.63 209 0.013934262 7334
## 56 0.64 187 0.012467498 7521
## 57 0.65 199 0.013267551 7720
## 58 0.66 228 0.015201013 7948
## 59 0.67 177 0.011800787 8125
## 60 0.68 162 0.010800720 8287
## 61 0.69 209 0.013934262 8496
## 62 0.7 205 0.013667578 8701
## 63 0.71 171 0.011400760 8872
## 64 0.72 230 0.015334356 9102
## 65 0.73 246 0.016401093 9348
## 66 0.74 257 0.017134476 9605
## 67 0.75 226 0.015067671 9831
## 68 0.76 234 0.015601040 10065
## 69 0.77 252 0.016801120 10317
## 70 0.78 241 0.016067738 10558
## 71 0.79 217 0.014467631 10775
## 72 0.8 222 0.014800987 10997
## 73 0.81 220 0.014667645 11217
## 74 0.82 241 0.016067738 11458
## 75 0.83 234 0.015601040 11692
## 76 0.84 247 0.016467765 11939
## 77 0.85 207 0.013800920 12146
## 78 0.86 200 0.013334222 12346
## 79 0.87 225 0.015001000 12571
## 80 0.88 187 0.012467498 12758
## 81 0.89 237 0.015801053 12995
## 82 0.9 220 0.014667645 13215
## 83 0.91 224 0.014934329 13439
## 84 0.92 198 0.013200880 13637
## 85 0.93 169 0.011267418 13806
## 86 0.94 167 0.011134076 13973
## 87 0.95 181 0.012067471 14154
## 88 0.96 203 0.013534236 14357
## 89 0.97 176 0.011734116 14533
## 90 0.98 183 0.012200813 14716
## 91 0.99 172 0.011467431 14888
## 92 1 111 0.007400493 14999
#Tabla de frecuencia con número de clase para el desempeño de los empleados
binsi<- seq(min(desempeño), max(desempeño)+wi,by=wi)
nivel_desempeño <- cut(desempeño,binsi)
Tabla_frecuencia <- transform(table(desempeño),Rel_freq=prop.table(Freq), Cum_frecuencia=cumsum(Freq))
Tabla_frecuencia
## desempeño Freq Rel_freq Cum_frecuencia
## 1 0.36 22 0.001466764 22
## 2 0.37 55 0.003666911 77
## 3 0.38 50 0.003333556 127
## 4 0.39 52 0.003466898 179
## 5 0.4 57 0.003800253 236
## 6 0.41 59 0.003933596 295
## 7 0.42 56 0.003733582 351
## 8 0.43 50 0.003333556 401
## 9 0.44 44 0.002933529 445
## 10 0.45 115 0.007667178 560
## 11 0.46 211 0.014067605 771
## 12 0.47 173 0.011534102 944
## 13 0.48 292 0.019467965 1236
## 14 0.49 332 0.022134809 1568
## 15 0.5 353 0.023534902 1921
## 16 0.51 345 0.023001533 2266
## 17 0.52 309 0.020601373 2575
## 18 0.53 324 0.021601440 2899
## 19 0.54 350 0.023334889 3249
## 20 0.55 358 0.023868258 3607
## 21 0.56 322 0.021468098 3929
## 22 0.57 333 0.022201480 4262
## 23 0.58 225 0.015001000 4487
## 24 0.59 255 0.017001133 4742
## 25 0.6 221 0.014734316 4963
## 26 0.61 234 0.015601040 5197
## 27 0.62 233 0.015534369 5430
## 28 0.63 236 0.015734382 5666
## 29 0.64 235 0.015667711 5901
## 30 0.65 201 0.013400893 6102
## 31 0.66 222 0.014800987 6324
## 32 0.67 245 0.016334422 6569
## 33 0.68 222 0.014800987 6791
## 34 0.69 193 0.012867525 6984
## 35 0.7 213 0.014200947 7197
## 36 0.71 196 0.013067538 7393
## 37 0.72 211 0.014067605 7604
## 38 0.73 223 0.014867658 7827
## 39 0.74 260 0.017334489 8087
## 40 0.75 238 0.015867725 8325
## 41 0.76 216 0.014400960 8541
## 42 0.77 263 0.017534502 8804
## 43 0.78 214 0.014267618 9018
## 44 0.79 241 0.016067738 9259
## 45 0.8 251 0.016734449 9510
## 46 0.81 255 0.017001133 9765
## 47 0.82 237 0.015801053 10002
## 48 0.83 269 0.017934529 10271
## 49 0.84 294 0.019601307 10565
## 50 0.85 316 0.021068071 10881
## 51 0.86 273 0.018201213 11154
## 52 0.87 326 0.021734782 11480
## 53 0.88 235 0.015667711 11715
## 54 0.89 296 0.019734649 12011
## 55 0.9 313 0.020868058 12324
## 56 0.91 287 0.019134609 12611
## 57 0.92 269 0.017934529 12880
## 58 0.93 269 0.017934529 13149
## 59 0.94 263 0.017534502 13412
## 60 0.95 258 0.017201147 13670
## 61 0.96 249 0.016601107 13919
## 62 0.97 276 0.018401227 14195
## 63 0.98 263 0.017534502 14458
## 64 0.99 258 0.017201147 14716
## 65 1 283 0.018867925 14999
#Tabla de frecuencia con número de clase para promedio de horas mensuales de los empleados
binsii<- seq(min(horas), max(horas)+wii,by=wii)
nivel_horas <- cut(horas,binsii)
TablaF_horas <- transform(table(horas),Rel_freq=prop.table(Freq), CumF_horas=cumsum(Freq))
TablaF_horas
## horas Freq Rel_freq CumF_horas
## 1 96 6 0.0004000267 6
## 2 97 14 0.0009333956 20
## 3 98 23 0.0015334356 43
## 4 99 11 0.0007333822 54
## 5 100 19 0.0012667511 73
## 6 101 16 0.0010667378 89
## 7 102 17 0.0011334089 106
## 8 103 17 0.0011334089 123
## 9 104 28 0.0018667911 151
## 10 105 17 0.0011334089 168
## 11 106 19 0.0012667511 187
## 12 107 10 0.0006667111 197
## 13 108 18 0.0012000800 215
## 14 109 18 0.0012000800 233
## 15 110 12 0.0008000533 245
## 16 111 26 0.0017334489 271
## 17 112 10 0.0006667111 281
## 18 113 29 0.0019334622 310
## 19 114 15 0.0010000667 325
## 20 115 14 0.0009333956 339
## 21 116 10 0.0006667111 349
## 22 117 18 0.0012000800 367
## 23 118 12 0.0008000533 379
## 24 119 10 0.0006667111 389
## 25 120 10 0.0006667111 399
## 26 121 24 0.0016001067 423
## 27 122 11 0.0007333822 434
## 28 123 20 0.0013334222 454
## 29 124 13 0.0008667244 467
## 30 125 19 0.0012667511 486
## 31 126 25 0.0016667778 511
## 32 127 72 0.0048003200 583
## 33 128 65 0.0043336222 648
## 34 129 63 0.0042002800 711
## 35 130 59 0.0039335956 770
## 36 131 69 0.0046003067 839
## 37 132 100 0.0066671111 939
## 38 133 87 0.0058003867 1026
## 39 134 114 0.0076005067 1140
## 40 135 153 0.0102006800 1293
## 41 136 104 0.0069337956 1397
## 42 137 122 0.0081338756 1519
## 43 138 88 0.0058670578 1607
## 44 139 120 0.0080005334 1727
## 45 140 129 0.0086005734 1856
## 46 141 115 0.0076671778 1971
## 47 142 112 0.0074671645 2083
## 48 143 127 0.0084672311 2210
## 49 144 102 0.0068004534 2312
## 50 145 134 0.0089339289 2446
## 51 146 110 0.0073338223 2556
## 52 147 118 0.0078671911 2674
## 53 148 123 0.0082005467 2797
## 54 149 148 0.0098673245 2945
## 55 150 108 0.0072004800 3053
## 56 151 147 0.0098006534 3200
## 57 152 112 0.0074671645 3312
## 58 153 122 0.0081338756 3434
## 59 154 121 0.0080672045 3555
## 60 155 125 0.0083338889 3680
## 61 156 153 0.0102006800 3833
## 62 157 126 0.0084005600 3959
## 63 158 124 0.0082672178 4083
## 64 159 121 0.0080672045 4204
## 65 160 136 0.0090672712 4340
## 66 161 87 0.0058003867 4427
## 67 162 96 0.0064004267 4523
## 68 163 73 0.0048669911 4596
## 69 164 78 0.0052003467 4674
## 70 165 78 0.0052003467 4752
## 71 166 73 0.0048669911 4825
## 72 167 94 0.0062670845 4919
## 73 168 92 0.0061337422 5011
## 74 169 86 0.0057337156 5097
## 75 170 76 0.0050670045 5173
## 76 171 83 0.0055337022 5256
## 77 172 70 0.0046669778 5326
## 78 173 96 0.0064004267 5422
## 79 174 78 0.0052003467 5500
## 80 175 76 0.0050670045 5576
## 81 176 81 0.0054003600 5657
## 82 177 81 0.0054003600 5738
## 83 178 85 0.0056670445 5823
## 84 179 73 0.0048669911 5896
## 85 180 88 0.0058670578 5984
## 86 181 78 0.0052003467 6062
## 87 182 75 0.0050003334 6137
## 88 183 84 0.0056003734 6221
## 89 184 80 0.0053336889 6301
## 90 185 93 0.0062004134 6394
## 91 186 76 0.0050670045 6470
## 92 187 68 0.0045336356 6538
## 93 188 73 0.0048669911 6611
## 94 189 85 0.0056670445 6696
## 95 190 75 0.0050003334 6771
## 96 191 80 0.0053336889 6851
## 97 192 96 0.0064004267 6947
## 98 193 67 0.0044669645 7014
## 99 194 71 0.0047336489 7085
## 100 195 67 0.0044669645 7152
## 101 196 79 0.0052670178 7231
## 102 197 70 0.0046669778 7301
## 103 198 86 0.0057337156 7387
## 104 199 79 0.0052670178 7466
## 105 200 58 0.0038669245 7524
## 106 201 86 0.0057337156 7610
## 107 202 80 0.0053336889 7690
## 108 203 72 0.0048003200 7762
## 109 204 68 0.0045336356 7830
## 110 205 73 0.0048669911 7903
## 111 206 83 0.0055337022 7986
## 112 207 71 0.0047336489 8057
## 113 208 72 0.0048003200 8129
## 114 209 72 0.0048003200 8201
## 115 210 72 0.0048003200 8273
## 116 211 79 0.0052670178 8352
## 117 212 72 0.0048003200 8424
## 118 213 71 0.0047336489 8495
## 119 214 78 0.0052003467 8573
## 120 215 68 0.0045336356 8641
## 121 216 76 0.0050670045 8717
## 122 217 87 0.0058003867 8804
## 123 218 79 0.0052670178 8883
## 124 219 85 0.0056670445 8968
## 125 220 64 0.0042669511 9032
## 126 221 81 0.0054003600 9113
## 127 222 84 0.0056003734 9197
## 128 223 93 0.0062004134 9290
## 129 224 112 0.0074671645 9402
## 130 225 95 0.0063337556 9497
## 131 226 93 0.0062004134 9590
## 132 227 77 0.0051336756 9667
## 133 228 76 0.0050670045 9743
## 134 229 93 0.0062004134 9836
## 135 230 59 0.0039335956 9895
## 136 231 77 0.0051336756 9972
## 137 232 97 0.0064670978 10069
## 138 233 102 0.0068004534 10171
## 139 234 74 0.0049336622 10245
## 140 235 76 0.0050670045 10321
## 141 236 83 0.0055337022 10404
## 142 237 90 0.0060004000 10494
## 143 238 108 0.0072004800 10602
## 144 239 96 0.0064004267 10698
## 145 240 93 0.0062004134 10791
## 146 241 85 0.0056670445 10876
## 147 242 98 0.0065337689 10974
## 148 243 112 0.0074671645 11086
## 149 244 98 0.0065337689 11184
## 150 245 124 0.0082672178 11308
## 151 246 102 0.0068004534 11410
## 152 247 108 0.0072004800 11518
## 153 248 86 0.0057337156 11604
## 154 249 93 0.0062004134 11697
## 155 250 100 0.0066671111 11797
## 156 251 98 0.0065337689 11895
## 157 252 86 0.0057337156 11981
## 158 253 101 0.0067337823 12082
## 159 254 113 0.0075338356 12195
## 160 255 115 0.0076671778 12310
## 161 256 87 0.0058003867 12397
## 162 257 126 0.0084005600 12523
## 163 258 110 0.0073338223 12633
## 164 259 98 0.0065337689 12731
## 165 260 124 0.0082672178 12855
## 166 261 102 0.0068004534 12957
## 167 262 86 0.0057337156 13043
## 168 263 110 0.0073338223 13153
## 169 264 111 0.0074004934 13264
## 170 265 91 0.0060670711 13355
## 171 266 105 0.0070004667 13460
## 172 267 88 0.0058670578 13548
## 173 268 93 0.0062004134 13641
## 174 269 102 0.0068004534 13743
## 175 270 93 0.0062004134 13836
## 176 271 104 0.0069337956 13940
## 177 272 86 0.0057337156 14026
## 178 273 88 0.0058670578 14114
## 179 274 94 0.0062670845 14208
## 180 275 82 0.0054670311 14290
## 181 276 30 0.0020001333 14320
## 182 277 21 0.0014000933 14341
## 183 278 35 0.0023334889 14376
## 184 279 32 0.0021334756 14408
## 185 280 29 0.0019334622 14437
## 186 281 34 0.0022668178 14471
## 187 282 36 0.0024001600 14507
## 188 283 25 0.0016667778 14532
## 189 284 24 0.0016001067 14556
## 190 285 33 0.0022001467 14589
## 191 286 50 0.0033335556 14639
## 192 287 30 0.0020001333 14669
## 193 288 6 0.0004000267 14675
## 194 289 19 0.0012667511 14694
## 195 290 15 0.0010000667 14709
## 196 291 17 0.0011334089 14726
## 197 292 15 0.0010000667 14741
## 198 293 13 0.0008667244 14754
## 199 294 16 0.0010667378 14770
## 200 295 12 0.0008000533 14782
## 201 296 21 0.0014000933 14803
## 202 297 7 0.0004666978 14810
## 203 298 13 0.0008667244 14823
## 204 299 6 0.0004000267 14829
## 205 300 11 0.0007333822 14840
## 206 301 24 0.0016001067 14864
## 207 302 8 0.0005333689 14872
## 208 303 6 0.0004000267 14878
## 209 304 17 0.0011334089 14895
## 210 305 18 0.0012000800 14913
## 211 306 18 0.0012000800 14931
## 212 307 14 0.0009333956 14945
## 213 308 20 0.0013334222 14965
## 214 309 16 0.0010667378 14981
## 215 310 18 0.0012000800 14999
Para un mejor entendimiento de todos estos datos se decidió hacer un histograma. De esta manera podremos analizar las frecuencias respectivas de forma visual y cómoda.
#histograma de satisfacción de los empleados
organizado_satisfacción <- data.frame(x=Tabla_frec$satisfacción,y=Tabla_frec$Freq)
ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
geom_bar(stat="identity",color="blue",fill="red")+
xlab("Rango de satisfacción trabajadores")+ ylab("Frecuencia")
#Histograma del desempeño de los empleados
organizado_desempeño <- data.frame(x=Tabla_frecuencia$desempeño,y=Tabla_frecuencia$Freq)
ggplot(data= organizado_desempeño, aes(x=x,y=y))+
geom_bar(stat="identity",color="green",fill="blue")+
xlab("Rango de desempeño de trabajadores")+ ylab("Frecuencia")
#Histograma de las horas promedio mensuales de los empleados
organizado_horas <- data.frame(x=TablaF_horas$horas,y=TablaF_horas$Freq)
ggplot(data= organizado_horas, aes(x=x,y=y))+
geom_bar(stat="identity",color="blue",fill="purple")+
xlab("Rango de horas promedio mensuales")+ ylab("Frecuencia")
También se realizó un Histograma acumulado para poder visualizar la frecuencia acumulada y las marcas de clase.
#Histograma acumulado
Frec_acumulada <- Tabla_frec[,3]
organizado_satisfacción <- data.frame(x=Tabla_frec$satisfacción,y=Tabla_frec$Cum_Freq)
ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
geom_bar(stat="identity",color="blue",fill="red")+
xlab("Rango de satisfacción trabajadores")+ ylab("Frecuencia Acumulada")
#Histograma acumulado para desempeño
Frecuencia_acum <- Tabla_frecuencia[,3]
organizado_desempeño <- data.frame(x=Tabla_frecuencia$desempeño,y=Tabla_frecuencia$Cum_frecuencia)
ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
geom_bar(stat="identity",color="green",fill="blue")+
xlab("Rango de desempeño trabajadores")+ ylab("Frecuencia Acumulada")
#Histograma acumulado para las horas promedio
Frecuencia_acu <- TablaF_horas[,3]
organizado_horas <- data.frame(x=TablaF_horas$horas,y=TablaF_horas$CumF_horas)
ggplot(data= organizado_horas, aes(x=x,y=y))+
geom_bar(stat="identity",color="green",fill="gray")+
xlab("Rango de horas promedio mensuales de trabajadores")+ ylab("Frecuencia Acumulada")
También se hizó un diagrama de tallos y hojas para la contabilización de los datos. O más bien, para poder observar más fácilmente la distribución de los mismos.
#Diagrama de tallos y hojas para la satisfacción
View(satisfacción)
stem(satisfacción)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 0 | 99999999999999999999999999999999999999999999999999999999999999999999+115
## 1 | 00000000000000000000000000000000000000000000000000000000000000000000+770
## 1 | 55555555555555555555555555555555555555555555555555555555555555555555+284
## 2 | 00000000000000000000000000000000000000000000000000000000000000000000+250
## 2 | 55555555555555555555555555555555556666666666666666666666666666667777+83
## 3 | 00000000000000000000000000000000000000011111111111111111111111111111+152
## 3 | 55555555555555555555555555555555555556666666666666666666666666666666+701
## 4 | 00000000000000000000000000000000000000000000000000000000000000000000+890
## 4 | 55555555555555555555555555555555555555555555555555555555555555555555+618
## 5 | 00000000000000000000000000000000000000000000000000000000000000000000+896
## 5 | 55555555555555555555555555555555555555555555555555555555555555555555+897
## 6 | 00000000000000000000000000000000000000000000000000000000000000000000+905
## 6 | 55555555555555555555555555555555555555555555555555555555555555555555+895
## 7 | 00000000000000000000000000000000000000000000000000000000000000000000+1029
## 7 | 55555555555555555555555555555555555555555555555555555555555555555555+1090
## 8 | 00000000000000000000000000000000000000000000000000000000000000000000+1084
## 8 | 55555555555555555555555555555555555555555555555555555555555555555555+976
## 9 | 00000000000000000000000000000000000000000000000000000000000000000000+898
## 9 | 55555555555555555555555555555555555555555555555555555555555555555555+835
## 10 | 00000000000000000000000000000000000000000000000000000000000000000000+31
#Diagrama de tallos y hojas para el desempeño
View(desempeño)
stem(desempeño)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 3 | 66666666666666666666667777777777777777777777777777777777777777777777+99
## 4 | 00000000000000000000000000000000000000000000000000000000011111111111+186
## 4 | 55555555555555555555555555555555555555555555555555555555555555555555+1043
## 5 | 00000000000000000000000000000000000000000000000000000000000000000000+1601
## 5 | 55555555555555555555555555555555555555555555555555555555555555555555+1413
## 6 | 00000000000000000000000000000000000000000000000000000000000000000000+1079
## 6 | 55555555555555555555555555555555555555555555555555555555555555555555+1003
## 7 | 00000000000000000000000000000000000000000000000000000000000000000000+1023
## 7 | 55555555555555555555555555555555555555555555555555555555555555555555+1092
## 8 | 00000000000000000000000000000000000000000000000000000000000000000000+1226
## 8 | 55555555555555555555555555555555555555555555555555555555555555555555+1366
## 9 | 00000000000000000000000000000000000000000000000000000000000000000000+1321
## 9 | 55555555555555555555555555555555555555555555555555555555555555555555+1224
## 10 | 00000000000000000000000000000000000000000000000000000000000000000000+203
#Diagrama de tallos y hojas para el promedio mensual de horas trabajadas por empleado
View(horas)
stem(horas)
##
## The decimal point is 1 digit(s) to the right of the |
##
## 9 | 666666777777777777778888888888888888888888899999999999
## 10 | 00000000000000000001111111111111111222222222222222223333333333333333+99
## 11 | 00000000000011111111111111111111111111222222222233333333333333333333+76
## 12 | 00000000001111111111111111111111112222222222233333333333333333333444+242
## 13 | 00000000000000000000000000000000000000000000000000000000000111111111+936
## 14 | 00000000000000000000000000000000000000000000000000000000000000000000+1138
## 15 | 00000000000000000000000000000000000000000000000000000000000000000000+1179
## 16 | 00000000000000000000000000000000000000000000000000000000000000000000+813
## 17 | 00000000000000000000000000000000000000000000000000000000000000000000+719
## 18 | 00000000000000000000000000000000000000000000000000000000000000000000+720
## 19 | 00000000000000000000000000000000000000000000000000000000000000000000+690
## 20 | 00000000000000000000000000000000000000000000000000000000001111111111+655
## 21 | 00000000000000000000000000000000000000000000000000000000000000000000+687
## 22 | 00000000000000000000000000000000000000000000000000000000000000001111+788
## 23 | 00000000000000000000000000000000000000000000000000000000000111111111+782
## 24 | 00000000000000000000000000000000000000000000000000000000000000000000+919
## 25 | 00000000000000000000000000000000000000000000000000000000000000000000+954
## 26 | 00000000000000000000000000000000000000000000000000000000000000000000+932
## 27 | 00000000000000000000000000000000000000000000000000000000000000000000+585
## 28 | 00000000000000000000000000000111111111111111111111111111111111122222+206
## 29 | 00000000000000011111111111111111222222222222222333333333333344444444+55
## 30 | 00000000000111111111111111111111111222222223333334444444444444444455+72
## 31 | 000000000000000000
Se obtuviron las medidas de tendencian cental para saber cuál era la satisfación y desempeño más central de los encuestados, es decir, los trabajadores.
#Media
mean(satisfacción)
## [1] 0.6128335
mean(desempeño)
## [1] 0.7161017
mean(horas)
## [1] 201.0503
#Mediana
median(satisfacción)
## [1] 0.64
median(desempeño)
## [1] 0.72
median(horas)
## [1] 200
#Moda
moda <- function(x){
return(as.numeric(names(which.max(table(x)))))
}
moda(satisfacción)
## [1] 0.1
moda(desempeño)
## [1] 0.55
moda(horas)
## [1] 135
#Rango medio
Rango_mhoras=(max(horas)+min(horas))/2
Rango_mhoras
## [1] 203
Rango_mdesempeño=(max(desempeño)+min(desempeño))/2
Rango_mdesempeño
## [1] 0.68
Rango_medio=(max(satisfacción)+min(satisfacción))/2
Rango_medio
## [1] 0.545
Para dividir la información también se determinaron los cuartiles.
#cuartiles
quantile(satisfacción, c(.25, .50, .75))
## 25% 50% 75%
## 0.44 0.64 0.82
quantile(desempeño, c(.25, .50, .75))
## 25% 50% 75%
## 0.56 0.72 0.87
quantile(horas, c(.25, .50, .75))
## 25% 50% 75%
## 156 200 245
Por otro lado, también se obtuvo la varianza, la desviación estándar, el rango, y el rango inter cuartil.
#Varianza
variance <- function (satisfacción) sum((satisfacción-mean(satisfacción))^2)/(length(satisfacción)-1)
variance(satisfacción)
## [1] 0.0618172
variance(desempeño)
## [1] 0.02929886
variance(horas)
## [1] 2494.313
#Desviación Estándar
desv=sqrt(variance(satisfacción))
desviación=sqrt(variance(desempeño))
desvi=sqrt(variance(horas))
desvi
## [1] 49.9431
desviación
## [1] 0.1711691
desv
## [1] 0.2486307
#Rango
rango=max(satisfacción)-min(satisfacción)
rango_d=max(desempeño)-min(desempeño)
rango_horas=max(horas)-min(horas)
#Rango intercuartil
IQR(satisfacción)
## [1] 0.38
IQR(desempeño)
## [1] 0.31
IQR(horas)
## [1] 89
Por último se realizó un diargama de caja y extensión para observar que tan alejados estaban los datos y así saber si exsitían datos anómalos.
#Diagrama de caja y extensión
boxplot(satisfacción, horizontal=TRUE, main="Diagrama de cajas satisfacción", col="blue")
boxplot(desempeño, horizontal=TRUE, main="Diagrama de cajas desempeño", col="red")
boxplot(horas, horizontal=TRUE, main="Diagrama de cajas promedio de horas mensuales", col="darkgray")
Se logro cuantificar un promedio de los ingresos recibidos de los empleados en la empresa así mismo su satisfacción con su vida laboral, dando resultados en donde podemos observar que el 48.8% de los empleados reciben un salario bajo comparado con la oferta y demanda actual, así mismo solo un 8.2% poseen un salario más alto de lo estipulado.
Se le recomienda a los nuevos directivos de la empresa empezar a realizar alternativas y reforman que equilibren esta disparidad salarial, provocando así que la satisfacción logre subir, creando una mejor calidad. a mayoria de los empleados ganan salarios bajos o medios. También se evidencia que los empleados trabajan en promedio un número parecido de horas, que es aproximadamente unas 200 horas al mes sin importar el salario que estén ganando. Por otro lado, se puede apreciar que los departamentos más activos y con más empleados son los de ventas, support y techinical. Por último, el ambiente de trabajo es muy seguro, tan sólo hay un 14% de accidentes laborales.