Informe de estadística - Primer corte

Durante la realización de este trabajo se analizó una base de datos con la información de una empresa. Gracias a la toma de datos que se realizó anteriormente es posible sacar conclusiones con base en ellos.

Resumen

Gracias a este estudio se pudieron determinar distintas medidas de tendencia central de los datos. También, se encontraron patrones y se organizaron los datos. Los própositos de este estudio fueron, principalmente, de estádistica descriptiva.

Introducción

Una empresa especializada en el estudio de cuencas y cuerpos para el uso aprovechable de energía cambia de cuerpo directivo, y la nueva administración decide realizar un seguimiento acerca de las personas que trabajan en su empresa, así como sus salarios, con el propósito de optimizar y darles mejor calidad de empleo el cual fue bajo debido a ciertos manejos de la administración anterior

Métodología

Tratamiento de datos cualitativos

En primera instancia se importaron los datos que se hallaban en Excel.

datos <- read.xlsx("estadistica.xlsx")

Después de realizar esto se extrayeron los datos que necestibamos para analizar cómo era el salarios de las personas de esta empresa.

#Datos cuantitativos 

#Tipo de salario 
salarios <- datos[,11]
#departamentos 
departamentos <-datos[,10]
#accidentes de trabajo 
accidentes <- datos[,7]

#dato cuantitativo 
#tiempo perdido 
perdido <- datos[,6]
#número de proyectos 
proyectos <-datos[,4]

Con los datos depurados y adecuadamente extraidos en un vector se realizó una tabla de frecuencia. De esta Será más fácil interpretar los datos y a su vez, visualizarlos.

#tabla de frecuencia simple para tabla de salarios 
tabla_salarios <- freq(salarios, cum=TRUE, sort="dec")
head(tabla_salarios)
##           n    % val%  %cum val%cum
## low    7316 48.8 48.8  48.8    48.8
## medium 6446 43.0 43.0  91.8    91.8
## high   1237  8.2  8.2 100.0   100.0
#tabla de frecuencia simple para tabla de departamentos
tabla_departamentos <- freq(departamentos, cum=TRUE, sort="dec")
head(tabla_departamentos)
##                n    % val% %cum val%cum
## sales       4140 27.6 27.6 27.6    27.6
## technical   2720 18.1 18.1 45.7    45.7
## support     2229 14.9 14.9 60.6    60.6
## IT          1227  8.2  8.2 68.8    68.8
## product_mng  902  6.0  6.0 74.8    74.8
## marketing    858  5.7  5.7 80.5    80.5
#tabla de frecuencia simple para tabla de departamentos
tabla_accidentes <- freq(accidentes, cum=TRUE, sort="dec")
head(tabla_accidentes)
##       n    % val%  %cum val%cum
## 0 12830 85.5 85.5  85.5    85.5
## 1  2169 14.5 14.5 100.0   100.0
#tabla de frecuencia simple para tabla de departamentos
tabla_perdido <- freq(perdido, cum=TRUE, sort="dec")
head(tabla_perdido)
##       n    % val% %cum val%cum
## 3  6443 43.0 43.0 43.0    43.0
## 2  3244 21.6 21.6 64.6    64.6
## 4  2557 17.0 17.0 81.6    81.6
## 5  1473  9.8  9.8 91.5    91.5
## 6   718  4.8  4.8 96.2    96.2
## 10  214  1.4  1.4 97.7    97.7
#tabla de frecuencia simple para tabla de departamentos
tabla_proyectos <- freq(proyectos, cum=TRUE, sort="dec")
head(tabla_proyectos)
##      n    % val%  %cum val%cum
## 4 4365 29.1 29.1  29.1    29.1
## 3 4055 27.0 27.0  56.1    56.1
## 5 2761 18.4 18.4  74.5    74.5
## 2 2388 15.9 15.9  90.5    90.5
## 6 1174  7.8  7.8  98.3    98.3
## 7  256  1.7  1.7 100.0   100.0
#

Se realizó también un diagrama de tallos y hojas para el conteo de datos cuantitativos correspondientes al número de proyectos realizados por trabajador y el tiempo perdido por cada empleado de la empresa.

#Diagrama de tallos y hojas para el número de proyectos realizados y tiempo perdido por empleado 

stem(proyectos)
## 
##   The decimal point is at the |
## 
##   2 | 00000000000000000000000000000000000000000000000000000000000000000000+2308
##   2 | 
##   3 | 00000000000000000000000000000000000000000000000000000000000000000000+3975
##   3 | 
##   4 | 00000000000000000000000000000000000000000000000000000000000000000000+4285
##   4 | 
##   5 | 00000000000000000000000000000000000000000000000000000000000000000000+2681
##   5 | 
##   6 | 00000000000000000000000000000000000000000000000000000000000000000000+1094
##   6 | 
##   7 | 00000000000000000000000000000000000000000000000000000000000000000000+176
stem(perdido)
## 
##   The decimal point is at the |
## 
##    2 | 00000000000000000000000000000000000000000000000000000000000000000000+3164
##    2 | 
##    3 | 00000000000000000000000000000000000000000000000000000000000000000000+6363
##    3 | 
##    4 | 00000000000000000000000000000000000000000000000000000000000000000000+2477
##    4 | 
##    5 | 00000000000000000000000000000000000000000000000000000000000000000000+1393
##    5 | 
##    6 | 00000000000000000000000000000000000000000000000000000000000000000000+638
##    6 | 
##    7 | 00000000000000000000000000000000000000000000000000000000000000000000+108
##    7 | 
##    8 | 00000000000000000000000000000000000000000000000000000000000000000000+82
##    8 | 
##    9 | 
##    9 | 
##   10 | 00000000000000000000000000000000000000000000000000000000000000000000+134

Posteriormente se extrageron los datos de las dos primeras columnas para realizar una gráfica de barras que mostrase la frecuencia del tipo de salario.Lo mismo se hizo para los departamentos de la empresa. Es decir, la frecuencia del dato cualitativo. Todo esto se organizó también en un data.frame

#data farme tipo de salario
tipo_salario <- c("Low","Medium","High")
salarito <- tabla_salarios[1:3,1]

organizado_salario <- data.frame(
  tipo_salario,
  salarito)

#data frame para tipo de departamento 
tipo_departamento <-c("sales","Technical", "support", "IT", "product_mng", "marketing")
departamentico <-tabla_departamentos[1:6,1]
organizado_departamento <-data.frame(
  tipo_departamento,
  departamentico
)

#data frame para los accidentes 
tipo_accidente <-c("Sin accidente","Accidente")
accident <-tabla_accidentes[1:2,1]
organizado_accidentes <-data.frame(
  tipo_accidente,
  accident
)

Con estos data.frame fue posible obtener una gráfica de barras. Esta se muestra acontinuación.

#Diagrama de barras para el salario 
library(ggplot2)
ggplot(data=organizado_salario, aes(x=tipo_salario, y=salarito))+geom_bar(stat="identity")

#Diagrama de barras para los tipos de departamentos 
ggplot(data=organizado_departamento, aes(x=tipo_departamento, y=departamentico))+geom_bar(stat="identity")

#Diagrama de barras para la frecuencia de los accidentes en la empresa 
ggplot(data=organizado_accidentes, aes(x=tipo_accidente, y=accident))+geom_bar(stat="identity")

Para poder entender mejor toda esta información otra determinación que se tomó en cuenta fue la de crear un gráfico circular. De esta manera sería posible también observar cuál era el porcentaje de empleados que recibía un sueldo bajo, alto o medio.

Para ello se creó un vector que recopilará los porcentajes y junto con los otros parámetros se desarrolló el siguiente gráfico de pastel.

#Realización de un diagrama circular para los salarios 
porcentaje <-tabla_salarios[,2]
etiqueta <-paste(porcentaje,"%",sep=" ")
colores<- c("purple","blue","skyblue")
pie(porcentaje,labels = etiqueta,clockwise = TRUE,col=colores,
    main="Porcentaje de Salarios")
legend("topright",tipo_salario,cex=0.5,fill=colores)

#Realización de un diagrama circular para los tipos de departamento
porcentaje_2 <-tabla_departamentos[,2]
etiqueta_2 <-paste(porcentaje_2,"%", sep=" ")
colores_2 <- c("aquamarine", "cyan", "blue", "red", "green", "darkgrey")
pie(porcentaje_2, labels=etiqueta_2,clockwise=TRUE, col=colores_2, main="Porcentaje de departamentos")

Tratamiento de datos cuantitativos

En la siguiente parte del trabajo se desarrlló el análisis de la sección que corresponde a la satisfacción de los empleados.

Los primero que hacemos es cargar los datos en un vector que nos muestré únicamente la satisfacción de los empleados. En segundo, realizaremos lo mismo pero para el desempeño según la última evaluación realizada por los mismos.Por último, también se realizó esto para las horas promedio mensual de horas invertidas de los empeados.

satisfacción <- datos[,2]
desempeño <- datos[,3]
horas <- datos[,5]

Para el tratamiento de datos cualitativos es pertinente realizar una tabla de frecuencia con datos agrupados Es por este motivo que se utilizó la regla de Sturges para definir el número de intervalos necesarios para la tabla. Además, para la creación esta tabla también fue necesario obtener el Rango y la Amplitud (w).

#Para los datos de satisfacción de los empleados 
n_sturges=1+log(length(satisfacción))/log(2)
n_sturgesc=ceiling(n_sturges)
n_sturgesf=floor(n_sturges)

n_clases =0
if (n_sturges%%2==0){
  n_clases=n_sturgesf
} else{
  n_clases = n_sturgesc
}
R=max(satisfacción)-min(satisfacción)
w=ceiling(R/n_clases)

#Para los datos de desempeño de los empleados 
n_sturge=1+log(length(desempeño))/log(2)
n_sturgec=ceiling(n_sturge)
n_sturgef=floor(n_sturge)

n_clase =0
if (n_sturge%%2==0){
  n_clase=n_sturgef
} else{
  n_clase = n_sturgec
}
Ri=max(desempeño)-min(desempeño)
wi=ceiling(R/n_clase)

#Para los datos de promedio de horas mensuales de cada empleado 
n_sturg=1+log(length(horas))/log(2)
n_sturgc=ceiling(n_sturg)
n_sturgf=floor(n_sturg)

n_clas =0
if (n_sturg%%2==0){
  n_clas=n_sturgf
} else{
  n_clas = n_sturgc
}
Rii=max(horas)-min(horas)
wii=ceiling(R/n_clas)

Habiendo determinado esto fue posible hacer la tabla de frecuencia con datos agrupados.Y para ello se usó la siguiente lógica.

#Tabla de frecuencia con número de clase de satisfacción
bins<- seq(min(satisfacción), max(satisfacción)+w,by=w)

nivel_satisfacción <- cut(satisfacción,bins)
Tabla_frec <- transform(table(satisfacción),Rel_freq=prop.table(Freq), Cum_Freq=cumsum(Freq))
Tabla_frec
##    satisfacción Freq    Rel_freq Cum_Freq
## 1          0.09  195 0.013000867      195
## 2           0.1  358 0.023868258      553
## 3          0.11  335 0.022334822      888
## 4          0.12   30 0.002000133      918
## 5          0.13   54 0.003600240      972
## 6          0.14   73 0.004866991     1045
## 7          0.15   76 0.005067004     1121
## 8          0.16   79 0.005267018     1200
## 9          0.17   72 0.004800320     1272
## 10         0.18   63 0.004200280     1335
## 11         0.19   74 0.004933662     1409
## 12          0.2   69 0.004600307     1478
## 13         0.21   67 0.004466964     1545
## 14         0.22   60 0.004000267     1605
## 15         0.23   54 0.003600240     1659
## 16         0.24   80 0.005333689     1739
## 17         0.25   34 0.002266818     1773
## 18         0.26   30 0.002000133     1803
## 19         0.27   30 0.002000133     1833
## 20         0.28   31 0.002066804     1864
## 21         0.29   38 0.002533502     1902
## 22          0.3   39 0.002600173     1941
## 23         0.31   59 0.003933596     2000
## 24         0.32   50 0.003333556     2050
## 25         0.33   36 0.002400160     2086
## 26         0.34   48 0.003200213     2134
## 27         0.35   37 0.002466831     2171
## 28         0.36  139 0.009267284     2310
## 29         0.37  241 0.016067738     2551
## 30         0.38  189 0.012600840     2740
## 31         0.39  175 0.011667444     2915
## 32          0.4  209 0.013934262     3124
## 33         0.41  171 0.011400760     3295
## 34         0.42  155 0.010334022     3450
## 35         0.43  224 0.014934329     3674
## 36         0.44  211 0.014067605     3885
## 37         0.45  203 0.013534236     4088
## 38         0.46   95 0.006333756     4183
## 39         0.47   42 0.002800187     4225
## 40         0.48  149 0.009933996     4374
## 41         0.49  209 0.013934262     4583
## 42          0.5  229 0.015267685     4812
## 43         0.51  187 0.012467498     4999
## 44         0.52  196 0.013067538     5195
## 45         0.53  179 0.011934129     5374
## 46         0.54  185 0.012334156     5559
## 47         0.55  179 0.011934129     5738
## 48         0.56  187 0.012467498     5925
## 49         0.57  210 0.014000933     6135
## 50         0.58  182 0.012134142     6317
## 51         0.59  219 0.014600973     6536
## 52          0.6  193 0.012867525     6729
## 53         0.61  208 0.013867591     6937
## 54         0.62  188 0.012534169     7125
## 55         0.63  209 0.013934262     7334
## 56         0.64  187 0.012467498     7521
## 57         0.65  199 0.013267551     7720
## 58         0.66  228 0.015201013     7948
## 59         0.67  177 0.011800787     8125
## 60         0.68  162 0.010800720     8287
## 61         0.69  209 0.013934262     8496
## 62          0.7  205 0.013667578     8701
## 63         0.71  171 0.011400760     8872
## 64         0.72  230 0.015334356     9102
## 65         0.73  246 0.016401093     9348
## 66         0.74  257 0.017134476     9605
## 67         0.75  226 0.015067671     9831
## 68         0.76  234 0.015601040    10065
## 69         0.77  252 0.016801120    10317
## 70         0.78  241 0.016067738    10558
## 71         0.79  217 0.014467631    10775
## 72          0.8  222 0.014800987    10997
## 73         0.81  220 0.014667645    11217
## 74         0.82  241 0.016067738    11458
## 75         0.83  234 0.015601040    11692
## 76         0.84  247 0.016467765    11939
## 77         0.85  207 0.013800920    12146
## 78         0.86  200 0.013334222    12346
## 79         0.87  225 0.015001000    12571
## 80         0.88  187 0.012467498    12758
## 81         0.89  237 0.015801053    12995
## 82          0.9  220 0.014667645    13215
## 83         0.91  224 0.014934329    13439
## 84         0.92  198 0.013200880    13637
## 85         0.93  169 0.011267418    13806
## 86         0.94  167 0.011134076    13973
## 87         0.95  181 0.012067471    14154
## 88         0.96  203 0.013534236    14357
## 89         0.97  176 0.011734116    14533
## 90         0.98  183 0.012200813    14716
## 91         0.99  172 0.011467431    14888
## 92            1  111 0.007400493    14999
#Tabla de frecuencia con número de clase para el desempeño de los empleados
binsi<- seq(min(desempeño), max(desempeño)+wi,by=wi)

nivel_desempeño <- cut(desempeño,binsi)
Tabla_frecuencia <- transform(table(desempeño),Rel_freq=prop.table(Freq), Cum_frecuencia=cumsum(Freq))
Tabla_frecuencia
##    desempeño Freq    Rel_freq Cum_frecuencia
## 1       0.36   22 0.001466764             22
## 2       0.37   55 0.003666911             77
## 3       0.38   50 0.003333556            127
## 4       0.39   52 0.003466898            179
## 5        0.4   57 0.003800253            236
## 6       0.41   59 0.003933596            295
## 7       0.42   56 0.003733582            351
## 8       0.43   50 0.003333556            401
## 9       0.44   44 0.002933529            445
## 10      0.45  115 0.007667178            560
## 11      0.46  211 0.014067605            771
## 12      0.47  173 0.011534102            944
## 13      0.48  292 0.019467965           1236
## 14      0.49  332 0.022134809           1568
## 15       0.5  353 0.023534902           1921
## 16      0.51  345 0.023001533           2266
## 17      0.52  309 0.020601373           2575
## 18      0.53  324 0.021601440           2899
## 19      0.54  350 0.023334889           3249
## 20      0.55  358 0.023868258           3607
## 21      0.56  322 0.021468098           3929
## 22      0.57  333 0.022201480           4262
## 23      0.58  225 0.015001000           4487
## 24      0.59  255 0.017001133           4742
## 25       0.6  221 0.014734316           4963
## 26      0.61  234 0.015601040           5197
## 27      0.62  233 0.015534369           5430
## 28      0.63  236 0.015734382           5666
## 29      0.64  235 0.015667711           5901
## 30      0.65  201 0.013400893           6102
## 31      0.66  222 0.014800987           6324
## 32      0.67  245 0.016334422           6569
## 33      0.68  222 0.014800987           6791
## 34      0.69  193 0.012867525           6984
## 35       0.7  213 0.014200947           7197
## 36      0.71  196 0.013067538           7393
## 37      0.72  211 0.014067605           7604
## 38      0.73  223 0.014867658           7827
## 39      0.74  260 0.017334489           8087
## 40      0.75  238 0.015867725           8325
## 41      0.76  216 0.014400960           8541
## 42      0.77  263 0.017534502           8804
## 43      0.78  214 0.014267618           9018
## 44      0.79  241 0.016067738           9259
## 45       0.8  251 0.016734449           9510
## 46      0.81  255 0.017001133           9765
## 47      0.82  237 0.015801053          10002
## 48      0.83  269 0.017934529          10271
## 49      0.84  294 0.019601307          10565
## 50      0.85  316 0.021068071          10881
## 51      0.86  273 0.018201213          11154
## 52      0.87  326 0.021734782          11480
## 53      0.88  235 0.015667711          11715
## 54      0.89  296 0.019734649          12011
## 55       0.9  313 0.020868058          12324
## 56      0.91  287 0.019134609          12611
## 57      0.92  269 0.017934529          12880
## 58      0.93  269 0.017934529          13149
## 59      0.94  263 0.017534502          13412
## 60      0.95  258 0.017201147          13670
## 61      0.96  249 0.016601107          13919
## 62      0.97  276 0.018401227          14195
## 63      0.98  263 0.017534502          14458
## 64      0.99  258 0.017201147          14716
## 65         1  283 0.018867925          14999
#Tabla de frecuencia con número de clase para promedio de horas mensuales de los empleados
binsii<- seq(min(horas), max(horas)+wii,by=wii)

nivel_horas <- cut(horas,binsii)
TablaF_horas <- transform(table(horas),Rel_freq=prop.table(Freq), CumF_horas=cumsum(Freq))
TablaF_horas
##     horas Freq     Rel_freq CumF_horas
## 1      96    6 0.0004000267          6
## 2      97   14 0.0009333956         20
## 3      98   23 0.0015334356         43
## 4      99   11 0.0007333822         54
## 5     100   19 0.0012667511         73
## 6     101   16 0.0010667378         89
## 7     102   17 0.0011334089        106
## 8     103   17 0.0011334089        123
## 9     104   28 0.0018667911        151
## 10    105   17 0.0011334089        168
## 11    106   19 0.0012667511        187
## 12    107   10 0.0006667111        197
## 13    108   18 0.0012000800        215
## 14    109   18 0.0012000800        233
## 15    110   12 0.0008000533        245
## 16    111   26 0.0017334489        271
## 17    112   10 0.0006667111        281
## 18    113   29 0.0019334622        310
## 19    114   15 0.0010000667        325
## 20    115   14 0.0009333956        339
## 21    116   10 0.0006667111        349
## 22    117   18 0.0012000800        367
## 23    118   12 0.0008000533        379
## 24    119   10 0.0006667111        389
## 25    120   10 0.0006667111        399
## 26    121   24 0.0016001067        423
## 27    122   11 0.0007333822        434
## 28    123   20 0.0013334222        454
## 29    124   13 0.0008667244        467
## 30    125   19 0.0012667511        486
## 31    126   25 0.0016667778        511
## 32    127   72 0.0048003200        583
## 33    128   65 0.0043336222        648
## 34    129   63 0.0042002800        711
## 35    130   59 0.0039335956        770
## 36    131   69 0.0046003067        839
## 37    132  100 0.0066671111        939
## 38    133   87 0.0058003867       1026
## 39    134  114 0.0076005067       1140
## 40    135  153 0.0102006800       1293
## 41    136  104 0.0069337956       1397
## 42    137  122 0.0081338756       1519
## 43    138   88 0.0058670578       1607
## 44    139  120 0.0080005334       1727
## 45    140  129 0.0086005734       1856
## 46    141  115 0.0076671778       1971
## 47    142  112 0.0074671645       2083
## 48    143  127 0.0084672311       2210
## 49    144  102 0.0068004534       2312
## 50    145  134 0.0089339289       2446
## 51    146  110 0.0073338223       2556
## 52    147  118 0.0078671911       2674
## 53    148  123 0.0082005467       2797
## 54    149  148 0.0098673245       2945
## 55    150  108 0.0072004800       3053
## 56    151  147 0.0098006534       3200
## 57    152  112 0.0074671645       3312
## 58    153  122 0.0081338756       3434
## 59    154  121 0.0080672045       3555
## 60    155  125 0.0083338889       3680
## 61    156  153 0.0102006800       3833
## 62    157  126 0.0084005600       3959
## 63    158  124 0.0082672178       4083
## 64    159  121 0.0080672045       4204
## 65    160  136 0.0090672712       4340
## 66    161   87 0.0058003867       4427
## 67    162   96 0.0064004267       4523
## 68    163   73 0.0048669911       4596
## 69    164   78 0.0052003467       4674
## 70    165   78 0.0052003467       4752
## 71    166   73 0.0048669911       4825
## 72    167   94 0.0062670845       4919
## 73    168   92 0.0061337422       5011
## 74    169   86 0.0057337156       5097
## 75    170   76 0.0050670045       5173
## 76    171   83 0.0055337022       5256
## 77    172   70 0.0046669778       5326
## 78    173   96 0.0064004267       5422
## 79    174   78 0.0052003467       5500
## 80    175   76 0.0050670045       5576
## 81    176   81 0.0054003600       5657
## 82    177   81 0.0054003600       5738
## 83    178   85 0.0056670445       5823
## 84    179   73 0.0048669911       5896
## 85    180   88 0.0058670578       5984
## 86    181   78 0.0052003467       6062
## 87    182   75 0.0050003334       6137
## 88    183   84 0.0056003734       6221
## 89    184   80 0.0053336889       6301
## 90    185   93 0.0062004134       6394
## 91    186   76 0.0050670045       6470
## 92    187   68 0.0045336356       6538
## 93    188   73 0.0048669911       6611
## 94    189   85 0.0056670445       6696
## 95    190   75 0.0050003334       6771
## 96    191   80 0.0053336889       6851
## 97    192   96 0.0064004267       6947
## 98    193   67 0.0044669645       7014
## 99    194   71 0.0047336489       7085
## 100   195   67 0.0044669645       7152
## 101   196   79 0.0052670178       7231
## 102   197   70 0.0046669778       7301
## 103   198   86 0.0057337156       7387
## 104   199   79 0.0052670178       7466
## 105   200   58 0.0038669245       7524
## 106   201   86 0.0057337156       7610
## 107   202   80 0.0053336889       7690
## 108   203   72 0.0048003200       7762
## 109   204   68 0.0045336356       7830
## 110   205   73 0.0048669911       7903
## 111   206   83 0.0055337022       7986
## 112   207   71 0.0047336489       8057
## 113   208   72 0.0048003200       8129
## 114   209   72 0.0048003200       8201
## 115   210   72 0.0048003200       8273
## 116   211   79 0.0052670178       8352
## 117   212   72 0.0048003200       8424
## 118   213   71 0.0047336489       8495
## 119   214   78 0.0052003467       8573
## 120   215   68 0.0045336356       8641
## 121   216   76 0.0050670045       8717
## 122   217   87 0.0058003867       8804
## 123   218   79 0.0052670178       8883
## 124   219   85 0.0056670445       8968
## 125   220   64 0.0042669511       9032
## 126   221   81 0.0054003600       9113
## 127   222   84 0.0056003734       9197
## 128   223   93 0.0062004134       9290
## 129   224  112 0.0074671645       9402
## 130   225   95 0.0063337556       9497
## 131   226   93 0.0062004134       9590
## 132   227   77 0.0051336756       9667
## 133   228   76 0.0050670045       9743
## 134   229   93 0.0062004134       9836
## 135   230   59 0.0039335956       9895
## 136   231   77 0.0051336756       9972
## 137   232   97 0.0064670978      10069
## 138   233  102 0.0068004534      10171
## 139   234   74 0.0049336622      10245
## 140   235   76 0.0050670045      10321
## 141   236   83 0.0055337022      10404
## 142   237   90 0.0060004000      10494
## 143   238  108 0.0072004800      10602
## 144   239   96 0.0064004267      10698
## 145   240   93 0.0062004134      10791
## 146   241   85 0.0056670445      10876
## 147   242   98 0.0065337689      10974
## 148   243  112 0.0074671645      11086
## 149   244   98 0.0065337689      11184
## 150   245  124 0.0082672178      11308
## 151   246  102 0.0068004534      11410
## 152   247  108 0.0072004800      11518
## 153   248   86 0.0057337156      11604
## 154   249   93 0.0062004134      11697
## 155   250  100 0.0066671111      11797
## 156   251   98 0.0065337689      11895
## 157   252   86 0.0057337156      11981
## 158   253  101 0.0067337823      12082
## 159   254  113 0.0075338356      12195
## 160   255  115 0.0076671778      12310
## 161   256   87 0.0058003867      12397
## 162   257  126 0.0084005600      12523
## 163   258  110 0.0073338223      12633
## 164   259   98 0.0065337689      12731
## 165   260  124 0.0082672178      12855
## 166   261  102 0.0068004534      12957
## 167   262   86 0.0057337156      13043
## 168   263  110 0.0073338223      13153
## 169   264  111 0.0074004934      13264
## 170   265   91 0.0060670711      13355
## 171   266  105 0.0070004667      13460
## 172   267   88 0.0058670578      13548
## 173   268   93 0.0062004134      13641
## 174   269  102 0.0068004534      13743
## 175   270   93 0.0062004134      13836
## 176   271  104 0.0069337956      13940
## 177   272   86 0.0057337156      14026
## 178   273   88 0.0058670578      14114
## 179   274   94 0.0062670845      14208
## 180   275   82 0.0054670311      14290
## 181   276   30 0.0020001333      14320
## 182   277   21 0.0014000933      14341
## 183   278   35 0.0023334889      14376
## 184   279   32 0.0021334756      14408
## 185   280   29 0.0019334622      14437
## 186   281   34 0.0022668178      14471
## 187   282   36 0.0024001600      14507
## 188   283   25 0.0016667778      14532
## 189   284   24 0.0016001067      14556
## 190   285   33 0.0022001467      14589
## 191   286   50 0.0033335556      14639
## 192   287   30 0.0020001333      14669
## 193   288    6 0.0004000267      14675
## 194   289   19 0.0012667511      14694
## 195   290   15 0.0010000667      14709
## 196   291   17 0.0011334089      14726
## 197   292   15 0.0010000667      14741
## 198   293   13 0.0008667244      14754
## 199   294   16 0.0010667378      14770
## 200   295   12 0.0008000533      14782
## 201   296   21 0.0014000933      14803
## 202   297    7 0.0004666978      14810
## 203   298   13 0.0008667244      14823
## 204   299    6 0.0004000267      14829
## 205   300   11 0.0007333822      14840
## 206   301   24 0.0016001067      14864
## 207   302    8 0.0005333689      14872
## 208   303    6 0.0004000267      14878
## 209   304   17 0.0011334089      14895
## 210   305   18 0.0012000800      14913
## 211   306   18 0.0012000800      14931
## 212   307   14 0.0009333956      14945
## 213   308   20 0.0013334222      14965
## 214   309   16 0.0010667378      14981
## 215   310   18 0.0012000800      14999

Para un mejor entendimiento de todos estos datos se decidió hacer un histograma. De esta manera podremos analizar las frecuencias respectivas de forma visual y cómoda.

#histograma de satisfacción de los empleados 
organizado_satisfacción <- data.frame(x=Tabla_frec$satisfacción,y=Tabla_frec$Freq)

ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
  geom_bar(stat="identity",color="blue",fill="red")+
  xlab("Rango de satisfacción trabajadores")+ ylab("Frecuencia")

#Histograma del desempeño de los empleados 
organizado_desempeño <- data.frame(x=Tabla_frecuencia$desempeño,y=Tabla_frecuencia$Freq)

ggplot(data= organizado_desempeño, aes(x=x,y=y))+
  geom_bar(stat="identity",color="green",fill="blue")+
  xlab("Rango de desempeño de trabajadores")+ ylab("Frecuencia")

#Histograma de las horas promedio mensuales de los empleados 
organizado_horas <- data.frame(x=TablaF_horas$horas,y=TablaF_horas$Freq)

ggplot(data= organizado_horas, aes(x=x,y=y))+
  geom_bar(stat="identity",color="blue",fill="purple")+
  xlab("Rango de horas promedio mensuales")+ ylab("Frecuencia")

También se realizó un Histograma acumulado para poder visualizar la frecuencia acumulada y las marcas de clase.

#Histograma acumulado 
Frec_acumulada <- Tabla_frec[,3]

organizado_satisfacción <- data.frame(x=Tabla_frec$satisfacción,y=Tabla_frec$Cum_Freq)

ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
  geom_bar(stat="identity",color="blue",fill="red")+
  xlab("Rango de satisfacción trabajadores")+ ylab("Frecuencia Acumulada")

#Histograma acumulado para desempeño
Frecuencia_acum <- Tabla_frecuencia[,3]

organizado_desempeño <- data.frame(x=Tabla_frecuencia$desempeño,y=Tabla_frecuencia$Cum_frecuencia)

ggplot(data= organizado_satisfacción, aes(x=x,y=y))+
  geom_bar(stat="identity",color="green",fill="blue")+
  xlab("Rango de desempeño trabajadores")+ ylab("Frecuencia Acumulada")

#Histograma acumulado para las horas promedio 
Frecuencia_acu <- TablaF_horas[,3]

organizado_horas <- data.frame(x=TablaF_horas$horas,y=TablaF_horas$CumF_horas)

ggplot(data= organizado_horas, aes(x=x,y=y))+
  geom_bar(stat="identity",color="green",fill="gray")+
  xlab("Rango de horas promedio mensuales de trabajadores")+ ylab("Frecuencia Acumulada")

También se hizó un diagrama de tallos y hojas para la contabilización de los datos. O más bien, para poder observar más fácilmente la distribución de los mismos.

#Diagrama de tallos y hojas para la satisfacción 
View(satisfacción)
stem(satisfacción)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##    0 | 99999999999999999999999999999999999999999999999999999999999999999999+115
##    1 | 00000000000000000000000000000000000000000000000000000000000000000000+770
##    1 | 55555555555555555555555555555555555555555555555555555555555555555555+284
##    2 | 00000000000000000000000000000000000000000000000000000000000000000000+250
##    2 | 55555555555555555555555555555555556666666666666666666666666666667777+83
##    3 | 00000000000000000000000000000000000000011111111111111111111111111111+152
##    3 | 55555555555555555555555555555555555556666666666666666666666666666666+701
##    4 | 00000000000000000000000000000000000000000000000000000000000000000000+890
##    4 | 55555555555555555555555555555555555555555555555555555555555555555555+618
##    5 | 00000000000000000000000000000000000000000000000000000000000000000000+896
##    5 | 55555555555555555555555555555555555555555555555555555555555555555555+897
##    6 | 00000000000000000000000000000000000000000000000000000000000000000000+905
##    6 | 55555555555555555555555555555555555555555555555555555555555555555555+895
##    7 | 00000000000000000000000000000000000000000000000000000000000000000000+1029
##    7 | 55555555555555555555555555555555555555555555555555555555555555555555+1090
##    8 | 00000000000000000000000000000000000000000000000000000000000000000000+1084
##    8 | 55555555555555555555555555555555555555555555555555555555555555555555+976
##    9 | 00000000000000000000000000000000000000000000000000000000000000000000+898
##    9 | 55555555555555555555555555555555555555555555555555555555555555555555+835
##   10 | 00000000000000000000000000000000000000000000000000000000000000000000+31
#Diagrama de tallos y hojas para el desempeño 
View(desempeño)
stem(desempeño)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##    3 | 66666666666666666666667777777777777777777777777777777777777777777777+99
##    4 | 00000000000000000000000000000000000000000000000000000000011111111111+186
##    4 | 55555555555555555555555555555555555555555555555555555555555555555555+1043
##    5 | 00000000000000000000000000000000000000000000000000000000000000000000+1601
##    5 | 55555555555555555555555555555555555555555555555555555555555555555555+1413
##    6 | 00000000000000000000000000000000000000000000000000000000000000000000+1079
##    6 | 55555555555555555555555555555555555555555555555555555555555555555555+1003
##    7 | 00000000000000000000000000000000000000000000000000000000000000000000+1023
##    7 | 55555555555555555555555555555555555555555555555555555555555555555555+1092
##    8 | 00000000000000000000000000000000000000000000000000000000000000000000+1226
##    8 | 55555555555555555555555555555555555555555555555555555555555555555555+1366
##    9 | 00000000000000000000000000000000000000000000000000000000000000000000+1321
##    9 | 55555555555555555555555555555555555555555555555555555555555555555555+1224
##   10 | 00000000000000000000000000000000000000000000000000000000000000000000+203
#Diagrama de tallos y hojas para el promedio mensual de horas trabajadas por empleado  
View(horas)
stem(horas)
## 
##   The decimal point is 1 digit(s) to the right of the |
## 
##    9 | 666666777777777777778888888888888888888888899999999999
##   10 | 00000000000000000001111111111111111222222222222222223333333333333333+99
##   11 | 00000000000011111111111111111111111111222222222233333333333333333333+76
##   12 | 00000000001111111111111111111111112222222222233333333333333333333444+242
##   13 | 00000000000000000000000000000000000000000000000000000000000111111111+936
##   14 | 00000000000000000000000000000000000000000000000000000000000000000000+1138
##   15 | 00000000000000000000000000000000000000000000000000000000000000000000+1179
##   16 | 00000000000000000000000000000000000000000000000000000000000000000000+813
##   17 | 00000000000000000000000000000000000000000000000000000000000000000000+719
##   18 | 00000000000000000000000000000000000000000000000000000000000000000000+720
##   19 | 00000000000000000000000000000000000000000000000000000000000000000000+690
##   20 | 00000000000000000000000000000000000000000000000000000000001111111111+655
##   21 | 00000000000000000000000000000000000000000000000000000000000000000000+687
##   22 | 00000000000000000000000000000000000000000000000000000000000000001111+788
##   23 | 00000000000000000000000000000000000000000000000000000000000111111111+782
##   24 | 00000000000000000000000000000000000000000000000000000000000000000000+919
##   25 | 00000000000000000000000000000000000000000000000000000000000000000000+954
##   26 | 00000000000000000000000000000000000000000000000000000000000000000000+932
##   27 | 00000000000000000000000000000000000000000000000000000000000000000000+585
##   28 | 00000000000000000000000000000111111111111111111111111111111111122222+206
##   29 | 00000000000000011111111111111111222222222222222333333333333344444444+55
##   30 | 00000000000111111111111111111111111222222223333334444444444444444455+72
##   31 | 000000000000000000

Se obtuviron las medidas de tendencian cental para saber cuál era la satisfación y desempeño más central de los encuestados, es decir, los trabajadores.

#Media 
mean(satisfacción)
## [1] 0.6128335
mean(desempeño)
## [1] 0.7161017
mean(horas)
## [1] 201.0503
#Mediana
median(satisfacción)
## [1] 0.64
median(desempeño)
## [1] 0.72
median(horas)
## [1] 200
#Moda
moda <- function(x){
  return(as.numeric(names(which.max(table(x)))))
}
moda(satisfacción)
## [1] 0.1
moda(desempeño)
## [1] 0.55
moda(horas)
## [1] 135
#Rango medio
Rango_mhoras=(max(horas)+min(horas))/2
Rango_mhoras
## [1] 203
Rango_mdesempeño=(max(desempeño)+min(desempeño))/2
Rango_mdesempeño
## [1] 0.68
Rango_medio=(max(satisfacción)+min(satisfacción))/2
Rango_medio
## [1] 0.545

Para dividir la información también se determinaron los cuartiles.

#cuartiles
quantile(satisfacción, c(.25, .50, .75))
##  25%  50%  75% 
## 0.44 0.64 0.82
quantile(desempeño, c(.25, .50, .75))
##  25%  50%  75% 
## 0.56 0.72 0.87
quantile(horas, c(.25, .50, .75))
## 25% 50% 75% 
## 156 200 245

Por otro lado, también se obtuvo la varianza, la desviación estándar, el rango, y el rango inter cuartil.

#Varianza 
variance <- function (satisfacción) sum((satisfacción-mean(satisfacción))^2)/(length(satisfacción)-1)
variance(satisfacción)
## [1] 0.0618172
variance(desempeño)
## [1] 0.02929886
variance(horas)
## [1] 2494.313
#Desviación Estándar
desv=sqrt(variance(satisfacción))
desviación=sqrt(variance(desempeño))
desvi=sqrt(variance(horas))

desvi
## [1] 49.9431
desviación
## [1] 0.1711691
desv
## [1] 0.2486307
#Rango
rango=max(satisfacción)-min(satisfacción)
rango_d=max(desempeño)-min(desempeño)
rango_horas=max(horas)-min(horas)

#Rango intercuartil
IQR(satisfacción)
## [1] 0.38
IQR(desempeño)
## [1] 0.31
IQR(horas)
## [1] 89

Por último se realizó un diargama de caja y extensión para observar que tan alejados estaban los datos y así saber si exsitían datos anómalos.

#Diagrama de caja y extensión 
boxplot(satisfacción, horizontal=TRUE, main="Diagrama de cajas satisfacción", col="blue")

boxplot(desempeño, horizontal=TRUE, main="Diagrama de cajas desempeño", col="red")

boxplot(horas, horizontal=TRUE, main="Diagrama de cajas promedio de horas mensuales", col="darkgray")

Resultados y Conclusión

Se logro cuantificar un promedio de los ingresos recibidos de los empleados en la empresa así mismo su satisfacción con su vida laboral, dando resultados en donde podemos observar que el 48.8% de los empleados reciben un salario bajo comparado con la oferta y demanda actual, así mismo solo un 8.2% poseen un salario más alto de lo estipulado.

Se le recomienda a los nuevos directivos de la empresa empezar a realizar alternativas y reforman que equilibren esta disparidad salarial, provocando así que la satisfacción logre subir, creando una mejor calidad. a mayoria de los empleados ganan salarios bajos o medios. También se evidencia que los empleados trabajan en promedio un número parecido de horas, que es aproximadamente unas 200 horas al mes sin importar el salario que estén ganando. Por otro lado, se puede apreciar que los departamentos más activos y con más empleados son los de ventas, support y techinical. Por último, el ambiente de trabajo es muy seguro, tan sólo hay un 14% de accidentes laborales.