Primer informe de estadística

Resumen

“En este informe, luego de un respectivo y minucioso análisis estadístico, se encontró como la mayoría de empleados de una compañía, reportaron recibir un bajo salario. Sin embargo, se encontraban satisfechos con los servicios que la compañía les prestaba. Los anteriores resultados, se exhiben en el informe por medio de tablas y gráficas para su perfecto entendimiento.”

Introducción

“En el presente informe se realiza un estudio estadístico de un conjunto de datos, que corresponden al nivel de satisfacción de los empleados de una empresa en específico. Esto es necesario para saber si las condiciones de la compañía cumplen con las respectivas medidas para el buen cuidado de los empleados”

Metodología

“Es necesario seguir un procedimiento para poder llevar a cabo el respectivo análisis. Principalmente, la toma de datos es el punto inicial y esencial, donde por medio de encuestas, en este caso a los empleados de la compañía, se puede medir la satisfacción de cada uno de ellos, para seguidamente someter dichos datos a un estudio estadístico. Para poder realizar el desarrollo del informe, es necesario el uso de un programa para manejar algoritmos, en este caso se utilizó “RStudioCloud”. Con esta aplicación se puede desarrollar una óptima ejecución de los distintos apartados, desde la organización de datos en tablas, hasta la representación de dichos datos en forma de gráficas. Sin embargo, eso se debe realizar por medio de códigos, los cuales posteriormente deben ser plasmados en el algoritmo.”

A continuación cargamos las librerías y definimos los vectores y dataframes para trabajar

#Librerias

library(openxlsx)
library (ggplot2)
library(RColorBrewer)
library(qcc)
## Package 'qcc' version 2.7
## Type 'citation("qcc")' for citing this R package in publications.
#definición de datos

HR_Employee_Data<- read.xlsx("HR_Employee_Data.xlsx")

Datos_de_empleados<-as.data.frame(HR_Employee_Data)

head(Datos_de_empleados$satisfaction_level)
## [1] 0.38 0.80 0.11 0.72 0.37 0.41
str(Datos_de_empleados$satisfaction_level)
##  num [1:14999] 0.38 0.8 0.11 0.72 0.37 0.41 0.1 0.92 0.89 0.42 ...
tail(Datos_de_empleados$satisfaction_level)
## [1] 0.76 0.40 0.37 0.37 0.11 0.37

A continuación se pondrá apreciar el resumen de los datos

#Resumen de datos

NivelSat = Datos_de_empleados$satisfaction_level
clases = nclass.Sturges(NivelSat)

summary(Datos_de_empleados$satisfaction_level)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0900  0.4400  0.6400  0.6128  0.8200  1.0000
summary(Datos_de_empleados)
##     Emp_Id          satisfaction_level last_evaluation  number_project 
##  Length:14999       Min.   :0.0900     Min.   :0.3600   Min.   :2.000  
##  Class :character   1st Qu.:0.4400     1st Qu.:0.5600   1st Qu.:3.000  
##  Mode  :character   Median :0.6400     Median :0.7200   Median :4.000  
##                     Mean   :0.6128     Mean   :0.7161   Mean   :3.803  
##                     3rd Qu.:0.8200     3rd Qu.:0.8700   3rd Qu.:5.000  
##                     Max.   :1.0000     Max.   :1.0000   Max.   :7.000  
##  average_montly_hours time_spend_company Work_accident         left       
##  Min.   : 96.0        Min.   : 2.000     Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:156.0        1st Qu.: 3.000     1st Qu.:0.0000   1st Qu.:0.0000  
##  Median :200.0        Median : 3.000     Median :0.0000   Median :0.0000  
##  Mean   :201.1        Mean   : 3.498     Mean   :0.1446   Mean   :0.2381  
##  3rd Qu.:245.0        3rd Qu.: 4.000     3rd Qu.:0.0000   3rd Qu.:0.0000  
##  Max.   :310.0        Max.   :10.000     Max.   :1.0000   Max.   :1.0000  
##  promotion_last_5years  Department           salary         
##  Min.   :0.00000       Length:14999       Length:14999      
##  1st Qu.:0.00000       Class :character   Class :character  
##  Median :0.00000       Mode  :character   Mode  :character  
##  Mean   :0.02127                                            
##  3rd Qu.:0.00000                                            
##  Max.   :1.00000

Punto 3

3.1. Tabla de frecuencia simple

simple <- as.data.frame(table(NivelSat))
completa = transform(simple,FRECAC=cumsum(simple$Freq),FRECREL=round(prop.table(simple$Freq),3),RELACUM=round(cumsum(prop.table(simple$Freq)),3))
completa
##    NivelSat Freq FRECAC FRECREL RELACUM
## 1      0.09  195    195   0.013   0.013
## 2       0.1  358    553   0.024   0.037
## 3      0.11  335    888   0.022   0.059
## 4      0.12   30    918   0.002   0.061
## 5      0.13   54    972   0.004   0.065
## 6      0.14   73   1045   0.005   0.070
## 7      0.15   76   1121   0.005   0.075
## 8      0.16   79   1200   0.005   0.080
## 9      0.17   72   1272   0.005   0.085
## 10     0.18   63   1335   0.004   0.089
## 11     0.19   74   1409   0.005   0.094
## 12      0.2   69   1478   0.005   0.099
## 13     0.21   67   1545   0.004   0.103
## 14     0.22   60   1605   0.004   0.107
## 15     0.23   54   1659   0.004   0.111
## 16     0.24   80   1739   0.005   0.116
## 17     0.25   34   1773   0.002   0.118
## 18     0.26   30   1803   0.002   0.120
## 19     0.27   30   1833   0.002   0.122
## 20     0.28   31   1864   0.002   0.124
## 21     0.29   38   1902   0.003   0.127
## 22      0.3   39   1941   0.003   0.129
## 23     0.31   59   2000   0.004   0.133
## 24     0.32   50   2050   0.003   0.137
## 25     0.33   36   2086   0.002   0.139
## 26     0.34   48   2134   0.003   0.142
## 27     0.35   37   2171   0.002   0.145
## 28     0.36  139   2310   0.009   0.154
## 29     0.37  241   2551   0.016   0.170
## 30     0.38  189   2740   0.013   0.183
## 31     0.39  175   2915   0.012   0.194
## 32      0.4  209   3124   0.014   0.208
## 33     0.41  171   3295   0.011   0.220
## 34     0.42  155   3450   0.010   0.230
## 35     0.43  224   3674   0.015   0.245
## 36     0.44  211   3885   0.014   0.259
## 37     0.45  203   4088   0.014   0.273
## 38     0.46   95   4183   0.006   0.279
## 39     0.47   42   4225   0.003   0.282
## 40     0.48  149   4374   0.010   0.292
## 41     0.49  209   4583   0.014   0.306
## 42      0.5  229   4812   0.015   0.321
## 43     0.51  187   4999   0.012   0.333
## 44     0.52  196   5195   0.013   0.346
## 45     0.53  179   5374   0.012   0.358
## 46     0.54  185   5559   0.012   0.371
## 47     0.55  179   5738   0.012   0.383
## 48     0.56  187   5925   0.012   0.395
## 49     0.57  210   6135   0.014   0.409
## 50     0.58  182   6317   0.012   0.421
## 51     0.59  219   6536   0.015   0.436
## 52      0.6  193   6729   0.013   0.449
## 53     0.61  208   6937   0.014   0.462
## 54     0.62  188   7125   0.013   0.475
## 55     0.63  209   7334   0.014   0.489
## 56     0.64  187   7521   0.012   0.501
## 57     0.65  199   7720   0.013   0.515
## 58     0.66  228   7948   0.015   0.530
## 59     0.67  177   8125   0.012   0.542
## 60     0.68  162   8287   0.011   0.553
## 61     0.69  209   8496   0.014   0.566
## 62      0.7  205   8701   0.014   0.580
## 63     0.71  171   8872   0.011   0.592
## 64     0.72  230   9102   0.015   0.607
## 65     0.73  246   9348   0.016   0.623
## 66     0.74  257   9605   0.017   0.640
## 67     0.75  226   9831   0.015   0.655
## 68     0.76  234  10065   0.016   0.671
## 69     0.77  252  10317   0.017   0.688
## 70     0.78  241  10558   0.016   0.704
## 71     0.79  217  10775   0.014   0.718
## 72      0.8  222  10997   0.015   0.733
## 73     0.81  220  11217   0.015   0.748
## 74     0.82  241  11458   0.016   0.764
## 75     0.83  234  11692   0.016   0.780
## 76     0.84  247  11939   0.016   0.796
## 77     0.85  207  12146   0.014   0.810
## 78     0.86  200  12346   0.013   0.823
## 79     0.87  225  12571   0.015   0.838
## 80     0.88  187  12758   0.012   0.851
## 81     0.89  237  12995   0.016   0.866
## 82      0.9  220  13215   0.015   0.881
## 83     0.91  224  13439   0.015   0.896
## 84     0.92  198  13637   0.013   0.909
## 85     0.93  169  13806   0.011   0.920
## 86     0.94  167  13973   0.011   0.932
## 87     0.95  181  14154   0.012   0.944
## 88     0.96  203  14357   0.014   0.957
## 89     0.97  176  14533   0.012   0.969
## 90     0.98  183  14716   0.012   0.981
## 91     0.99  172  14888   0.011   0.993
## 92        1  111  14999   0.007   1.000

3.2. Tabla de frecuencia agrupada

  frecuencias <- as.data.frame(table(clases=factor(cut(NivelSat, breaks = clases))))
tabla <- transform(frecuencias,FRECAC=cumsum(Freq), FRECREL = Freq/length(NivelSat),RELACUM=cumsum(Freq/length(NivelSat)))
tabla
##            clases Freq FRECAC    FRECREL    RELACUM
## 1  (0.0891,0.151] 1121   1121 0.07473832 0.07473832
## 2   (0.151,0.211]  424   1545 0.02826855 0.10300687
## 3   (0.211,0.272]  288   1833 0.01920128 0.12220815
## 4   (0.272,0.333]  253   2086 0.01686779 0.13907594
## 5   (0.333,0.393]  829   2915 0.05527035 0.19434629
## 6   (0.393,0.454] 1173   4088 0.07820521 0.27255150
## 7   (0.454,0.515]  911   4999 0.06073738 0.33328889
## 8   (0.515,0.575] 1136   6135 0.07573838 0.40902727
## 9   (0.575,0.636] 1199   7334 0.07993866 0.48896593
## 10  (0.636,0.697] 1162   8496 0.07747183 0.56643776
## 11  (0.697,0.757] 1335   9831 0.08900593 0.65544370
## 12  (0.757,0.818] 1386  11217 0.09240616 0.74784986
## 13  (0.818,0.879] 1354  12571 0.09027268 0.83812254
## 14  (0.879,0.939] 1235  13806 0.08233882 0.92046136
## 15      (0.939,1] 1193  14999 0.07953864 1.00000000

3.5. Diagrama de Pareto

tipoTabla <- split(x = simple[,2], f = simple[,1])
sumaTipo <- sapply(X = tipoTabla, FUN = sum)
pareto.chart(sumaTipo)

##       
## Pareto chart analysis for sumaTipo
##           Frequency    Cum.Freq.   Percentage Cum.Percent.
##   0.1  3.580000e+02 3.580000e+02 2.386826e+00 2.386826e+00
##   0.11 3.350000e+02 6.930000e+02 2.233482e+00 4.620308e+00
##   0.74 2.570000e+02 9.500000e+02 1.713448e+00 6.333756e+00
##   0.77 2.520000e+02 1.202000e+03 1.680112e+00 8.013868e+00
##   0.84 2.470000e+02 1.449000e+03 1.646776e+00 9.660644e+00
##   0.73 2.460000e+02 1.695000e+03 1.640109e+00 1.130075e+01
##   0.37 2.410000e+02 1.936000e+03 1.606774e+00 1.290753e+01
##   0.78 2.410000e+02 2.177000e+03 1.606774e+00 1.451430e+01
##   0.82 2.410000e+02 2.418000e+03 1.606774e+00 1.612107e+01
##   0.89 2.370000e+02 2.655000e+03 1.580105e+00 1.770118e+01
##   0.76 2.340000e+02 2.889000e+03 1.560104e+00 1.926128e+01
##   0.83 2.340000e+02 3.123000e+03 1.560104e+00 2.082139e+01
##   0.72 2.300000e+02 3.353000e+03 1.533436e+00 2.235482e+01
##   0.5  2.290000e+02 3.582000e+03 1.526768e+00 2.388159e+01
##   0.66 2.280000e+02 3.810000e+03 1.520101e+00 2.540169e+01
##   0.75 2.260000e+02 4.036000e+03 1.506767e+00 2.690846e+01
##   0.87 2.250000e+02 4.261000e+03 1.500100e+00 2.840856e+01
##   0.43 2.240000e+02 4.485000e+03 1.493433e+00 2.990199e+01
##   0.91 2.240000e+02 4.709000e+03 1.493433e+00 3.139543e+01
##   0.8  2.220000e+02 4.931000e+03 1.480099e+00 3.287553e+01
##   0.81 2.200000e+02 5.151000e+03 1.466764e+00 3.434229e+01
##   0.9  2.200000e+02 5.371000e+03 1.466764e+00 3.580905e+01
##   0.59 2.190000e+02 5.590000e+03 1.460097e+00 3.726915e+01
##   0.79 2.170000e+02 5.807000e+03 1.446763e+00 3.871591e+01
##   0.44 2.110000e+02 6.018000e+03 1.406760e+00 4.012267e+01
##   0.57 2.100000e+02 6.228000e+03 1.400093e+00 4.152277e+01
##   0.4  2.090000e+02 6.437000e+03 1.393426e+00 4.291619e+01
##   0.49 2.090000e+02 6.646000e+03 1.393426e+00 4.430962e+01
##   0.63 2.090000e+02 6.855000e+03 1.393426e+00 4.570305e+01
##   0.69 2.090000e+02 7.064000e+03 1.393426e+00 4.709647e+01
##   0.61 2.080000e+02 7.272000e+03 1.386759e+00 4.848323e+01
##   0.85 2.070000e+02 7.479000e+03 1.380092e+00 4.986332e+01
##   0.7  2.050000e+02 7.684000e+03 1.366758e+00 5.123008e+01
##   0.45 2.030000e+02 7.887000e+03 1.353424e+00 5.258351e+01
##   0.96 2.030000e+02 8.090000e+03 1.353424e+00 5.393693e+01
##   0.86 2.000000e+02 8.290000e+03 1.333422e+00 5.527035e+01
##   0.65 1.990000e+02 8.489000e+03 1.326755e+00 5.659711e+01
##   0.92 1.980000e+02 8.687000e+03 1.320088e+00 5.791719e+01
##   0.52 1.960000e+02 8.883000e+03 1.306754e+00 5.922395e+01
##   0.09 1.950000e+02 9.078000e+03 1.300087e+00 6.052403e+01
##   0.6  1.930000e+02 9.271000e+03 1.286752e+00 6.181079e+01
##   0.38 1.890000e+02 9.460000e+03 1.260084e+00 6.307087e+01
##   0.62 1.880000e+02 9.648000e+03 1.253417e+00 6.432429e+01
##   0.51 1.870000e+02 9.835000e+03 1.246750e+00 6.557104e+01
##   0.56 1.870000e+02 1.002200e+04 1.246750e+00 6.681779e+01
##   0.64 1.870000e+02 1.020900e+04 1.246750e+00 6.806454e+01
##   0.88 1.870000e+02 1.039600e+04 1.246750e+00 6.931129e+01
##   0.54 1.850000e+02 1.058100e+04 1.233416e+00 7.054470e+01
##   0.98 1.830000e+02 1.076400e+04 1.220081e+00 7.176478e+01
##   0.58 1.820000e+02 1.094600e+04 1.213414e+00 7.297820e+01
##   0.95 1.810000e+02 1.112700e+04 1.206747e+00 7.418495e+01
##   0.53 1.790000e+02 1.130600e+04 1.193413e+00 7.537836e+01
##   0.55 1.790000e+02 1.148500e+04 1.193413e+00 7.657177e+01
##   0.67 1.770000e+02 1.166200e+04 1.180079e+00 7.775185e+01
##   0.97 1.760000e+02 1.183800e+04 1.173412e+00 7.892526e+01
##   0.39 1.750000e+02 1.201300e+04 1.166744e+00 8.009201e+01
##   0.99 1.720000e+02 1.218500e+04 1.146743e+00 8.123875e+01
##   0.41 1.710000e+02 1.235600e+04 1.140076e+00 8.237883e+01
##   0.71 1.710000e+02 1.252700e+04 1.140076e+00 8.351890e+01
##   0.93 1.690000e+02 1.269600e+04 1.126742e+00 8.464564e+01
##   0.94 1.670000e+02 1.286300e+04 1.113408e+00 8.575905e+01
##   0.68 1.620000e+02 1.302500e+04 1.080072e+00 8.683912e+01
##   0.42 1.550000e+02 1.318000e+04 1.033402e+00 8.787252e+01
##   0.48 1.490000e+02 1.332900e+04 9.933996e-01 8.886592e+01
##   0.36 1.390000e+02 1.346800e+04 9.267284e-01 8.979265e+01
##   1    1.110000e+02 1.357900e+04 7.400493e-01 9.053270e+01
##   0.46 9.500000e+01 1.367400e+04 6.333756e-01 9.116608e+01
##   0.24 8.000000e+01 1.375400e+04 5.333689e-01 9.169945e+01
##   0.16 7.900000e+01 1.383300e+04 5.267018e-01 9.222615e+01
##   0.15 7.600000e+01 1.390900e+04 5.067004e-01 9.273285e+01
##   0.19 7.400000e+01 1.398300e+04 4.933662e-01 9.322622e+01
##   0.14 7.300000e+01 1.405600e+04 4.866991e-01 9.371291e+01
##   0.17 7.200000e+01 1.412800e+04 4.800320e-01 9.419295e+01
##   0.2  6.900000e+01 1.419700e+04 4.600307e-01 9.465298e+01
##   0.21 6.700000e+01 1.426400e+04 4.466964e-01 9.509967e+01
##   0.18 6.300000e+01 1.432700e+04 4.200280e-01 9.551970e+01
##   0.22 6.000000e+01 1.438700e+04 4.000267e-01 9.591973e+01
##   0.31 5.900000e+01 1.444600e+04 3.933596e-01 9.631309e+01
##   0.13 5.400000e+01 1.450000e+04 3.600240e-01 9.667311e+01
##   0.23 5.400000e+01 1.455400e+04 3.600240e-01 9.703314e+01
##   0.32 5.000000e+01 1.460400e+04 3.333556e-01 9.736649e+01
##   0.34 4.800000e+01 1.465200e+04 3.200213e-01 9.768651e+01
##   0.47 4.200000e+01 1.469400e+04 2.800187e-01 9.796653e+01
##   0.3  3.900000e+01 1.473300e+04 2.600173e-01 9.822655e+01
##   0.29 3.800000e+01 1.477100e+04 2.533502e-01 9.847990e+01
##   0.35 3.700000e+01 1.480800e+04 2.466831e-01 9.872658e+01
##   0.33 3.600000e+01 1.484400e+04 2.400160e-01 9.896660e+01
##   0.25 3.400000e+01 1.487800e+04 2.266818e-01 9.919328e+01
##   0.28 3.100000e+01 1.490900e+04 2.066804e-01 9.939996e+01
##   0.12 3.000000e+01 1.493900e+04 2.000133e-01 9.959997e+01
##   0.26 3.000000e+01 1.496900e+04 2.000133e-01 9.979999e+01
##   0.27 3.000000e+01 1.499900e+04 2.000133e-01 1.000000e+02

3.6. Diagrama de tallo y hojas stem(NivelSat)

3.7. Histograma de Frecuencias + Diagrama Poligonal

histogramaFreq = hist(NivelSat, breaks = "Sturges", col = "ivory", xlab = "Nivel de satisfacción", ylab = "Frecuencia", main = "Histograma de nivel de satisfacción + Diagrama poligonal")
lines(c(0, histogramaFreq$mids), c(0,histogramaFreq$counts), col = "red", lwd = 2)

3.8. Histograma de Frecuencias Acumuladas + Diagrama de Ojiva

histogramaAcum <- hist(NivelSat, breaks = "Sturges",plot=FALSE);
histogramaAcum$counts <- cumsum(histogramaAcum$counts)
plot(histogramaAcum, col = "ivory", xlab = "Nivel de satisfacción", ylab = "Frecuencia", main = "Histograma de nivel de satisfacción + Diagrama poligonal")
lines(c(0, histogramaFreq$mids), c(0,cumsum(histogramaFreq$counts)), col = "red", lwd = 2)

3.9. Media

mean(NivelSat)
## [1] 0.6128335

3.10. Mediana

median(NivelSat)
## [1] 0.64

3.11. Moda

f <- data.frame(table(NivelSat))
moda <- f[which.max(f$Freq),1]
moda
## [1] 0.1
## 92 Levels: 0.09 0.1 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 0.19 0.2 ... 1

3.12. Rango Medio

rMedio = (max(NivelSat)+min(NivelSat))/2
rMedio
## [1] 0.545

3.13. Cuartiles

quantile(NivelSat, c(.25, .50, .75))
##  25%  50%  75% 
## 0.44 0.64 0.82

3.14. Varianza

variance <- function (NivelSat) sum((NivelSat-mean(NivelSat))^2)/(length(NivelSat)-1)
variance(NivelSat)
## [1] 0.0618172

3.15. Desviación Estándar

desv = sqrt(variance(NivelSat))
desv
## [1] 0.2486307

3.16. Rango

rango = max(NivelSat)-min(NivelSat)
rango
## [1] 0.91

3.17. Rango Intercuartil

IQR(NivelSat)
## [1] 0.38

3.18. Varianza

variance(NivelSat)
## [1] 0.0618172

3.19. Desviación Estándar

sqrt(variance(NivelSat))
## [1] 0.2486307

3.20. Diagrama de caja y extensión

boxplot(NivelSat, horizontal = TRUE, main="Diagrama de cajas y bigotes (Nivel de satisfacción)",col = "ivory")

Resultado

Luego de realizar el respectivo análisis de datos, se puede evidenciar que la mayoría de empleados que pertenecen a la fábrica, más específicamente un 48%, reciben un salario bajo. Sin embargo, se obtuvo que la mayoría de empleados se sienten satisfechos con los servicios que les brinda la compañía para su bienestar”

Conclusión

Para concluir, gracias al uso del programa algorítmico “RStudioCloud”, se pudo sintetizar y analizar estadísticamente el conjunto un datos, los cuales, corresponden nivel de satisfacción que los empleados de una compañía en específico tenían con respecto a los servicios que dicha empresa les prestaba para su bienestar. Seguidamente, los resultados encontrados indicaron que a pesar que casi la mitad de los empleados encuestados indicaron que recibían un salario bajo, de igual manera, resaltaron que se encontraban satisfechos con el trato que la compañía les daba.”