Video explicativo sobre la realización del proyecto

enlace:https://youtu.be/CnFGCLfPL1w

Tamaño de muestra lo primero que se hizo fue preguntar en las oficinas de comedores el número total de estudiantes que contaban con servicio de comedores a la hora del almuerzo el cual fue 2750 que sería en este caso nuestra población total.

habiendo conseguido este dato se procede a hacer una prueba piloto con la variable establecimiento a estudiar, para calcular su desviación estándar junto a su varianza.

library(readxl)
SC <- read_excel("C:/Users/57314/Desktop/PROYECTO ESTADISTICA MP/SC.xlsx")
attach(SC)
names(SC)
## [1] "Marca temporal"                                                                                                                            
## [2] "¿Usted es beneficiario del servicio de comedores?"                                                                                         
## [3] "Sexo"                                                                                                                                      
## [4] "¿Cuál es su estrato socioeconómico?"                                                                                                       
## [5] "¿Cuenta con las 3 comidas del servicio de comedores?"                                                                                      
## [6] "Del 1 al 10 ¿Como califica el estado de sillas, comedores, de mas. Los cuales están dispuestos para dicho beneficio?(puede usar decimales)"
## [7] "Del 1 al 10  ¿Qué grado de satisfacción experimenta con la cantidad de comida que recibe?(puede usar decimales)"                           
## [8] "Según su experiencia del 1 al 10 ¿En qué medida se puede calificar la calidad del sabor de la comida?(puede usar decimales)"               
## [9] "¿Cuán satisfecho está usted con el servicio de comedores?"
colnames(SC)[1]="fecha"
colnames(SC)[2]="beneficiario"
colnames(SC)[3]="sexo"
colnames(SC)[4]="estrato"
colnames(SC)[5]="trescomidas"
colnames(SC)[6]="establecimiento"
colnames(SC)[7]="cantidad"
colnames(SC)[8]="sabor"
colnames(SC)[9]="satisfacción"
attach(SC)
names(SC)
## [1] "fecha"           "beneficiario"    "sexo"            "estrato"        
## [5] "trescomidas"     "establecimiento" "cantidad"        "sabor"          
## [9] "satisfacción"
library(TeachingSampling) 
## Loading required package: dplyr
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Loading required package: magrittr
v_p=var(SC$establecimiento) 
d_p=sd(SC$establecimiento)
##Los resultados fueron:
v_p
## [1] 0.1973333
d_p
## [1] 0.4442222

El paso por seguir después de haber hallado la desviación estándar y la varianza es proponer una varianza la cual equivale a la octava parte de dicha varianza.

desv_propuesta=0.05  
var_propuesta=desv_propuesta^2  
### Se tiene que:
desv_propuesta
## [1] 0.05
var_propuesta
## [1] 0.0025

Se procede a nombrar a nuestra población total

N=2750 
N
## [1] 2750

se utilizó la siguiente fórmula para hallar el tamaño de muestra optimo:

\(n=\displaystyle\frac{NS^2}{NV+S^2}\)

donde:

N:Población total

S^2:Varianza prueba piloto

V:Varianaza propuesta

se procede a calcular el tamaño de la muestra

n=(N*v_p)/((N*var_propuesta)+v_p)
n
## [1] 76.73092
tm=round(n,0)
tm
## [1] 77

Con el tamaño de muestra ya calculado se procede a calcular la fracción muestral.

FM=N/tm
FM
## [1] 35.71429
FME=round(FM,0)
FME
## [1] 36

Una vez calculada la fracción muestral se procede a hacer el cálculo de un número aleatorio entre 1 y 36, para asegurar que el número siempre fuera el mismo se plantó una semilla, con el fin de no alterar el resultado.

set.seed(4)
RN=sample(1:36,1)
RN
## [1] 11

#TRATAMIENTO DE DATOS

library(readxl)
DF <- read_excel("C:/Users/57314/Desktop/PROYECTO ESTADISTICA MP/DF.xlsx")
###tratamiento de datos 
attach(DF)
## The following objects are masked from SC (pos = 7):
## 
##     ¿Cuál es su estrato socioeconómico?, ¿Cuán satisfecho está usted
##     con el servicio de comedores?, ¿Cuenta con las 3 comidas del
##     servicio de comedores?, ¿Usted es beneficiario del servicio de
##     comedores?, Del 1 al 10 ¿Qué grado de satisfacción experimenta con
##     la cantidad de comida que recibe?(puede usar decimales), Del 1 al
##     10 ¿Como califica el estado de sillas, comedores, de mas. Los
##     cuales están dispuestos para dicho beneficio?(puede usar
##     decimales), Marca temporal, Según su experiencia del 1 al 10 ¿En
##     qué medida se puede calificar la calidad del sabor de la
##     comida?(puede usar decimales), Sexo
names(DF)
## [1] "Marca temporal"                                                                                                                            
## [2] "¿Usted es beneficiario del servicio de comedores?"                                                                                         
## [3] "Sexo"                                                                                                                                      
## [4] "¿Cuál es su estrato socioeconómico?"                                                                                                       
## [5] "¿Cuenta con las 3 comidas del servicio de comedores?"                                                                                      
## [6] "Del 1 al 10 ¿Como califica el estado de sillas, comedores, de mas. Los cuales están dispuestos para dicho beneficio?(puede usar decimales)"
## [7] "Del 1 al 10  ¿Qué grado de satisfacción experimenta con la cantidad de comida que recibe?(puede usar decimales)"                           
## [8] "Según su experiencia del 1 al 10 ¿En qué medida se puede calificar la calidad del sabor de la comida?(puede usar decimales)"               
## [9] "¿Cuán satisfecho está usted con el servicio de comedores?"
colnames(DF)[1]="fecha"
colnames(DF)[2]="beneficiario"
colnames(DF)[3]="sexo"
colnames(DF)[4]="estrato"
colnames(DF)[5]="trescomidas"
colnames(DF)[6]="establecimiento"
colnames(DF)[7]="cantidad"
colnames(DF)[8]="sabor"
colnames(DF)[9]="satisfacción"
attach(DF)
## The following objects are masked from SC (pos = 7):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
names(DF)
## [1] "fecha"           "beneficiario"    "sexo"            "estrato"        
## [5] "trescomidas"     "establecimiento" "cantidad"        "sabor"          
## [9] "satisfacción"

#ESTADISTICA DESCRIPTIVA

#-VARIABLES CATEGORICAS

Lo primero fue trabajar con las variables categóricas, sin embargo para complementar se presenta una pequeña información sobre las variables continuas.

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.4
## ✔ ggplot2   3.4.2     ✔ stringr   1.5.0
## ✔ lubridate 1.9.2     ✔ tibble    3.2.1
## ✔ purrr     1.0.1     ✔ tidyr     1.3.0
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ tidyr::extract()   masks magrittr::extract()
## ✖ dplyr::filter()    masks stats::filter()
## ✖ dplyr::lag()       masks stats::lag()
## ✖ purrr::set_names() masks magrittr::set_names()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(fdth)
## 
## Attaching package: 'fdth'
## 
## The following objects are masked from 'package:stats':
## 
##     sd, var
DF$establecimiento=as.numeric(DF$establecimiento)
summary(DF$establecimiento)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    7.50    8.20    8.50    8.41    8.70    9.00
DF$cantidad=as.numeric(DF$cantidad)
summary(DF$cantidad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   7.500   7.800   8.000   8.031   8.200   9.000
DF$sabor=as.numeric(DF$sabor)
summary(DF$sabor)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   6.300   7.000   7.300   7.356   7.800   8.500

#Estadistica descriptiva de la variable sexo

A ser una variable categorica se le realizara una tabla de frecuencias.

DF$sexo_a=as.factor(sexo)
attach(DF)
## The following objects are masked from DF (pos = 13):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 18):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(sexo_a) 
## [1] "factor"
tabla1=fdt_cat(DF$sexo_a, stort=TRUE)
tabla1
##   Category  f   rf rf(%) cf  cf(%)
##  Masculino 29 0.56 55.77 29  55.77
##   Femenino 23 0.44 44.23 52 100.00
table(DF$sexo)
## 
##  Femenino Masculino 
##        23        29

De la variable sexo se pudo ver que del total de encuestados 23 personas fueron mujeres lo que equivale 44% sobre el total mientras que 29 fueron hombres lo que equivale al 56% de los encuestados.

#Estadistica descriptiva de la variable estrato

library(psych)
## 
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha
library(modeest)
## Registered S3 method overwritten by 'rmutil':
##   method         from 
##   plot.residuals psych
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
DF$estrato_a=as.factor(DF$estrato)
attach(DF)
## The following objects are masked from DF (pos = 5):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 16):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 21):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(estrato_a) 
## [1] "factor"
tabla2=fdt_cat(DF$estrato_a, stort=TRUE)
tabla2
##  Category  f   rf rf(%) cf  cf(%)
##         1 30 0.58 57.69 30  57.69
##         2 19 0.37 36.54 49  94.23
##         3  3 0.06  5.77 52 100.00
table(DF$estrato)
## 
##  1  2  3 
## 30 19  3
mfv(DF$estrato, na_rm = T)
## [1] 1

Gracias a la estadística descriptiva de la variable estrato se puede ver que la mayor parte de beneficiarios pertenece al estrato 1 con un 58% sobre el total de encuestados.

#Estadística descriptiva de la variable satisfacción

Al ser una variable categórica se le realizara una tabla de frecuencias.

DF$satisfacción_a=as.factor(DF$satisfacción)
attach(DF)
## The following objects are masked from DF (pos = 3):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 6):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 17):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 22):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(satisfacción_a) 
## [1] "factor"
tabla3=fdt_cat(DF$satisfacción_a, stort=TRUE)
tabla3
##        Category  f   rf rf(%) cf  cf(%)
##      Satisfecho 40 0.77 76.92 40  76.92
##  Muy satisfecho  8 0.15 15.38 48  92.31
##    Insatisfecho  4 0.08  7.69 52 100.00
table(DF$satisfacción)
## 
##   Insatisfecho Muy satisfecho     Satisfecho 
##              4              8             40

Con esta variable se pudo averiguar que el servicio de comedores tiene una gran aceptación por parte de los estudiantes.

##Estadística descriptiva de la variable tres comidas

Al ser una variable categórica se le realizara una tabla de frecuencias.

DF$trescomidas_a=as.factor(DF$trescomidas)
attach(DF)
## The following objects are masked from DF (pos = 3):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, satisfacción_a, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 4):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 7):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 18):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 23):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(trescomidas_a) 
## [1] "factor"
tabla4=fdt_cat(DF$trescomidas_a, stort=TRUE)
tabla4
##  Category  f   rf rf(%) cf  cf(%)
##        No 32 0.62 61.54 32  61.54
##        Si 20 0.38 38.46 52 100.00
table(DF$trescomidas)
## 
## No Si 
## 32 20

Gracias al estudio de esta variable sabemos que aproximadamente el 62% der los encuestados no cuentan con las 3 comidas

#-Estadística descriptiva variables continuas

Para este tipo de variables la estadística descriptiva se le procedió a calcular: mediana, media, desviación estándar, varianza, moda, sesgo, kuroses y su respectivo histograma.

#Estadística descriptiva de la variable establecimiento

medianacantidad=median(DF$cantidad, na.rm = T) #calculo mediana
medianacantidad
## [1] 8
promediocantidad=mean(DF$cantidad , na.rm = T)  #calculo promedio
promediocantidad
## [1] 8.030769
desvcantidadDF=sd(DF$cantidad , na.rm = T)     #calculo desviación
desvcantidadDF
## [1] 0.3146978
varcantidadDF=var(DF$cantidad , na.rm = T)     #calculo varianza
varcantidadDF
## [1] 0.09903469
cvcantidad= desvcantidadDF/promediocantidad         #calculo coeficiente de varianza     
cvcantidad
## [1] 0.0391865
modacantidad=mfv(DF$cantidad, na_rm =T)       #calculo moda
modacantidad
## [1] 8
skcantidad=skew(DF$cantidad)                  #calculo sesgo
skcantidad
## [1] 0.7208672
ckcantidad=kurtosi(DF$cantidad)               #calculo kurtosis
ckcantidad
## [1] 0.9404712
hist(DF$cantidad)

Para esta variable el valor más repetido fue el 8

#Estadística descriptiva de la variable cantidad

medianacantidad=median(DF$cantidad, na.rm = T) #calculo mediana
medianacantidad
## [1] 8
promediocantidad=mean(DF$cantidad , na.rm = T)  #calculo promedio
promediocantidad
## [1] 8.030769
desvcantidadDF=sd(DF$cantidad , na.rm = T)     #calculo desviación
desvcantidadDF
## [1] 0.3146978
varcantidadDF=var(DF$cantidad , na.rm = T)     #calculo varianza
varcantidadDF
## [1] 0.09903469
cvcantidad= desvcantidadDF/promediocantidad         #calculo coeficiente de varianza     
cvcantidad
## [1] 0.0391865
modacantidad=mfv(DF$cantidad, na_rm =T)       #calculo moda
modacantidad
## [1] 8
skcantidad=skew(DF$cantidad)                  #calculo sesgo
skcantidad
## [1] 0.7208672
ckcantidad=kurtosi(DF$cantidad)               #calculo kurtosis
ckcantidad
## [1] 0.9404712
hist(DF$cantidad)

Con la variable cantidad de la comida se puede ver que la mayor parte se encuentra entre 7,5 y 8; siendo 8 el más repetido.

#Estadística descriptiva de la variable sabor

medianasabor=median(DF$sabor , na.rm = T) #calculo mediana
medianasabor
## [1] 7.3
promediosabor=mean(DF$sabor , na.rm = T)  #calculo promedio
promediosabor
## [1] 7.355769
desvsaborDF=sd(DF$sabor , na.rm = T)     #calculo desviación
desvsaborDF
## [1] 0.5108292
varsaborDF=var(DF$sabor , na.rm = T)     #calculo varianza
varsaborDF
## [1] 0.2609465
cvsabor=desvsaborDF/promediosabor         #calculo coeficiente de varianza     
cvsabor
## [1] 0.06944606
modasabor=mfv(DF$sabor, na_rm =T)       #calculo moda
modasabor
## [1] 7.2
sksabor=skew(DF$sabor)                  #calculo sesgo
sksabor
## [1] 0.03915496
cksabor=kurtosi(DF$sabor)               #calculo kurtosis
cksabor
## [1] -0.6590563
hist(DF$sabor)

Para el sabor de la comida se puede ver que la mayor parte se encuentra entre 7 y 7,5; siendo 7,2 el más repetido.

#Cruce de variables

#cruce entre variable categórica (estrato) vs Numérica (Establecimiento)

DF$establecimiento_a=as.factor(DF$establecimiento)
attach(DF)
## The following objects are masked from DF (pos = 3):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, satisfacción_a, sexo, sexo_a, trescomidas,
##     trescomidas_a
## The following objects are masked from DF (pos = 4):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, satisfacción_a, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 5):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 8):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 19):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 24):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(establecimiento_a)
## [1] "factor"
tabla5=fdt_cat(DF$establecimiento_a,sort = TRUE)
tabla5
##  Category  f   rf rf(%) cf  cf(%)
##       8.5 12 0.23 23.08 12  23.08
##       8.2  8 0.15 15.38 20  38.46
##       8.8  6 0.12 11.54 26  50.00
##         8  5 0.10  9.62 31  59.62
##       8.6  5 0.10  9.62 36  69.23
##       7.5  3 0.06  5.77 39  75.00
##       8.3  3 0.06  5.77 42  80.77
##       8.7  3 0.06  5.77 45  86.54
##         9  3 0.06  5.77 48  92.31
##       7.8  2 0.04  3.85 50  96.15
##       8.9  2 0.04  3.85 52 100.00
DF$estrato_b=as.factor(DF$estrato)
attach(DF)
## The following objects are masked from DF (pos = 3):
## 
##     beneficiario, cantidad, establecimiento, establecimiento_a,
##     estrato, estrato_a, fecha, sabor, satisfacción, satisfacción_a,
##     sexo, sexo_a, trescomidas, trescomidas_a
## The following objects are masked from DF (pos = 4):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, satisfacción_a, sexo, sexo_a, trescomidas,
##     trescomidas_a
## The following objects are masked from DF (pos = 5):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, satisfacción_a, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 6):
## 
##     beneficiario, cantidad, establecimiento, estrato, estrato_a, fecha,
##     sabor, satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 9):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, sexo_a, trescomidas
## The following objects are masked from DF (pos = 20):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
## The following objects are masked from SC (pos = 25):
## 
##     beneficiario, cantidad, establecimiento, estrato, fecha, sabor,
##     satisfacción, sexo, trescomidas
class(estrato_b)
## [1] "factor"
tabla6=fdt_cat(DF$estrato_b,sort = TRUE)
tabla6
##  Category  f   rf rf(%) cf  cf(%)
##         1 30 0.58 57.69 30  57.69
##         2 19 0.37 36.54 49  94.23
##         3  3 0.06  5.77 52 100.00
library(crosstable)
## 
## Attaching package: 'crosstable'
## The following object is masked from 'package:purrr':
## 
##     compact
library(flextable)
## 
## Attaching package: 'flextable'
## The following object is masked from 'package:purrr':
## 
##     compose
library(dplyr)
DF$establecimiento_b=as.numeric(DF$establecimiento)
crosstable(DF,c(establecimiento_b), by=estrato_b) %>%as_flextable(keep_id=TRUE)

.id

label

variable

estrato_b

1

2

3

establecimiento_b

establecimiento_b

Min / Max

7.5 / 9.0

7.5 / 9.0

8.0 / 8.8

Med [IQR]

8.5 [8.2;8.7]

8.5 [8.1;8.6]

8.5 [8.2;8.6]

Mean (std)

8.4 (0.4)

8.3 (0.4)

8.4 (0.4)

N (NA)

30 (0)

19 (0)

3 (0)

Se puede observar que para las personas en general el establecimiento se encuentra en muy buenas condiciones ya que todos los estratos promedian una calificación entre 8.3 y 8.4.

#cruce entre variable categórica (estrato) vs categórica (Satisfacción)

library(gmodels)
library(crosstable)
library(dplyr)
table(DF$estrato,DF$satisfacción)
##    
##     Insatisfecho Muy satisfecho Satisfecho
##   1            0              7         23
##   2            3              1         15
##   3            1              0          2

#Cruce entre variable categórica (estrato) vs categórica (Satisfacción)

library(gmodels)
library(crosstable)
library(dplyr)
table(DF$estrato,DF$satisfacción)
##    
##     Insatisfecho Muy satisfecho Satisfecho
##   1            0              7         23
##   2            3              1         15
##   3            1              0          2
tabla7=CrossTable(DF$estrato,DF$satisfacción,prop.chisq=FALSE,prop.r=TRUE,prop.c=FALSE,prop.t=FALSE)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## |           N / Row Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  52 
## 
##  
##              | DF$satisfacción 
##   DF$estrato |   Insatisfecho | Muy satisfecho |     Satisfecho |      Row Total | 
## -------------|----------------|----------------|----------------|----------------|
##            1 |              0 |              7 |             23 |             30 | 
##              |          0.000 |          0.233 |          0.767 |          0.577 | 
## -------------|----------------|----------------|----------------|----------------|
##            2 |              3 |              1 |             15 |             19 | 
##              |          0.158 |          0.053 |          0.789 |          0.365 | 
## -------------|----------------|----------------|----------------|----------------|
##            3 |              1 |              0 |              2 |              3 | 
##              |          0.333 |          0.000 |          0.667 |          0.058 | 
## -------------|----------------|----------------|----------------|----------------|
## Column Total |              4 |              8 |             40 |             52 | 
## -------------|----------------|----------------|----------------|----------------|
## 
## 

Gracias a este cruce de variables podemos ver que el estrato más insatisfecho es el 2.

##Cruce entre variable categórica (sexo) vs categórica (Satisfacción)

table(DF$sexo,DF$satisfacción)
##            
##             Insatisfecho Muy satisfecho Satisfecho
##   Femenino             3              4         16
##   Masculino            1              4         24
tabla8=CrossTable(DF$sexo,DF$satisfacción,prop.chisq=FALSE,prop.r=TRUE,prop.c=FALSE,prop.t=FALSE)
## 
##  
##    Cell Contents
## |-------------------------|
## |                       N |
## |           N / Row Total |
## |-------------------------|
## 
##  
## Total Observations in Table:  52 
## 
##  
##              | DF$satisfacción 
##      DF$sexo |   Insatisfecho | Muy satisfecho |     Satisfecho |      Row Total | 
## -------------|----------------|----------------|----------------|----------------|
##     Femenino |              3 |              4 |             16 |             23 | 
##              |          0.130 |          0.174 |          0.696 |          0.442 | 
## -------------|----------------|----------------|----------------|----------------|
##    Masculino |              1 |              4 |             24 |             29 | 
##              |          0.034 |          0.138 |          0.828 |          0.558 | 
## -------------|----------------|----------------|----------------|----------------|
## Column Total |              4 |              8 |             40 |             52 | 
## -------------|----------------|----------------|----------------|----------------|
## 
## 

Gracias a este cruce se pudo evidenciar que tanto número de hombres como de mujeres están de acuerdo con estar satisfechos con el servicio.

#Estudio Probabilistico

##pregunta 1

#¿Cuál es la probabilidad de que al seleccionar en un grupo de 7 personas a lo menos 1 persona se encuentre en el estrato 1 y que además se encuentre muy satisfecha con el servicio brindado?

lo primero que se hace es mirar en la tabla de estrato vs satisfacción

En la tabla se puede observar que 7 personas cumplen con la descripción de la pregunta, con esto ya se puede dar uso a la fórmula de probabilidad a través de combinación.

\(nCk=\displaystyle\frac{n!}{k!(n-k)!}\)

Se procede entonces a calcular la probabilidad de que el evento del enunciado suceda, esto haciendo uso de la fórmula de la combinación aplicándola a todas las posibles combinaciones obtenidas para esta pregunta puntual.

RTPP1=factorial(52)/((factorial(52-7))*(factorial(7)))
RTPP1
## [1] 133784560
RP1P1=(factorial(7)/((factorial(7-7))*(factorial(7))))/RTPP1
RP1P1
## [1] 7.474704e-09
RP2P1=((factorial(7)/((factorial(7-6))*(factorial(6))))*(factorial(45)/((factorial(45-1))*(factorial(1)))))/RTPP1
RP2P1
## [1] 2.354532e-06
RP3P1=((factorial(7)/((factorial(7-5))*(factorial(5))))*(factorial(45)/((factorial(45-2))*(factorial(2)))))/RTPP1
RP3P1
## [1] 0.0001553991
RP4P1=((factorial(7)/((factorial(7-4))*(factorial(4))))*(factorial(45)/((factorial(45-3))*(factorial(3)))))/RTPP1
RP4P1
## [1] 0.003712312
RP5P1=((factorial(7)/((factorial(7-3))*(factorial(3))))*(factorial(45)/((factorial(45-4))*(factorial(4)))))/RTPP1
RP5P1
## [1] 0.03897927
RP6P1=((factorial(7)/((factorial(7-2))*(factorial(2))))*(factorial(45)/((factorial(45-5))*(factorial(5)))))/RTPP1
RP6P1
## [1] 0.191778
RP7P1=((factorial(7)/((factorial(7-1))*(factorial(1))))*(factorial(45)/((factorial(45-6))*(factorial(6)))))/RTPP1
RP7P1
## [1] 0.4261734
ProbP1=RP1P1+RP2P1+RP3P1+RP4P1+RP5P1+RP6P1+RP7P1
ProbP1
## [1] 0.6608008

La probabilidad que se obtiene de que al seleccionar un grupo de 7 personas a lo menos 1 persona pertenezca al estrato 1 y se encuentre muy satisfecha con el servicio es de aproximadamente un 66%.

##Pregunta 2

##¿Cuál es la probabilidad de que al seleccionar un grupo de 4 personas hayan entre 1 y 3 personas que no tengan las tres comidas del servicio de comedores un servicio de comedores y que además hayan dado una puntuación 8 al establecimiento?.

RTPP2=factorial(52)/((factorial(52-4))*(factorial(4)))
RTPP2
## [1] 270725
RP1P2=((factorial(5)/((factorial(5-3))*(factorial(3))))*(factorial(47)/((factorial(47-1))*(factorial(1)))))/RTPP2
RP1P2
## [1] 0.001736079
RP2P2=((factorial(5)/((factorial(5-2))*(factorial(2))))*(factorial(47)/((factorial(47-2))*(factorial(2)))))/RTPP2
RP2P2
## [1] 0.03992982
RP3P2=((factorial(5)/((factorial(5-1))*(factorial(1))))*(factorial(47)/((factorial(47-3))*(factorial(3)))))/RTPP2
RP3P2
## [1] 0.2994736
ProbP2=RP1P2+RP2P2+RP3P2
ProbP2
## [1] 0.3411395

La probabilidad que se tiene de que al seleccionar un grupo de 4 personas a haya entre 1 y 3 personas que no tengan las tres comidas en el servicio de comedores y que hayan dado una puntuación de 8 al establecimiento es aproximadamente un 34%

#Preguntas propuestas

-¿Hay una diferencia significativa en la calificación promedio entre dos grupos de estudiantes con diferentes niveles de estrato?

-¿Cuál es la calificación promedio respecto al sabor de la comida de los estudiantes de la universidad que cuenten con el servicio de comedores con un nivel de confianza del 95%?

#CONCLUCIONES

-Por lo visto se pude concluir que el servicio de comedores tiene un buen recibimiento por parte de los estudiantes de la universidad industrial de Santander, como se pudo ver con la variable “satisfacción” donde se pudo observar que solo una pequeña parte no se encuentra satisfecha.

-Gracias al tipo de muestreo también se pudo mostrar que la mayor parte de beneficiarios de este beneficio son los hombres con un 57% en contra de las mujeres que cuentan con un 43%.

-Para finalizar gracias a la ayuda de los participantes se puede llegar a el desarrollo de estrategia para poder mejorar algunos aspectos del servicio como lo podría ser el sabor de la comida, entre otras cosas.

#BIBLIOGRAFIA

Comedores UIS:https://uis.edu.co/uis-comedores-es/

LAS EVIDENCIAS DE LAS ENTREVISTAS TOMADAS SE ENCUENTRAN AL FINAL DE LA PRESENTACION DE POWER PINT.