1 Los Objetivos De La Práctica

1.1 * El Objetivo General De La Práctica

A continuación se presenta el objetivo general de la práctica:

  • Diseñar, Crear E Implementar Eventos O Suceso Estadístico, A Partir De Un Espacio Muestral Generado De Manera Aleatoria, Simulando Estudiantes Inscritos Del ITD.

1.2 * Los Objetivos Específicos De La Práctica

A continuación, se presenta los objetivos específicos que tiene la siguiente práctica:

  • Crear Un Espacio Muestral Generado De Manera Aleatoria, Simulando Estudiantes Inscritos Del Itd, Mediante La Implementación De Una Función Que Se Encuentra Dentro De Un Servidor Web “Github.Com”

  • Cargar La Función Almacenado En Un Servidor Web, Dentro Del Programa En R, Para Realizar Las Operaciones Correspondientes

  • Describir Los Datos Estadísticos Del Espacio Muestral De Estudiantes Del Itd, Con La Ayuda De La Implementación Del Método Summary().

  • Crear Algunos Evento Estadísticos Relativos Al Espacio Muestral De Estudiantes Del ITD

2 * Investigaciones Pertinentes

2.1 * El Espacio Muestral

El espacio muestral está formado por todos los posibles resultados de un experimento aleatorio. Es decir, se compone de todos y cada uno de los sucesos elementales.

El espacio muestral es una parte del espacio probabilístico. Como su propio nombre indica, está formado por los elementos de la muestra. Al contrario, el espacio probabilístico engloba todos los elementos. Incluso aunque no salgan recogidos en la muestra.

Al realizar diseños experimentales, estudios observacionales y estudios retrospectivos, el resultado final es un conjunto de datos que, por supuesto, está sujeto a la incertidumbre.

Tambien Es posible, confundir espacio muestral y espacio probabilístico es algo habitual. Suele creerse que son sinónimos. Sin embargo, no es así. El espacio probabilístico es un concepto mucho más amplio y está formado, además de otros conceptos, por el espacio muestral.

En otras palabras, el espacio muestral es una parte del espacio probabilístico.

2.1.1 * Las Características Principales De Un Espacio Muestral

El espacio muestral se define como aquel conjuto de posibles resultados obtendos de un experimento aleatorio, a su vez, las pricipales características, son las siguientes:

  • Está Formado Por Todos Los Posibles Resultados De Un Experimento Aleatorio.

  • Es Considerado Es Una Parte Del Espacio Probabilístico.

  • Puede Constar De Un Número Finito De Elementos.

2.1.2 * La Clasificación De Los Espacios Muestrales

Dependiendo de como sea este conjunto de posible resultados, los espacios muestrales pueden ser:

  • Espacio muestral discreto finito. Consta de un número finito de elementos, por ejemplo lanzar un dado.

  • Espacio muestral discreto infinito. Consta de un número infinito numerable de elementos, por ejemplo lanzar un dado hasta que salga un cinco.

  • Espacio muestral continuo. Consta de un número infinito no numerable de elementos, por ejemplo todas las medidas posibles de espárragos extraidos aleatoriamente de una población.

2.1.3 * Algunos Ejemplos Sobre El Espacio Muestral

La imagen siguiente identifica que el resultado de un experimento es el espacio muestral a partir de ahí se puede construir eventos que se utilizan para calcular probabilidades.

Por consiguiente, el espacio muestral \(S\), es el conjunto de los resultados posibles o eventos.

2.1.3.1 * El Ejemplo De La Moneda

Cuando se lanza una moneda al aire, se puede escribir como:

\[ S = \text{{'aguila', 'sello'}} \]

2.1.3.2 * El Ejemplo Del Dado

Si se construye todo el espacio muestral de tirar un solo dado y conocer las posibles resultados de los puntos que se ven cara arriba del dado, sería que un dado puede caer 1, 2, 3, 4, 5 o 6 entonces. Los valores del 1 al 6 son los puntos muestrales de \(S\).

\[ S = {1, 2, 3, 4, 5, 6} \]

Los espacios muestrales con un número grande o infinito de puntos muestrales se describen mejor mediante un enunciado o método de la regla.

2.1.3.3 * El Ejemplo De Las Ciudades

Por ejemplo, si el conjunto de resultados posibles de un experimento fuera el conjunto de ciudades en el mundo con una población de más de un millón de habitantes, nuestro espacio muestral se escribiría como:

\[ S = \text{x | x ciudades con población de mas de un millón de habitantes} \]

Se lee:

\(S\) es el conjunto de todas las x’s, tales que x es una ciudad con una población de más de un millón de habitantes.

Ahora bien, el concepto de eventos tiene que ver con un conjunto de puntos muestrales. Evento es un subconjunto de todo el espacio muestral.

De tal forma que en el caso del experimento de tirar un dado, el espacio muestral. Puede tener tal vez tres eventos en los que le interese al investigador:

  • E2, los números impares, es decir los nones o que no son pares.

Entonces, se pueden identificar ciertos eventos del espacio muestral.

  • E1: Los alumnos con promedio mayor a 85

  • E2: Los alumnos del género femenino

  • E3: Los alumnos de la carrera de sistemas o de otra carrera;

  • E4: Los alumnos con peso igual o superior a 80 kgs

Los eventos E1, E2, E3, E4 y cualquier otro evento siendo subconjuntos de todo el espacio muestral contienen puntos muestrales o elementos, que sirven para concluir con algunas ideas, además, estos eventos pueden combinarse unos con otros de tal forma que pueden conformar otros eventos o conjuntos y enriquecer aún más las ideas concluyentes.

3 * Desarrollo Metodológico De La Práctica

3.1 * La Función which()

Antes de ver algunos ejemplos se recomienda entender la función which() que se utiliza para determinar posiciones de un vector bajo una expresión de comparación. Luego esas posiciones sirven para acceder a los elementos de un vector.

Se presenta un ejercicio para probar la función which().

La función which() devuelve la posición o índice (index) de un elemento dentro de un vector, ejemplo, se tienen 12 números:

1 2 3 4 5 6 7 8 9 10 11 12
30 40 50 60 20 10 40 20 50 40 60 50

Sólo las posiciones 1, 5, 6 y 8 tienen valores por debajo de 40 que equivalen a 30, 20, 10 y 20 respectivamente.

Con la función which() se encuentran las posiciones de ese vector y luego haciendo uso de [posiciones] se encuentran los valores que están por debajo de 40.

numeros <- c(30,40,50,60,20,10,40,20,50,40,60,50)
numeros
##  [1] 30 40 50 60 20 10 40 20 50 40 60 50
n <- length(numeros)

3.2 * Las Posiciones Y Los Valores Con which()

posiciones <- which(numeros < 40)
paste("Las Posiciones Ó Índices (index) Son: ", posiciones)
## [1] "Las Posiciones Ó Índices (index) Son:  1"
## [2] "Las Posiciones Ó Índices (index) Son:  5"
## [3] "Las Posiciones Ó Índices (index) Son:  6"
## [4] "Las Posiciones Ó Índices (index) Son:  8"
paste("Los Numeros En las Posiciones Correspondientes Son: ", numeros[posiciones])
## [1] "Los Numeros En las Posiciones Correspondientes Son:  30"
## [2] "Los Numeros En las Posiciones Correspondientes Son:  20"
## [3] "Los Numeros En las Posiciones Correspondientes Son:  10"
## [4] "Los Numeros En las Posiciones Correspondientes Son:  20"

3.3 * Los Espacios Muestrales

Se construye espacios muestrales y alguno eventos respectivos de experimentos de lanzar un dado y de contar alumnos inscritos en una institución de educación superior.

3.3.1 * El Espacio Muestral De Los Dados

El espacio muestral de tirar un dado y sus seis posibles valores que pueda caer.

S <- c(1,2,3,4,5,6)
S
## [1] 1 2 3 4 5 6

3.3.1.1 * El Evento De Los Números Pares

Regresando al caso del dado. Con esa misma función which() se construyen los eventos para el caso de un solo dado.

El operador %in% evalúa si los valores de S están en el vector c(2,4,5). Con la función paste() se muestra el mensaje.

pares <- S[which(S %in% c(2, 4, 6))]
pares
## [1] 2 4 6
paste("Los números pares ")
## [1] "Los números pares "
paste(pares)
## [1] "2" "4" "6"
paste("Existen ", length(pares), " puntos muestrales del total de ", length(S) , " que tiene S")
## [1] "Existen  3  puntos muestrales del total de  6  que tiene S"

3.3.1.2 * El Evento De Los Números Nones

El operador %in% evalúa si los valores de S están en el vector c(1,3,5). Con la función paste() se muestra el mensaje.

nones <- S[which(S %in% c(1, 3, 5))]
paste("Los Números Impares ")
## [1] "Los Números Impares "
paste(nones)
## [1] "1" "3" "5"
paste("Existen ", length(nones), " Puntos Muestrales Del Total De ", length(S) , " Que Tiene S")
## [1] "Existen  3  Puntos Muestrales Del Total De  6  Que Tiene S"

3.3.1.3 * El Evento De Los Números Menores A 4

El operador < evalúa si los valores de S están por debajo de cuatro.

menor.cuatro <- S[which(S < 4)]
menor.cuatro
## [1] 1 2 3
paste(menor.cuatro)
## [1] "1" "2" "3"
paste("Existen ", length(menor.cuatro), " Puntos Muestrales Del Total De ", length(S) , " Que Tiene S")
## [1] "Existen  3  Puntos Muestrales Del Total De  6  Que Tiene S"

3.3.2 * El Espacio Muestral De Los Estudiantes ITD

Crear espacio muestral estudiantes

\[ S = estudiantes = \text{{x | x son estudiantes inscritos en una institución educativa de nivel superior}} \]

3.3.2.1 * Cargar La Función

Se carga la función que se encuentra en github.com

source("https://raw.githubusercontent.com/rpizarrog/Probabilidad-y-EstadIstica-VIRTUAL-DISTANCIA/main/funciones/funcion%20crea%20alumnos.r") 

3.3.2.2 * Crear El data.frame De Estudiantes

Se crea un conjunto de datos en un data.frame llamado estudiantes.

estudiantes <- genAlumnos(10000, 1186)
3.3.2.2.1
           \*        Factorizar Estudiantes

Factorizar significa categorizar variables que son de tipo character o textos y se puede utilizar para identificar frecuencias con datos character y/o tipo factor con la función summary().

Utilizar la función as.factor() para factorizar o categorizar en estadística y en el ámbito de ciencia de los datos significa limpiar datos, transformar datos y preparar datos para realizar análisis posteriores.

estudiantes$matricula <- as.factor(estudiantes$matricula)
estudiantes$carrera <- as.factor(estudiantes$carrera)
estudiantes$genero <- as.factor(estudiantes$genero)

3.3.2.3 * Mostrar Los 10 Registros Iiniciales

head(estudiantes, 10)
##    matricula        carrera genero promedio edad  peso altura
## 1          1    ELECTRONICA      F    81.96   20 61.33 161.33
## 2          2       SISTEMAS      F    91.21   23 60.12 160.12
## 3          3      ELECTRICA      M    81.19   20 77.91 177.91
## 4          4 ADMINISTRACION      M    82.55   20 84.24 184.24
## 5          5       MECANICA      F    86.92   21 59.04 159.04
## 6          6    ELECTRONICA      M    88.91   22 77.59 177.59
## 7          7     BIOQUIMICA      F    85.20   21 59.71 159.71
## 8          8            TIC      M    86.73   21 86.60 186.60
## 9          9    INFORMATICA      F    84.93   21 60.89 160.89
## 10        10    INFORMATICA      F    86.05   21 60.04 160.04

3.3.2.4 * Mostrar Los 10 Registros Finales

tail(estudiantes, 10)
##       matricula        carrera genero promedio edad  peso altura
## 9991       9991    ELECTRONICA      M    90.42   22 77.23 177.23
## 9992       9992 ADMINISTRACION      F    89.33   22 63.23 163.23
## 9993       9993     INDUSTRIAL      F    84.69   21 62.87 162.87
## 9994       9994       SISTEMAS      F    88.24   22 58.73 158.73
## 9995       9995          CIVIL      F    81.01   20 59.85 159.85
## 9996       9996   ARQUITECTURA      F    86.64   21 57.68 157.68
## 9997       9997          CIVIL      F    91.74   23 60.26 160.26
## 9998       9998       MECANICA      F    87.47   21 56.34 156.34
## 9999       9999     BIOQUIMICA      M    82.81   20 84.99 184.99
## 10000     10000            TIC      M    85.45   21 82.09 182.09

3.3.2.5 * La Estructura De Los Datos

str() muestra la estructura de los datos.

str(estudiantes)
## 'data.frame':    10000 obs. of  7 variables:
##  $ matricula: Factor w/ 10000 levels "1","2","3","4",..: 1 2 3 4 5 6 7 8 9 10 ...
##  $ carrera  : Factor w/ 13 levels "ADMINISTRACION",..: 6 12 5 1 9 6 3 13 8 8 ...
##  $ genero   : Factor w/ 2 levels "F","M": 1 1 2 2 1 2 1 2 1 1 ...
##  $ promedio : num  82 91.2 81.2 82.5 86.9 ...
##  $ edad     : num  20 23 20 20 21 22 21 21 21 21 ...
##  $ peso     : num  61.3 60.1 77.9 84.2 59 ...
##  $ altura   : num  161 160 178 184 159 ...

3.3.2.6 * Descripción De Los Datos

La función summary() identifica los principales estadísticos descriptivos de los datos.

summary(estudiantes)
##    matricula            carrera     genero      promedio           edad      
##  1      :   1   INDUSTRIAL  : 835   F:4974   Min.   : 71.95   Min.   :17.00  
##  2      :   1   TIC         : 822   M:5026   1st Qu.: 83.67   1st Qu.:20.00  
##  3      :   1   ELECTRICA   : 800            Median : 86.03   Median :21.00  
##  4      :   1   MECATRONICA : 774            Mean   : 86.03   Mean   :21.01  
##  5      :   1   CIVIL       : 769            3rd Qu.: 88.38   3rd Qu.:22.00  
##  6      :   1   ARQUITECTURA: 768            Max.   :100.81   Max.   :25.00  
##  (Other):9994   (Other)     :5232                                            
##       peso           altura     
##  Min.   :51.94   Min.   :151.9  
##  1st Qu.:60.05   1st Qu.:160.1  
##  Median :71.61   Median :171.6  
##  Mean   :70.09   Mean   :170.1  
##  3rd Qu.:80.10   3rd Qu.:180.1  
##  Max.   :89.72   Max.   :189.7  
## 

3.3.3 Eventos de alumnos

Se crean los eventos de alumnos

3.3.3.1 Alumnos de una carrera ‘SISTEMAS’

Con la función subset() se filtran o selecconan registros con una condición dada.

Con la función nrow() se determinan la cantidad de registros de sistemas. nrow() actúa sobre un data.frame y lenght() sobre un vector.

sistemas <- subset(estudiantes, carrera == 'SISTEMAS')
nrow(sistemas)
## [1] 743
summary(sistemas)
##    matricula             carrera    genero     promedio          edad      
##  2      :  1   SISTEMAS      :743   F:378   Min.   :75.75   Min.   :18.00  
##  46     :  1   ADMINISTRACION:  0   M:365   1st Qu.:84.03   1st Qu.:20.00  
##  53     :  1   ARQUITECTURA  :  0           Median :86.28   Median :21.00  
##  55     :  1   BIOQUIMICA    :  0           Mean   :86.14   Mean   :21.05  
##  63     :  1   CIVIL         :  0           3rd Qu.:88.44   3rd Qu.:22.00  
##  82     :  1   ELECTRICA     :  0           Max.   :95.86   Max.   :24.00  
##  (Other):737   (Other)       :  0                                          
##       peso           altura     
##  Min.   :54.42   Min.   :154.4  
##  1st Qu.:60.06   1st Qu.:160.1  
##  Median :64.72   Median :164.7  
##  Mean   :69.99   Mean   :170.0  
##  3rd Qu.:80.33   3rd Qu.:180.3  
##  Max.   :89.11   Max.   :189.1  
## 

3.3.3.2 El Evento Femeninos

femeninos <- subset(estudiantes, genero == 'F')
summary(femeninos)
##    matricula           carrera     genero      promedio           edad   
##  1      :   1   TIC        : 424   F:4974   Min.   : 71.95   Min.   :17  
##  2      :   1   INDUSTRIAL : 415   M:   0   1st Qu.: 83.64   1st Qu.:20  
##  5      :   1   MECATRONICA: 398            Median : 86.01   Median :21  
##  7      :   1   MECANICA   : 386            Mean   : 86.03   Mean   :21  
##  9      :   1   ELECTRICA  : 384            3rd Qu.: 88.35   3rd Qu.:22  
##  10     :   1   QUIMICA    : 384            Max.   :100.32   Max.   :25  
##  (Other):4968   (Other)    :2583                                         
##       peso           altura     
##  Min.   :51.94   Min.   :151.9  
##  1st Qu.:58.47   1st Qu.:158.5  
##  Median :60.04   Median :160.0  
##  Mean   :60.02   Mean   :160.0  
##  3rd Qu.:61.53   3rd Qu.:161.5  
##  Max.   :69.56   Max.   :169.6  
## 

3.3.3.3 El Evento Masculinos

masculinos <- subset(estudiantes, genero == 'M')
summary(masculinos)
##    matricula              carrera     genero      promedio           edad      
##  3      :   1   INDUSTRIAL    : 420   F:   0   Min.   : 73.51   Min.   :17.00  
##  4      :   1   ELECTRICA     : 416   M:5026   1st Qu.: 83.71   1st Qu.:20.00  
##  6      :   1   CIVIL         : 412            Median : 86.06   Median :21.00  
##  8      :   1   TIC           : 398            Mean   : 86.04   Mean   :21.01  
##  12     :   1   ARQUITECTURA  : 395            3rd Qu.: 88.42   3rd Qu.:22.00  
##  13     :   1   ADMINISTRACION: 386            Max.   :100.81   Max.   :25.00  
##  (Other):5020   (Other)       :2599                                            
##       peso           altura     
##  Min.   :68.39   Min.   :168.4  
##  1st Qu.:77.88   1st Qu.:177.9  
##  Median :80.08   Median :180.1  
##  Mean   :80.05   Mean   :180.0  
##  3rd Qu.:82.23   3rd Qu.:182.2  
##  Max.   :89.72   Max.   :189.7  
## 

4 * Análisis Crítico De Los Datos Obtenidos

4.1 * Interpretación De La Práctica

Se simulan dos experimentos: el primero es tirar un dado y se identifica su espacio muestral y el segundo es los estudiantes que son espacio muestral de alumnos inscritos.

Se construyeron espacios muestrales de dados siendo 6 los puntos muestrales del dado y 5000 de alumnos

A partir de los espacios muestrales se construyeron eventos

El espacio muestral del dado su estructura es un vector y el espacio muestral de alumnos la estructura es un data.frame.

  • ¿Cuántos alumnos son del género Femenino y en qué porcentaje %?. Salieron F:4974 y representa 49.74%.

  • ¿Cuántos alumnos son del género Masculino y en qué porcentaje %? 5026 y representa el 50.26%

  • ¿Cuántos alumnos tiene promedio mayor que 92 y en qué porcentaje %? 412 y representa el 4.12%

  • ¿Cuántos alumnos son de la carrera de SISTEMAS y en qué porcentaje?, Son SISTEMAS :743 y represena el 7.43%

  • ¿Hay más alumnos de SISTEMAS o de CIVIL? Hay mas de sistemas 743 con respecto a los de civil que son 769

  • ¿Cuántos alumnos están por encima del 180 cms? 2553 alumnos miden mas de 180 cms. y representan el 25.53%

5 * Referencias Bibliográficas

  • Anderson, D. R. (2008). Estadística para administración y economía. (10ª. ed.) México : Cengage Learning.

  • Berenson, M. (2006). Estadística para administración. (4ª. ed.) México : Pearson Educación.

  • Carot, V. (2006). Control estadístico de la calidad. España: Alfaomega.

  • Devore, J. L. (2012) Probabilidad y estadística para ingenierías y ciencia. (8ª. ed.) México : Cengage Learning.

  • Gamiz, B. E. (2012). Probabilidad y estadística con prácticas en Excel. (3ª. ed). México : JIT Press.

  • Gutiérrez, P. H. (2012). Análisis y diseño de experimentos. (3ª. ed.) México : McGraw-Hill 7. Gutiérrez, P. H. (2009). Control estadístico de calidad y seis sigma. (2ª. ed) México : McGrawHill