Introducción

El proyecto tiene como objetivo, analizar un archivo con una cantidad de datos referentes a un sistema de metro. Debemos realizar un estudio estadistico de cada columna de datos por separado. Además se busca determinar ciertos parametros de variables aleatorias con nombre propio, que podrian asemejarse a los graficos obtenidos con los datos de cada columna.

Columna: Origen

Se puede observar en el grafico que los valores de esta columna son discretos y pertenecen al conjunto {1,2,3} por lo tanto estamos en presencia de una variable aleatoria discreta que sigue un modelo de Laplace. El valor de esta columna es referente al punto de origen del pasajero dentro del sistema de metro planteado.

plot of chunk unnamed-chunk-1

Columna: Origen

En conclusión la probabilidad de que un individuo ingrese al sistema de metro en la estación 1 es A, en la estación 2 es B y en la estación 3 es C

A = (length(Origen[Origen==1]))/10000 = CantidaDePasajerosE1/NumTotalDePasajeros = 0.1997 B = (length(Origen[Origen==2]))/10000 = CantidaDePasajerosE2/NumTotalDePasajeros = 0.3536 C = (length(Origen[Origen==3]))/10000 = CantidaDePasajerosE3/NumTotalDePasajeros = 0.4467

Columna: Destino

En el histograma de frecuencia se puede observar, que como la columna anterior, esta también presenta un comportamiento similar. El valor de esta columna indica el destino de cada pasajero en el sistema de metro. plot of chunk unnamed-chunk-2

Columna: Destino

En conclusión, que un pasajero se dirija a la estación 1 es A, a la estación 2 es B y a la estación 3 es C

A = (length(Destino[Destino==1]))/10000 = CantidaDePasajeroDirigidosE1/NumTotalDePasajeros = 0.6046 B = (length(Destino[Destino==2]))/10000 = CantidaDePasajerosDirigidosE2/NumTotalDePasajeros = 0.1732 C = (length(Destino[Destino==3]))/10000 = CantidaDePasajerosDirigidosE3/NumTotalDePasajeros = 0.2222

Columna: TTicket

Cada valor de esta columna denota el tiempo que le tomo a un individuo comprar un ticket, de no haber tenido al entrar. Al ser una variable que se expresa en valores que pertenecen al conjunto de los reales. Los datos de esta columna los dividiriemos por el origen de cada pasajero, ya que es diferente comprar un ticket en la estación 1 a comprar un ticket en la estación 2 o 3.

Columna: TTicket con Origen en la estación 1

plot of chunk unnamed-chunk-3

Columna: TTicket con Origen en la estación 1

plot of chunk unnamed-chunk-4

Columna: TTicket con Origen en la estación 1

plot of chunk unnamed-chunk-5

Columna: TTicket, conclusión

Al observar los histogramás de frecuencia, nos damos cuenta que su forma se asemeja una variable aleatoria con distribución normal

TTicket con Origen en la estación 1

plot of chunk unnamed-chunk-6 X~Normal(29.15776, 12.0238)

TTicket con Origen en la estación 2

plot of chunk unnamed-chunk-7 X2~Normal(59.53509,12.60041)

TTicket con Origen en la estación 3

plot of chunk unnamed-chunk-8 X3~Normal(19.59034,5.554883)

Columna: TEscaleraAnden

Los valores de esta columna representan el tiempo que toma un individuo en tomar las escaleras hasta el anden. Esta columna, como la anterior, sus valores pertenecen al conjunto de los numero reales ya que expresan tiempo. Esta columna también la estudiaremos por partes, ya que el trayecto en las estaciónes son diferentes en cada una de ellas.

TEscaleraAnden con Origen 1

plot of chunk unnamed-chunk-9

TEscaleraAnden con Origen 2

plot of chunk unnamed-chunk-10

TEscaleraAnden con Origen 3

plot of chunk unnamed-chunk-11

Columna: TEscaleraAnden, conclusión

Al observar los histogramás de frecuencia, nos damos cuenta que su forma se asemeja una variable aleatoria con distribución exponencial

TEscaleraAnden con Origen en la estación 1

plot of chunk unnamed-chunk-12 X~Exp(0.03461824)

TEscaleraAnden con Origen en la estación 2

plot of chunk unnamed-chunk-13 X2~Exp(0.01997437)

TEscaleraAnden con Origen en la estación 3

plot of chunk unnamed-chunk-14 X3~Exp(0.01773452)

Columna: TAndenEscalera

Los valores de esta columna definen el tiempo que toma un individuo en ir desde el anden hasta subir las escaleras. Sus valores pertenecen al conjunto de los numeros reales. Dividiremos los tiempos por estación, ya que como sabemos los trayectos difieren entre una y otra estación.

TAndenEscalera con Destino 1

plot of chunk unnamed-chunk-15

TAndenEscalera con Destino 2

plot of chunk unnamed-chunk-16

TAndenEscalera con Destino 3

plot of chunk unnamed-chunk-17

Columna: TAndenEscalera, conclusión

Al observar los histogramás de frecuencia, nos damos cuenta que su forma se asemeja una variable aleatoria con distribución exponencial

TAndenEscalera con Destino en la estación 1

plot of chunk unnamed-chunk-18 X~Exp(0.03357792)

TAndenEscalera con Origen en la estación 2

plot of chunk unnamed-chunk-19 X2~Exp(0.01971118)

TAndenEscalera con Origen en la estación 3

plot of chunk unnamed-chunk-20 X3~Exp(0.01803542)

Columna:TT12

Los valores de esta columna denotan el tiempo que le toma a un individuo en el tren desde la estación 1 a la estación 2 Los valores de esta columna pertenecen al conjunto de los numeros reales

TT12<-Datos$TT12
TT12=TT12[!TT12==0]
mean(TT12)
## [1] 69.96
sd(TT12)
## [1] 5.027
hist(TT12)

plot of chunk unnamed-chunk-21

Al observar el histograma de frecuencia se puede apreciar que tiene forma de campana, similar a la distribución normal. X~Normal(69.96,5.027)

Columna:TT23

Los valores de esta columna denotan el tiempo que le toma a un individuo en el tren desde la estación 2 a la estación 3 Los valores de esta columna pertenecen al conjunto de los numeros reales

TT23<-Datos$TT23[Origen==2]
TT23=TT23[!TT23==0]
1/mean(TT23)
## [1] 0.02224
var(TT23)
## [1] 8.239
hist(TT23)

plot of chunk unnamed-chunk-22

Al observar el histograma de frecuencia se puede apreciar que los valores varian muy poco. X~Exp(0.02224)

Columna:TT32

Los valores de esta columna denotan el tiempo que le toma a un individuo en el tren desde la estación 3 a la estación 2 Los valores de esta columna pertenecen al conjunto de los numeros reales

TT32<-Datos$TT32
TT32=TT32[!TT32==0]
1/mean(TT32)
## [1] 0.02216
var(TT32)
## [1] 8.174
hist(TT32)

plot of chunk unnamed-chunk-23

Al observar el histograma de frecuencia se puede apreciar que los valores varian poco. X~Exponencial(0.02216)

Columna:TT21

Los valores de esta columna denotan el tiempo que le toma a un individuo en el tren desde la estación 2 a la estación 1 Los valores de esta columna pertenecen al conjunto de los numeros reales

TT21<-Datos$TT21
TT21=TT21[!TT21==0]
mean(TT21)
## [1] 69.81
sd(TT21)
## [1] 4.961
hist(TT21)

plot of chunk unnamed-chunk-24

Al observar el histograma de frecuencia se puede apreciar que tiene forma de campana, similar a la distribución normal. X~Normal(69.81,4.961)

Columna:TTotalTren

Los valores de esta columna indican el tiempo total del usuario dentro del tren. Sus valores pertenecen al conjunto de los numeros reales. Esta columna la dividiremos en 6 partes, ya que el tiempo que existen 6 posibles escenarios.

TTotalTren con Origen 1 y Destino 2 o 3

TTotalTren12<-Datos$TTotalTren[Origen==1 & Destino==2]
hist(TTotalTren12)

plot of chunk unnamed-chunk-25

mean(TTotalTren12)
## [1] 70.1
sd(TTotalTren12)
## [1] 4.899

Al observar el histograma nos damos cuenta que una posible variable aletoria seria X~Normal(70.1, 4.899)

TTotalTren13<-Datos$TTotalTren[Origen==1 & Destino==3]
hist(TTotalTren13)

plot of chunk unnamed-chunk-26

mean(TTotalTren13)
## [1] 114.8
sd(TTotalTren13)
## [1] 5.898

Al observar el histograma nos damos cuenta que una posible variable aletoria seria X~Normal(114.8, 5.898)

TTotalTren con Origen 2 y Destino 3 o 1

TTotalTren23<-Datos$TTotalTren[Origen==2 & Destino==3]
hist(TTotalTren23)

plot of chunk unnamed-chunk-27

mean(TTotalTren23)
## [1] 44.96
sd(TTotalTren23)
## [1] 2.87
rate=1/mean(TTotalTren23)
rate
## [1] 0.02224

Al observar el histograma nos damos cuenta que una los valores entre los individuos no varia casi entre ellos X~Exp(0.2224)

TTotalTren21<-Datos$TTotalTren[Origen==2 & Destino==1]
hist(TTotalTren21)

plot of chunk unnamed-chunk-28

mean(TTotalTren21)
## [1] 69.88
sd(TTotalTren21)
## [1] 4.974

Al observar el histograma nos damos cuenta que una posible variable aletoria seria X~Normal(70.1, 4.899)

TTotalTren con Origen 3 y Destino 2 o 1

TTotalTren32<-Datos$TTotalTren[Origen==3 & Destino==2]
hist(TTotalTren32)

plot of chunk unnamed-chunk-29

mean(TTotalTren32)
## [1] 45.13
sd(TTotalTren32)
## [1] 2.849
rate=1/mean(TTotalTren32)
rate
## [1] 0.02216

Al observar el histograma nos damos cuenta que los valores se mantienen casi iguales entre todos X~Exp(0.02216)

TTotalTren31<-Datos$TTotalTren[Origen==3 & Destino==1]
hist(TTotalTren31)

plot of chunk unnamed-chunk-30

mean(TTotalTren31)
## [1] 114.9
sd(TTotalTren31)
## [1] 5.709

Al observar el histograma nos damos cuenta que una posible variable aletoria seria X~Normal(114.9, 5.709)

Conclusión general

A través de las gráficas y las operaciones pertinentes aplicadas a los datos referentes al sistema del metro concluimos:

-Existe una mayor cantidad de individuos ingresando al sistema en la estación 3, también se puede apreciar que en la estación 2 hay un ingreso de individuos significante pero en menor medida que la estación 3, la estación 1 es la estación con menos individuos ingresando al sistema.

-La estación 1 es el destino más comun entre los individuos, le sigue la estación 3 y por último la 2.

-La media del tiempo que tardan los individuos en comprar un ticket, en la estación 3 es menor que en la estación 2 y 1

-El tiempo de la escalera al anden en la estación 2 que toman los individuos (TEsclaeraAnden) tiene una media menor en la estación 1 y la mayor se da en la estación 3, sin embargo la media de la estación 2, es cercana a la media de la estación 3.

-El tiempo del anden a la escalera que les toma a los individuos del sistema de metro (TAndenEscalera) tiene una media menor la estación 1 (un valor cercano al TEscaleraAnden de la estación 1), y la mayor media se ve en la estación 2, la media de la estación 2 y 3, en este caso también es cercana.

-Los Tiempos de tren (TTXY, X,Y pertencen a {1,2,3} con X diferente de Y) son parecidos en TT32 y TT23, TT12 y TT21 también se parecen mucho y tienen un valor medio bastante cercano al igual que la desviación estandar.

-En los tiempos totales claramente se puede observar que el recorrido con mayor media es desde la estación 3 hasta la estación 1.