Taller-1_punto-7.knit

Para cada una de las muestras que aparecen en la tabla del Anexo:

7.1 Realizar las pruebas de aleatoriedad, tendencia e independencia

#lectura de datos 
setwd("C:/COPIA DE SEGURIDAD 2023/MAESTRÌA/PROCESOS ESTOCÀSTICOS/")

ruta_dir1 <- ("C:/COPIA DE SEGURIDAD 2023/MAESTRIA/PROCESOS ESTOCÀSTICOS/DATOS_TALLER 1_R.xlsx")
TABLA_ORIGEN<- read_excel("DATOS_TALLER 1_R.xlsx")

Prueba de aleatoriedad t(años)

#Prueba de Aleatoriedad t


library(stats) 

Aleatoriedad_t <- runs.test(TABLA_ORIGEN$`t [anos]`)

print(Aleatoriedad_t)

## 
##  Runs Test
## 
## data:  TABLA_ORIGEN$`t [anos]`
## statistic = -7.2826, runs = 2, n1 = 28, n2 = 28, n = 56, p-value =
## 3.275e-13
## alternative hypothesis: nonrandomness

#Prubea de aleatoriedad paso a paso_t

n <- length(TABLA_ORIGEN$`t [anos]`)
med_t <- median(TABLA_ORIGEN$`t [anos]`)
med_t

## [1] 9.323

Media_t <- mean(TABLA_ORIGEN$`t [anos]`)
Media_t

## [1] 9.487061

Desviación_t <- sd(TABLA_ORIGEN$`t [anos]`)
Desviación_t

## [1] 5.724939

C.V <- (Desviación_t/Media_t)*100
C.V

## [1] 60.34471

#Contar el número de transiciones en la variable t(años)
###############################################################################

#Se hallan los valores por encima y por debajo de la mediana 

n1 <- length(TABLA_ORIGEN$`t [anos]` [TABLA_ORIGEN$`t [anos]`<med_t])
n2 <- length(TABLA_ORIGEN$`t [anos]`[TABLA_ORIGEN$`t [anos]`>med_t])

# Inicializar variables
 
r1 <- 1
r2 <- 1
transiciones<- 1  # Iniciar con una transición 

# Iterar sobre los datos para contar transiciones

for (i in 2:n) {
  if (TABLA_ORIGEN$`t [anos]`[i] < med_t && TABLA_ORIGEN$`t [anos]`[i - 1] > med_t) {
    r1 <- r1 + 1
    transiciones <- transiciones+ 1
  } else if (TABLA_ORIGEN$`t [anos]`[i] > med_t && TABLA_ORIGEN$`t [anos]`[i - 1] < med_t) {
    r2 <- r2 + 1
    transiciones <- transiciones + 1
  }
}

# Asegurar que el último valor no cause una racha adicional

if (TABLA_ORIGEN$`t [anos]`[n] == med_t) {
  transiciones <- transiciones - 1
}
 transiciones <- r1 + r2
 
# Mostrar el número de transiciones
transiciones

## [1] 2

#####################################################################

#Hallamos Miu u 

Miu_u<- (2*n1*n2)/(n1+n2)+1
#Miu_u <- ((2*(n1*n2))/n)+1
Miu_u

## [1] 29

Sigma_u <- (((2*n1*n2*(2*n1*n2-n1-n2))/(((n1+n2)^2)*(n1+n2-1)))^(1/2))
#Sigma_u <- (((2*n1*n2)*(2*n1*n2 -n))/((n^2)*(n-1)))^(1/2)
Sigma_u

## [1] 3.707486

Zu <- (transiciones - Miu_u)/ Sigma_u
Zu

## [1] -7.282562

# Nivel de confianza (1 - alpha= 5%)

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_z <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico z
print(valor_crítico_z)

## [1] 1.959964

#Comparación de Zu con Valor crítico 

resultado <- ifelse((Zu > valor_crítico_z * (-1)) && (Zu < valor_crítico_z),
                    "Con el 95% de certeza, los datos son aleatorios",
                    "Los datos no son aleatorios")
print(resultado)

## [1] "Los datos no son aleatorios"

ANÁLISIS Y CONCLUSIONES: Variable Tiempo [años]: Dado que el valor p (3.275e-13) es extremadamente pequeño, mucho más pequeño que cualquier nivel de significancia común (como 0.01 o 0.05), se tiene evidencia sólida para rechazar la hipótesis nula de aleatoriedad. Esto significa que los datos no son aleatorios y que hay algún patrón o tendencia sistemática en los datos.

La prueba de runs analiza la secuencia de subidas y bajadas en los datos para determinar si se desvían significativamente de lo que se esperaría en una secuencia aleatoria. Dado que el valor p es muy pequeño, podemos concluir que hay evidencia suficiente para afirmar que los datos no son aleatorios.

En resumen, los resultados indican que hay un patrón significativo en los datos y que la hipótesis de aleatoriedad puede ser rechazada a favor de la hipótesis de no aleatoriedad.

Prueba de tendencia t(años)

##Prueba de tendencia Mann-Kendall para tiempo t años


mk <- mk.test(TABLA_ORIGEN$`t [anos]`)
print(mk)

## 
##  Mann-Kendall trend test
## 
## data:  TABLA_ORIGEN$`t [anos]`
## z = 10.98, n = 57, p-value < 2.2e-16
## alternative hypothesis: true S is not equal to 0
## sample estimates:
##        S     varS      tau 
##  1596.00 21102.67     1.00

Zs =10.98

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_zs <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico Z
print(valor_crítico_zs)

## [1] 1.959964

#Comparación de Z con Valor crítico 

resultado <- ifelse((Zs > valor_crítico_zs * (-1)) && (Zs < valor_crítico_zs),
                    "Con el 95% de certeza, los datos no tienen tendencia",
                    "Los datos tienen tendencia")
x <- print(resultado)

## [1] "Los datos tienen tendencia"

# Comparación de Zs para reconocer tendencia positiva o negativa de los datos
tendencia <- if (Zs > valor_crítico_zs * (-1)) {
  print("positiva")
} else {
  print("negativa")
}

## [1] "positiva"

# Imprimir los resultados
print(paste(x, tendencia))

## [1] "Los datos tienen tendencia positiva"

ANÁLISIS Y CONCLUSIONES:Prueba de Tendencia MANN KENDALL_ Variable Tiempo [años]: El valor del estadístico S= (que mide la cantidad de pares de observaciones que muestran una tendencia ascendente) es 1596, el estadístico Z = 10.98 y el P-value< 2.2e-16

Dado que el valor p calculado es extremadamente pequeño (< 2.2e-16), mucho más pequeño que cualquier nivel de significancia común (como 0.01 o 0.05), se tiene evidencia sólida para rechazar la hipótesis nula de que no hay tendencia en los datos. Esto significa que hay una tendencia significativa en los datos a lo largo del tiempo.

El valor positivo del estadístico z (10.98) sugiere que los datos muestran una tendencia positiva. La estimación positiva de tau (1.00) también respalda esta conclusión.

En resumen, los resultados de la prueba de Mann-Kendall indican que hay una tendencia significativa en los datos, con una fuerte evidencia de una tendencia positiva.

Prueba de dispersiòn t(años)

#Gráfico de dispersión de los datos t

plot(TABLA_ORIGEN$`t [anos]`)
#Línea mediana en gráfico de dispersión t
abline(h = median(TABLA_ORIGEN$`t [anos]`), col = "red")

barplot(TABLA_ORIGEN$`t [anos]`, names.arg = 1:nrow(TABLA_ORIGEN), col = "blue", 
        main = "Gráfico de Barras de t [anos]", xlab = "Observaciones", ylab = "t [anos]")

# Dibujar una línea roja para representar la mediana
abline(h = median(TABLA_ORIGEN$`t [anos]`), col = "red")

“(Carlos J. Zapata, 2015) señala en su libro ‘Análisis Probabilístico y Simulación’ en el Capítulo 2 (Análisis de Datos)”

2.6 Pruebas de Aleatoriedad, Tendencia e Independencia en Variables Crecientes o Decrecientes

Algunas variables aleatorias tienen la característica natural de ser siempre crecientes o decrecientes, es decir monotónicas. Ejemplo de este tipo de variables son aquellas que expresan el tiempo acumulado desde un origen, el producto interno bruto de un país en un periodo de varios años, el capital de una persona en el tiempo, etc. En este caso, si se realizan las pruebas de aleatoriedad, tendencia e independencia sobre este tipo de variable, fallarán y mostraran que no hay aleatoriedad, que hay tendencia y que los datos son dependientes entre sí. Pero este resultado es falso y se debe a la naturaleza creciente o decreciente de la variable. Así, para este tipo de variables, las pruebas de aleatoriedad, tendencia e independencia deben realizarse sobre los incrementos entre los datos. El resultado que se obtenga será el verdadero para la variable original.

Prueba de aleatoriedad x(años)

#Prueba de Aleatoriedad x (Incremento sobre los datos x (años))

Aleatoriedad_x <- runs.test(TABLA_ORIGEN$`x [anos]`)

print(Aleatoriedad_x)

## 
##  Runs Test
## 
## data:  TABLA_ORIGEN$`x [anos]`
## statistic = 0, runs = 29, n1 = 28, n2 = 28, n = 56, p-value = 1
## alternative hypothesis: nonrandomness

#Prubea de aleatoriedad paso a paso_ x[años]

n <- length(TABLA_ORIGEN$`x [anos]`)
med_x <- median(TABLA_ORIGEN$`x [anos]`)
med_x

## [1] 0.2619

Media_x <- mean(TABLA_ORIGEN$`x [anos]`)
Media_x

## [1] 0.3711

desviacion <- sd(TABLA_ORIGEN$`x [anos]`)
desviacion

## [1] 0.3699892

C.V <- (desviacion / Media_x)*100
C.V

## [1] 99.70068

##############################################################################

#Se hallan los valores por encima y por debajo de la mediana 

n1 <- length(TABLA_ORIGEN$`x [anos]` [TABLA_ORIGEN$`x [anos]`<med_x])
n2 <- length(TABLA_ORIGEN$`x [anos]`[TABLA_ORIGEN$`x [anos]`>med_x])

# Inicializar variables
 
r1 <- 1
r2 <- 1
transiciones<- 1  # Iniciar con una transición 

# Iterar sobre los datos para contar transiciones
for (i in 2:n) {
  if (TABLA_ORIGEN$`x [anos]`[i] < med_x && TABLA_ORIGEN$`x [anos]`[i - 1] > med_x) {
    r1 <- r1 + 1
    transiciones <- transiciones+ 1
  } else if (TABLA_ORIGEN$`x [anos]`[i] > med_x && TABLA_ORIGEN$`x [anos]`[i - 1] < med_x) {
    r2 <- r2 + 1
    transiciones <- transiciones + 1
  }
}

# Asegurar que el último valor no cause una racha adicional
if (TABLA_ORIGEN$`x [anos]`[n] == med_x) {
  transiciones <- transiciones - 1
}
 transiciones <- r1 + r2
# Mostrar el número de rachas
transiciones

## [1] 29

###################################################################################

#Hallamos Miu u 

Miu_u<- (2*n1*n2)/(n1+n2)+1
#Miu_u <- ((2*(n1*n2))/n)+1
Miu_u

## [1] 29

Sigma_u <- (((2*n1*n2*(2*n1*n2-n1-n2))/(((n1+n2)^2)*(n1+n2-1)))^(1/2))
#Sigma_u <- (((2*n1*n2)*(2*n1*n2 -n))/((n^2)*(n-1)))^(1/2)
Sigma_u

## [1] 3.707486

Zu <- (transiciones - Miu_u)/ Sigma_u
Zu

## [1] 0

# Nivel de confianza (1 - alpha= 5%)

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_z <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico z
print(valor_crítico_z)

## [1] 1.959964

#Comparación de Zu con Valor crítico 

resultado <- ifelse((Zu > valor_crítico_z * (-1)) && (Zu < valor_crítico_z),
                    "Con el 95% de certeza, los datos son aleatorios",
                    "Los datos no son aleatorios")
print(resultado)

## [1] "Con el 95% de certeza, los datos son aleatorios"

CONCLUSION Y ANÁLISIS: los resultados de la prueba de Aleatoriedad no proporcionan evidencia de no aleatoriedad en la secuencia de datos de “x [anos].” Esto sugiere que la secuencia de datos de años parece ser aleatoria en términos de la alternancia de valores.

Prueba de tendencia x(años)

##Prueba de tendencia Mann-Kendall para tiempo x años


mk.test(TABLA_ORIGEN$`x [anos]`)

## 
##  Mann-Kendall trend test
## 
## data:  TABLA_ORIGEN$`x [anos]`
## z = 1.2184, n = 57, p-value = 0.2231
## alternative hypothesis: true S is not equal to 0
## sample estimates:
##            S         varS          tau 
## 1.780000e+02 2.110267e+04 1.115288e-01

Zs =1.2184

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_zs <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico Z
print(valor_crítico_zs)

## [1] 1.959964

#Comparación de Z con Valor crítico 

resultado <- ifelse((Zs > valor_crítico_zs * (-1)) && (Zs < valor_crítico_zs),
                    "Con el 95% de certeza, los datos no tienen tendencia",
                    "Los datos tienen tendencia")
x <- print(resultado)

## [1] "Con el 95% de certeza, los datos no tienen tendencia"

# Comparación de Zs para reconocer tendencia positiva o negativa de los datos
tendencia <- if (Zs > valor_crítico_zs * (-1)) {
  print("positiva")
} else {
  print("negativa")
}

## [1] "positiva"

# Imprimir los resultados
print(paste(x, tendencia))

## [1] "Con el 95% de certeza, los datos no tienen tendencia positiva"

ANÁLISIS Y CONCLUSIONES: En los resultados de la prueba de Mann-Kendall, no se encontró evidencia suficiente para concluir que hay una tendencia significativa en la variable “x [anos]” a lo largo del período de tiempo analizado, ya que el valor p es mayor que el nivel de significancia típico. Esto sugiere que la serie de datos de años parece no tener una tendencia estadísticamente significativa en función del tiempo. Prueba de dispersión x(años)

#Gráfico de dispersión de los datos x

plot(TABLA_ORIGEN$`x [anos]`)
#Línea mediana en gráfico de dispersión t
abline(h = median(TABLA_ORIGEN$`x [anos]`), col = "red")

barplot(TABLA_ORIGEN$`x [anos]`, names.arg = 1:nrow(TABLA_ORIGEN), col = "blue", 
        main = "Gráfico de Barras de x [anos]", xlab = "Observaciones", ylab = "x [anos]")

# Dibujar una línea roja para representar la mediana
abline(h = median(TABLA_ORIGEN$`x [anos]`), col = "red")

Prueba de aleatoriedad costo [$COP*10^6 ]

Aleatoriedad_costo <- runs.test(TABLA_ORIGEN$`[$COP*10^6 ]`)

print(Aleatoriedad_costo)

## 
##  Runs Test
## 
## data:  TABLA_ORIGEN$`[$COP*10^6 ]`
## statistic = 0.26972, runs = 30, n1 = 28, n2 = 28, n = 56, p-value =
## 0.7874
## alternative hypothesis: nonrandomness

#Prubea de aleatoriedad paso a paso_ costo

n <- length(TABLA_ORIGEN$`[$COP*10^6 ]`)
med_costo <- median(TABLA_ORIGEN$`[$COP*10^6 ]`)
med_costo

## [1] 32.6136

Media_costo <- mean(TABLA_ORIGEN$`[$COP*10^6 ]`)
Media_costo

## [1] 50.54507

desviacion <- sd(TABLA_ORIGEN$`[$COP*10^6 ]`)
desviacion

## [1] 59.88067

C.V <- (desviacion / Media_costo)*100
C.V

## [1] 118.4698

#Contar el número de transiciones en la variable t(años)
###############################################################################

#Se hallan los valores por encima y por debajo de la mediana 

n1 <- length(TABLA_ORIGEN$`[$COP*10^6 ]` [TABLA_ORIGEN$`[$COP*10^6 ]`<med_costo])
n2 <- length(TABLA_ORIGEN$`[$COP*10^6 ]`[TABLA_ORIGEN$`[$COP*10^6 ]`>med_costo])

# Inicializar variables
 
r1 <- 1
r2 <- 1
transiciones<- 1  # Iniciar con una transición 

# Iterar sobre los datos para contar transiciones

for (i in 2:n) {
  if (TABLA_ORIGEN$`[$COP*10^6 ]`[i] < med_costo && TABLA_ORIGEN$`[$COP*10^6 ]`[i - 1] > med_costo) {
    r1 <- r1 + 1
    transiciones <- transiciones+ 1
  } else if (TABLA_ORIGEN$`[$COP*10^6 ]`[i] > med_costo && TABLA_ORIGEN$`[$COP*10^6 ]`[i - 1] < med_costo) {
    r2 <- r2 + 1
    transiciones <- transiciones + 1
  }
}

# Asegurar que el último valor no cause una racha adicional

if (TABLA_ORIGEN$`[$COP*10^6 ]`[n] == med_costo) {
  transiciones <- transiciones - 1
}
 transiciones <- r1 + r2
 
# Mostrar el número de transiciones
transiciones

## [1] 30

#####################################################################


#Hallamos Miu u 

Miu_u<- ((2*n1*n2)/(n1+n2))+1
#Miu_u <- ((2*(n1*n2))/n)+1
Miu_u

## [1] 29

Sigma_u <- ((2*n1*n2*(2*n1*n2-n1-n2))/((((n1+n2)^2)*(n1+n2-1))))^(1/2)
#Sigma_u <- (((2*n1*n2)*(2*n1*n2 -n))/((n^2)*(n-1)))^(1/2)
Sigma_u

## [1] 3.707486

Zu <- (transiciones - Miu_u)/ Sigma_u
Zu

## [1] 0.2697245

# Nivel de confianza (1 - alpha= 5%)

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_z <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico z
print(valor_crítico_z)

## [1] 1.959964

#Comparación de Zu con Valor crítico 

resultado <- ifelse((Zu > valor_crítico_z * (-1)) && (Zu < valor_crítico_z),
                    "Con el 95% de certeza, los datos son aleatorios",
                    "Los datos no son aleatorios")
print(resultado)

## [1] "Con el 95% de certeza, los datos son aleatorios"

ANÁLISIS Y CONCLUSIONES: Prueba de Aleatoriedad para la variable Costo: Dado que el p-valor es 0.7874, que es bastante alto, no se tiene evidencia suficiente para rechazar la hipótesis nula de aleatoriedad. Esto significa que, los datos en cuestión no muestran un patrón significativo de no aleatoriedad. Por lo tanto, de acuerdo con esta prueba, parece que los datos pueden considerarse aleatorios.

Por lo tanto, no se rechaza la hipótesis nula de aleatoriedad en este análisis.

Prueba de tendencia Mann-Kendall costo [$COP*10^6 ]

##Prueba de tendencia Mann-Kendall para tiempo costo


mk.test(TABLA_ORIGEN$`[$COP*10^6 ]`)

## 
##  Mann-Kendall trend test
## 
## data:  TABLA_ORIGEN$`[$COP*10^6 ]`
## z = 3.3249, n = 57, p-value = 0.0008845
## alternative hypothesis: true S is not equal to 0
## sample estimates:
##            S         varS          tau 
## 4.840000e+02 2.110267e+04 3.032581e-01

Zs =3.3249

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_zs <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico Z
print(valor_crítico_zs)

## [1] 1.959964

#Comparación de Z con Valor crítico 

resultado <- ifelse((Zs > valor_crítico_zs * (-1)) && (Zs < valor_crítico_zs),
                    "Con el 95% de certeza, los datos no tienen tendencia",
                    "Los datos tienen tendencia")
x <- print(resultado)

## [1] "Los datos tienen tendencia"

# Comparación de Zs para reconocer tendencia positiva o negativa de los datos
tendencia <- if (Zs > valor_crítico_zs * (-1)) {
  print("positiva")
} else {
  print("negativa")
}

## [1] "positiva"

# Imprimir los resultados
print(paste(x, tendencia))

## [1] "Los datos tienen tendencia positiva"

ANÁLISIS Y CONCLUSIONES:Prueba de Tendencia MANN KENDALL: los resultados de la prueba Mann-Kendall indican que existe una tendencia estadísticamente significativa y creciente en los datos analizados. La hipótesis nula de que no hay tendencia (S igual a cero) se rechaza en favor de la hipótesis alternativa de que hay una tendencia positiva en los datos.

Tendencia significativa: La hipótesis alternativa sugiere que el parámetro de tendencia (S) no es igual a cero. Con base en el valor estimado de S, que es 4.84, y su varianza estimada (varS), que es 21102.67, podemos decir que existe una tendencia significativa en los datos.

Prueba de dispersión costo [$COP*10^6 ]

#Gráfico de dispersión de los datos costo
plot(TABLA_ORIGEN$`[$COP*10^6 ]`)
#Línea mediana en gráfico de dispersión t
abline(h = median(TABLA_ORIGEN$`[$COP*10^6 ]`), col = "red")

barplot(TABLA_ORIGEN$`[$COP*10^6 ]`, names.arg = 1:nrow(TABLA_ORIGEN), col = "blue", 
        main = "Gráfico de Barras de costo", xlab = "Observaciones", ylab = "Costo")

# Dibujar una línea roja para representar la mediana
abline(h = median(TABLA_ORIGEN$`[$COP*10^6 ]`), col = "red")

Prueba de aleatoriedad ttr [horas]

#Prueba de Aleatoriedad ttr

Aleatoriedad_ttr <- runs.test(TABLA_ORIGEN$`ttr [horas] c`)

print(Aleatoriedad_ttr)

## 
##  Runs Test
## 
## data:  TABLA_ORIGEN$`ttr [horas] c`
## statistic = -1.3486, runs = 24, n1 = 28, n2 = 28, n = 56, p-value =
## 0.1775
## alternative hypothesis: nonrandomness

n <- length(TABLA_ORIGEN$`ttr [horas] c`)
med_ttr <- median(TABLA_ORIGEN$`ttr [horas] c`)
med_ttr

## [1] 3.7821

Media_ttr <- mean(TABLA_ORIGEN$`ttr [horas] c`)
Media_ttr

## [1] 5.396279

Desviación_ttr <- sd(TABLA_ORIGEN$`ttr [horas] c`)
Desviación_ttr

## [1] 5.502819

C.V <- (Desviación_ttr/Media_ttr)*100
C.V

## [1] 101.9743

#Contar el número de transiciones en la variable t(años)
#############################################################################

#Se hallan los valores por encima y por debajo de la mediana 

n1 <- length(TABLA_ORIGEN$`ttr [horas] c` [TABLA_ORIGEN$`ttr [horas] c`<med_ttr])
n2 <- length(TABLA_ORIGEN$`ttr [horas] c`[TABLA_ORIGEN$`ttr [horas] c`>med_ttr])

# Inicializar variables
 
r1 <- 0
r2 <- 1
transiciones<- 1  # Iniciar con una transición 

# Iterar sobre los datos para contar transiciones

for (i in 2:n) {
  if (TABLA_ORIGEN$`ttr [horas] c`[i] < med_ttr && TABLA_ORIGEN$`ttr [horas] c`[i - 1] > med_ttr) {
    r1 <- r1 + 1
    transiciones <- transiciones+ 1
  } else if (TABLA_ORIGEN$`ttr [horas] c`[i] > med_ttr && TABLA_ORIGEN$`ttr [horas] c`[i - 1] < med_ttr) {
    r2 <- r2 + 1
    transiciones <- transiciones + 1
  }
}

# Asegurar que el último valor no cause una racha adicional

if (TABLA_ORIGEN$`ttr [horas] c`[n] == med_ttr) {
  transiciones <- transiciones - 1
}
 transiciones <- r1 + r2
 
# Mostrar el número de transiciones
transiciones

## [1] 24

#####################################################################

#Hallamos Miu u 

Miu_u<- ((2*n1*n2)/(n1+n2))+1
#Miu_u <- ((2*(n1*n2))/n)+1
Miu_u

## [1] 29

Sigma_u <- ((2*n1*n2*(2*n1*n2-n1-n2))/((((n1+n2)^2)*(n1+n2-1))))^(1/2)
#Sigma_u <- (((2*n1*n2)*(2*n1*n2 -n))/((n^2)*(n-1)))^(1/2)
Sigma_u

## [1] 3.707486

Zu <- (transiciones - Miu_u)/ Sigma_u
Zu

## [1] -1.348623

# Nivel de confianza (1 - alpha= 5%)

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_z <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico z
print(valor_crítico_z)

## [1] 1.959964

#Comparación de Zu con Valor crítico 

resultado <- ifelse((Zu > valor_crítico_z * (-1)) && (Zu < valor_crítico_z),
                    "Con el 95% de certeza, los datos son aleatorios",
                    "Los datos no son aleatorios")
print(resultado)

## [1] "Con el 95% de certeza, los datos son aleatorios"

ANÁLISIS Y CONCLUSIONES: Estadísticamente no significativo: El valor de la estadística de prueba (statistic) es -1.3486, y el p-valor es 0.1775. Dado que el p-valor es mayor que un nivel de significancia típico (como 0.05), no hay evidencia estadística suficiente para rechazar la hipótesis nula.

No hay evidencia de no aleatoriedad: La hipótesis alternativa sugiere que los datos son no aleatorios (es decir, que hay algún patrón o tendencia). Sin embargo, dado que el p-valor es mayor que el nivel de significancia, no tenemos suficiente evidencia para respaldar la afirmación de no aleatoriedad en los datos.

Prueba de Mann-Kendall ttr [horas]

mk.test(TABLA_ORIGEN$`ttr [horas] c`)

## 
##  Mann-Kendall trend test
## 
## data:  TABLA_ORIGEN$`ttr [horas] c`
## z = -1.0119, n = 57, p-value = 0.3116
## alternative hypothesis: true S is not equal to 0
## sample estimates:
##             S          varS           tau 
## -1.480000e+02  2.110267e+04 -9.273183e-02

Zs =-1.480000e+02

nivel_de_confianza <- 0.95

# Cálculo del valor crítico z
valor_crítico_zs <- qnorm(1 - (1 - nivel_de_confianza) / 2)

# Imprimir el valor crítico Z
print(valor_crítico_zs)

## [1] 1.959964

#Comparación de Z con Valor crítico 

resultado <- ifelse((Zs > valor_crítico_zs * (-1)) && (Zs < valor_crítico_zs),
                    "Con el 95% de certeza, los datos no tienen tendencia",
                    "Los datos tienen tendencia")
x <- print(resultado)

## [1] "Los datos tienen tendencia"

# Comparación de Zs para reconocer tendencia positiva o negativa de los datos
tendencia <- if (Zs > valor_crítico_zs * (-1)) {
  print("positiva")
} else {
  print("negativa")
}

## [1] "negativa"

# Imprimir los resultados
print(paste(x, tendencia))

## [1] "Los datos tienen tendencia negativa"

ANÁLISIS Y CONCLUSIONES: El valor p obtenido de 0.3116 supera el nivel de significancia comúnmente utilizado de 0.05. Esto indica que no hay evidencia suficiente para rechazar la hipótesis nula de que no existe una tendencia significativa en los datos a lo largo del tiempo. En otras palabras, no podemos afirmar con confianza que haya una tendencia ascendente o descendente en la variable “ttr [horas] c” en función del tiempo.

El valor estimado de S es -148.0, lo que sugiere una tendencia descendente, pero este valor por sí solo no es suficiente para establecer una tendencia significativa dada la falta de significancia estadística.

La estimación de varS (21102.67) indica que los datos tienen una variabilidad considerable. Esto significa que, aunque no hay una tendencia clara y significativa, la serie de datos puede experimentar fluctuaciones considerables en sus valores a lo largo del tiempo.

Prueba de dispersión ttr [horas]

#Gráfico de dispersión de los datos costo
plot(TABLA_ORIGEN$`ttr [horas] c`)
#Línea mediana en gráfico de dispersión t
abline(h = median(TABLA_ORIGEN$`ttr [horas] c`), col = "red")

barplot(TABLA_ORIGEN$`ttr [horas] c`, names.arg = 1:nrow(TABLA_ORIGEN), col = "blue", 
        main = "Gráfico de Barras ttr (horas)", xlab = "Observaciones", ylab = "ttr")

# Dibujar una línea roja para representar la mediana
abline(h = median(TABLA_ORIGEN$`ttr [horas] c`), col = "red")