1 Planteamiento del problema

La emotividad tiene que ver con las emociones que experimentan los seres humanos al estar expuestas a estímulos, en ciertos momentos, de tal forma que puede haber emociones positivas y negativas.

La emotividad tiene que ver con una experiencia afectiva que puede ser agradable o desagradable que estimula respuestas de tipo congnitivo, de conducta, fisiológica y que es diferente y similar a la ves en distintas personas(Chóliz Montañés 2005)

El nivel de emotividad es un aspecto fundamental en el estudio del comportamiento humano, ya que influye en la manera en que las personas responden a diversas situaciones en su entorno diario.

En este contexto, se ha observado que las emociones pueden variar significativamente de un día a otro, lo que plantea la necesidad de entender cómo se manifiestan y varían en función del tiempo.

En el presente ejercicio, se evaluó el nivel de emotividad de un grupo de individuos durante dos días específicos de la semana: lunes y martes. Los valores obtenidos para los lunes fueron: 3, 2, 3, 2, 4, 3, 5, 4, 3, 4; y para los martes: 5, 3, 3, 2, 5, 2, 7, 5, 2, 7.

El objetivo es determinar si existe una diferencia significativa en los niveles de emotividad entre estos dos días.

2 Detección de variables e indicadores

Se tienen datos que son indicadores de emotividad de una misma muestra a la que se identifican dos momentos de dos dias, Lunes y Martes.

3 Selección de dos variables (causa y efecto)

Variable causa (independiente): Día de la semana (Lunes o Martes)

Esta variable representa la situación o condición que podría influir en los niveles de emotividad. El día de la semana se toma como una posible causa de variación en la emotividad.

Variable efecto (dependiente): Nivel de emotividad

Esta variable mide el nivel emocional de los participantes en cada día. La emotividad se considera el efecto que puede cambiar dependiendo del día en que se mida (Lunes o Martes).

4 Planteamiento de hipótesis nula y alternativa

  • Hipótesis nula (\(H_0\)):

No hay diferencia significativa en los niveles de emotividad entre el día Lunes y el día Martes. Es decir, los niveles de emotividad son iguales en ambos días.

\[ H_0: \bar{x}_1=\bar{x}_2 \]

  • Hipótesis alternativa (Ha):

Hay una diferencia significativa en los niveles de emotividad entre el día Lunes y el día Martes. Es decir, los niveles de emotividad no son iguales en ambos días.

\[ H_a: \bar{x}_1\ne\bar{x}_2 \]

Siendo \(\bar{x}_1\) la media de la primer muestra y \(\bar{x}_1\) la media de la segunda muestra muestra

o bien:

\[ H_0:\bar{L}=\bar{M}\\ H_a:\bar{L}\ne\bar{M} \]

Estas hipótesis permiten evaluar si el día de la semana tiene un efecto sobre los niveles de emotividad de los participantes.

5 Criterio para la selección de la prueba estadística

Se utiliza la prueba t Student para muestras dependientes.

La prueba estadística correspondiente sería una prueba t de muestras dependientes (pareadas), ya que se mide la misma variable (emotividad) en los mismos individuos en dos momentos diferentes.

6 Nivel de significancia

Para todo valor calculado de t con una probabilidad menor o igual a \(0.05\), se acepta la hipótesis alternativa \(H_a\) y se rechaza la hipótesis nula \(H_0\).

7 Zona de rechazo

Para todo valor calculado de t con una probabilidad mayor a \(0.05\) se acepta la hipótesis nula \(H_0\) y se rechaza la hipótesis alternativa \(H_a\).

8 Fórmula

Se presentan las fórmulas y los resultados de la prueba t-Student para muestras dependientes.

Diferencias de las muestras

Se calcula el valor \(D\) que es la diferencia entre los valores de las dos muestras.

\(D = (L - M) = \text{-2, -1, 0, 0, -1, 1, -2, -1, 1, -3}\)

Media de las diferencias

Se calcula el valor medio de las diferencias:

\[ \bar{D} = \frac{\sum{D}}{n}=\frac{-2-1+0+0-1+1-2 -1+1-3}{10}=\frac{-8}{10}=-0.8 \]

  • \(\bar{D}\) la media de las diferencias
  • \(n\) cantidad de observaciones de las muestras, en este caso son \(n=10\)

La suma de las diferencias −8 indica que, en conjunto, los valores de “Lunes” (L) fueron, en promedio, 8 unidades menores que los valores de “Martes” (M) cuando se consideran todas las observaciones.

Esto significa que, sumando todas las diferencias entre los pares de valores de lunes y martes, el total es negativo, lo que indica que los valores de “Martes” tienden a ser mayores que los de “Lunes”.

Desviación estándar de las diferencia

La varianza \(S^2\) es una medida de dispersión que indica qué tan dispersos o distribuidos están los valores de un conjunto de datos en relación con la media, la desviación estándar \(\sqrt{S^2}\) es la raiz cuadrada de la varianza.

La desviación estándar es una medida de dispersión que indica, en promedio, cuán lejos están los valores individuales de \(D\) (las diferencias entre “Lunes” y “Martes”) de la media de esas diferencias \(\bar{D}\).

\[ S_{\bar{D}} = \frac{(D - \bar{D})^2}{n-1} = \]

L M \(D=L- M\) \(D-\bar{D}\) \((D-\bar{D})^2\)
3 5 -2 -1.2 1.44
2 3 -1 -0.2 0.04
3 3 0 0.8 0.64
2 2 0 0.8 0.64
4 5 -1 -0.2 0.04
3 2 1 1.8 3.24
5 7 -2 -1.2 1.44
4 5 -1 -0.2 0.04
3 2 1 1.8 3.24
4 7 -3 -2.2 4.84
\(\sum=15.6\)

\[ S^2_{\bar{D}} = \frac{(D - \bar{D})^2}{n-1}\frac{\sum{1.44+0.04+0.64+0.64+0.04+3.24+1.44+0.04+3.24+4.84}}{10-1} = \frac{15.6}{9} \approx1.7333 \]

La raiz cuadrada de la varianza arroja la desviación estándar.

$$ S = = = 1.3165

$$

9 Cálculo de los grados de libertad

Dado que se estará trabajando con la prueba t de muestras dependientes (pareadas), los grados de libertad se calculan mediante la siguiente fórmula:

\[ {gl = n-1} \\ {gl = 10-1} \\ {gl = 9} \]

10 Valor crítico de t y valor de t

Se calcula el valor de t de la distribución t student al \(95\%\) de confianza a dos colas.

\[ t = \frac{\bar{D}}{S_D/\sqrt{D}} \therefore \]

  • \(t\) es el valor calculado
  • \(\bar{D}\) es la media de las diferencias entre pares (lunes y martes).
  • \(S\) es la desviación estándar de las diferencias
  • \(n\): Número de pares de observaciones

11 Valor estadístico de la prueba seleccionada p_value

Con R se calcula el valor de P extrayendo la probabilidad a dos colas de la distribución t student para un valor de \(t=-1.9215\) a \(9\) grados de libertdad (gl).

# Calcular el valor p para una prueba bilateral
t_value <- -1.9215
df <- 9
p_value <- 2 * (1 - pt(abs(t_value), df))
print(p_value)
## [1] 0.08684756

El valor p_valor \(\text{p_valor} = 0.0868\) que con un nivel de significancia de \(0.05\), no hay suficiente evidencia para rechazar la hipótesis nula \(H_0\). Por lo tanto, la diferencia observada no es estadísticamente significativa a este nivel de confianza (\(95\%\)).

12 Gráfica con los valores críticos

En R se pueden calclar los valores críticos a un 95% de confianza

# Definir los grados de libertad
df <- 9  # n - 1, donde n es el número de pares de datos

# Obtener los valores críticos de t para un nivel de confianza del 95%
alpha <- 0.05
t_critical_left <- qt(alpha / 2, df)  # Valor crítico del lado izquierdo
t_critical_right <- qt(1 - (alpha / 2), df)  # Valor crítico del lado derecho

# Mostrar los valores críticos
cat("Valor crítico izquierdo:", t_critical_left, "\n")
## Valor crítico izquierdo: -2.262157
cat("Valor crítico derecho:", t_critical_right, "\n")
## Valor crítico derecho: 2.262157

Luego en programación R se puede visualizar y contrastar el valor de t contra los valores críticos de t a 95% de confianza y/o nivel de confianza de alpha \(\alpha = 0.05\) a dos colas.

# Configuración de los datos
t_value <- -1.9215  # Valor t obtenido
df <- 9             # Grados de libertad (n - 1)
alpha <- 0.05       # Nivel de significancia

# Calcular los valores críticos de t para el 95% de confianza
t_critical_left <- qt(alpha / 2, df)   # Valor crítico izquierdo
t_critical_right <- qt(1 - (alpha / 2), df)  # Valor crítico derecho

# Crear secuencia de valores t para la distribución
t_values <- seq(-4, 4, 0.01)
t_distribution <- dt(t_values, df)

# Graficar la distribución t
plot(t_values, t_distribution, type = "l", lwd = 2, col = "blue",
     xlab = "Valores t", ylab = "Densidad de probabilidad",
     main = "Distribución t de Student con Valor t Obtenido y Valores Críticos")

# Sombrear las áreas de rechazo a la izquierda y derecha
polygon(c(t_values[t_values <= t_critical_left], t_critical_left),
        c(t_distribution[t_values <= t_critical_left], 0), col = "lightgray", border = NA)

polygon(c(t_critical_right, t_values[t_values >= t_critical_right]),
        c(0, t_distribution[t_values >= t_critical_right]), col = "lightgray", border = NA)

# Añadir líneas para los valores críticos y el valor t obtenido
abline(v = t_critical_left, col = "red", lty = 2, lwd = 2, label="Valor crítico izquierdo")
abline(v = t_critical_right, col = "red", lty = 2, lwd = 2, label="Valor crítico derecho")
abline(v = t_value, col = "green", lty = 3, lwd = 2, label="Valor t obtenido")

# Añadir una leyenda
legend("topright", legend = c("Valor crítico izquierdo", "Valor crítico derecho", "Valor t obtenido"),
       col = c("red", "red", "green"), lty = c(2, 2, 3), lwd = 2, cex = 0.8)

Se observa con la línea punteada en verde que el valor de \(t\) está en zona de aceptar la \(H_0\) por lo que se acepta la hipótesis nula.

Las líneas punteadas en color rojo son los valores críticos de t de la distribución t-student un 95% de confianza.

La curva en color azul represnta valores continuos de una distribución t student.

13 Decisión estadística

Con lo anterior, se toma la decisión de aceptar la hipótesis nula declarada inicialmente: \(H_0:\bar{L}=\bar{M}\\\) que significa que no hay evidencia estadística suficiente para rechazar la hipótesis nula.

El valor de p_valor \(\text{p_valor} = 0.0868\) a un nivel de significancia de \(0.05\), indica que no hay suficiente evidencia para rechazar la hipótesis nula \(H_0\); no es menor que \(0.05\) por lo que se acepta \(H_0\).

Además, visualmente se encuentra que el valor de \(t\) a un nivel de confianza del \(95\)% está en zona de aceptar \(H_0\).

El siguiente código en R utiliza la función t.test para hacer la prueba t_Student para muestras dependientes.

# Definir los datos
L <- c(3, 2, 3, 2, 4, 3, 5, 4, 3, 4)
M <- c(5, 3, 3, 2, 5, 2, 7, 5, 2, 7)

# Realizar la prueba t de muestras dependientes
resultado_ttest <- t.test(L, M, paired = TRUE)

# Mostrar los resultados
print(resultado_ttest)
## 
##  Paired t-test
## 
## data:  L and M
## t = -1.9215, df = 9, p-value = 0.08684
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -1.7418111  0.1418111
## sample estimates:
## mean difference 
##            -0.8

14 Interpretación

Este ejercicio detalla la prueba t-Student para meustras dependientes.

Primero se detalla el desarrollo en el cual se calcula a partir de las muestras, las diferencia entre ellas, luego la media de las diferencias para obtener la varianza y la desviación estándar de las diferencias.

El valor de t se calcula a partir de la media de las diferencias y la desviación estándar y sirve para obtener el valor de p.

El valor de t se contrasta contra los valores críticos de t a dos colas a un \(95\%\) de confianza. En la gráfica se observó que el valor crítico de \(t=-1.9215\) está en el rango de \(-2.262157\) a \(2.262157\) por lo que se acepta \(H_0\).

Finalmente, p_valor \(\text{p_valor} = 0.0868\) a un nivel de significancia de \(0.05\), indica que no hay suficiente evidencia para rechazar la hipótesis nula \(H_0\).

15 Sugerencias

Hacerlo en python… aquí el enlace:https://colab.research.google.com/drive/1EVSCE4-VFEEkqyNfudZf44NvsiA2zsiT?usp=sharing

(GPT 2024)

(DATATab 2024)

Bibliografía

Chóliz Montañés, Mariano. 2005. Psicología de La Emoción: El Proceso Emocional. chrome-extension://efaidnbmnnnibpcajpcglclefindmkaj/https://www.uv.es/~choliz/Proceso%20emocional.pdf.
DATATab. 2024. “Prueba t Para Muestras Relacionadas.” https://datatab.es/tutorial/paired-t-test.
GPT, Chat. 2024. “Chat GPT.” https://chatgpt.com/.