# Alejandra Ciria
# Clase: Aprendizaje, Motivación y Cognición I
# Ciencias Cognitivas y del Comportamiento
# Facultad de Psicología, UNAM
# Set working directory: Session - Set working directory - Choose directory
# En esta clase veremos en R
# Teorema del límite central
# Es necesario comprenderlo porque está detrás de muchas pruebas estadísticas
# No es posible probar que una hipótesis sea verdadera
# Lo que se puede hacer es evaluar los datos para ver que tan
# probable es que nuestro resultado ocurriera por azar
# Si es poco probable que nuestro resultado ocurra por azar
# Entonces podemos rechazar H0 y aceptar HA
# Monedas
# install.packages("mosaic")
library(mosaic)
## Registered S3 method overwritten by 'mosaic':
## method from
## fortify.SpatialPolygonsDataFrame ggplot2
##
## The 'mosaic' package masks several functions from core packages in order to add
## additional features. The original behavior of these functions should not be affected by this.
##
## Attaching package: 'mosaic'
## The following objects are masked from 'package:dplyr':
##
## count, do, tally
## The following object is masked from 'package:Matrix':
##
## mean
## The following object is masked from 'package:ggplot2':
##
## stat
## The following objects are masked from 'package:stats':
##
## binom.test, cor, cor.test, cov, fivenum, IQR, median, prop.test,
## quantile, sd, t.test, var
## The following objects are masked from 'package:base':
##
## max, mean, min, prod, range, sample, sum
# rflip es una función para lanzar una moneda
# Si lanzamos una moneda
# Cara (Head) = 0.5
# Cruz (Tail) = 0.5
# La suma de ambos posibles resultados de un evento debe ser 1
rflip(n =1, prob = 0.5)
##
## Flipping 1 coin [ Prob(Heads) = 0.5 ] ...
##
## H
##
## Number of Heads: 1 [Proportion Heads: 1]
# Ahora, vamos a lanzar una moneda 10 veces
# ¿Cuántas caras creen que salgan?
rflip(n =10, prob = 0.5)
##
## Flipping 10 coins [ Prob(Heads) = 0.5 ] ...
##
## H H H T T H T T T H
##
## Number of Heads: 5 [Proportion Heads: 0.5]
# Veamos quién tiene razón
rflip(n =10, prob = 0.5)
##
## Flipping 10 coins [ Prob(Heads) = 0.5 ] ...
##
## H H T H T H H H H T
##
## Number of Heads: 7 [Proportion Heads: 0.7]
# Intentemos una vez más
rflip(n =10, prob = 0.5)
##
## Flipping 10 coins [ Prob(Heads) = 0.5 ] ...
##
## H H H H H H H H H T
##
## Number of Heads: 9 [Proportion Heads: 0.9]
# Si lanzamos una moneda nueve veces, y obtenemos cara las nueve veces:
# ¿Cuál es la probabilidad de obtener cara otra vez al lanzar la moneda por décima vez?
# La respuesta es:
# 50%
# ¿Porqué sucede esto?
# Cada vez que lanzamos una moneda, obtener cara o cruz tienen 50% de probabilidad
# de ocurrencia. Cuando la volvemos a lanzar, el resultado obtenido será independiente
# del lanzamiento anterior.
# En probabilidad, independencia significa que cuando un evento ocurra, no tendrá impacto
# en la probabilidad de que otro evento ocurra
# Entonces, cada vez que lanzamos una moneda el resultado del lanzamiento anterior,
# no tiene ningún impacto en el siguiente
# Esto puede ser contraintuitivo. Sin embargo, si no se tiene un entrenamiento en
# probabilidad sabemos que es muy poco probable que se obtengan 9 caras de 10 lanzamientos,
# sin embargo, esto no implica que el décimo lanzamiento dependa de los anteriores.
# Entonces podemos preguntarnos:
#¿Qué tan probable es que ocurra eso?
# Cara (H), Cruz (T)
# Como vimos la probabilidad de obtener cara o cruz es:
# P(H) = 0.5
# P(T) = 0.5
# Entonces, la probabilidad de que ocurra una de esas combinaciones
# Es 1 en 4, o 0.25
# Si aplicamos la regla de independencia multiplicando la probabilidad
# P(H,T) = P(H) * P(T)
0.5 * 0.5
## [1] 0.25
# El resultado es el mismo para cada permutación
# P(H,H) = P(H) * P(H)
0.5 * 0.5
## [1] 0.25
# Vemos que cualquiera de estas combinaciones
# al lanzar dos monedas tiene la misma probabilidad
# Ahora...
# ¿Cuál es la probabilidad de obtener dos caras, una cara, o ninguna cara al lanzar dos monedas?
# Variable aleatoria (X) - el valor de la variable es determinada por un experimento aleatorio
# Distribución discreta de probabilidad - tabla o fórmula que enlista las probabilidades
# de cada posible resultado de la variable aleatoria X
# Variable aleatoria X = el número de veces (combinaciones) en que se presenta cara (Head)
# Si lanzamos dos monedas podemos obtener estas combinaciones
# Distribución discreta de probabilidad
# HH -- 0 caras
# HT -- 1 cara
# TH -- 1 cara
# TT -- 0 caras
# Probabilidad de obtener dos caras
# P(HH)= 0.25
1/4
## [1] 0.25
# Probabilidad de obtener una cara
# P(HT)= 0.5
2/4
## [1] 0.5
# Probabilidad de obtener cero caras
# P(TT)= 0.25
1/4
## [1] 0.25
# Podemos concluir que hay un 50% de probabilidad de obtener una cara al lanzar dos monedas
# y 25% de probabilidad de obtener dos caras, así como 25% de obtener cero caras
# La suma de todas las probabilidades en nuestra distribución debe sumar 1
1/4 + 2/4 + 1/4
## [1] 1
# Todos los posibles resultados de nuestra variable aleatoria X deben sumar 1
# Si lanzamos tres monedas
# Variable aleatoria X = el número de veces (combinaciones) en que se presenta cara (Head)
# Si lanzamos tres monedas podemos obtener estas combinaciones
# Tenemos 8 posibles combinaciones (2 posibles resultados H y T, elevado a la 3)
2^3
## [1] 8
# Distribución de probabilidad eventos discretos
# HHH -- 3 caras
# HHT -- 2 caras
# HTH -- 2 caras
# HTT -- 1 cara
# THH -- 2 caras
# THT -- 1 cara
# TTH -- 1 cara
# TTT -- 0 caras
# Probabilidad de obtener 3 caras = 0.125
1/8
## [1] 0.125
# Probabilidad de obtener 2 caras = 0.375
3/8
## [1] 0.375
# Probabilidad de obtener 1 cara = 0.375
3/8
## [1] 0.375
# Probabilidad de obtener 0 caras = 0.125
1/8
## [1] 0.125
# Al lanzar 3 monedas:
# vemos que es mucho menos probable obtener 3 caras 12.5% o ninguna 12.5%
# que obtener 2 caras 37.5% o al menos 1 cara 37.5%
# Ahora, regresemos al ejemplo de obtener 9 caras al lanzar 9 monedas
# ¿Cuántas posibles combinaciones hay?
2^9
## [1] 512
# Tenemos 512 posibles combinaciones!
# Sabemos que sólo existe una posible combinación para obtener 9 caras
1/512
## [1] 0.001953125
# Esto es lo mismo si lo vemos de esta otra manera
# P(H,H,H,H,H,H,H,H,H) = P(H)^9
0.5^9
## [1] 0.001953125
# Sabemos que la probabilidad de ocurra es 0.002
# Lo podemos ver en porcentaje
# El 0.2% del total o 100% de los lanzamientos es probable que ocurran 9 caras de 9
# Si queremos que ocurra una vez
# ¿Cuántos eventos tienen que ocurrir para que suceda una sola vez?
100/0.2
## [1] 500
500 *.002
## [1] 1
# Esto quiere decir que si lanzas 9 veces 9 monedas y lo repites 500 veces
# esperarías observar 9 caras sólo una vez
# Es muy poco probable, pero no es imposible
# Con la función do() le podemos decir a R que realice una operación varias veces
# En este caso le pedimos que lanze 9 monedas 500 veces
quinientos_tiros <- do(500) * rflip(9, prob = 0.5)
quinientos_tabla <- table(quinientos_tiros$heads)
quinientos_tabla
##
## 1 2 3 4 5 6 7 8 9
## 9 29 81 119 130 84 41 5 2
histogram(~ heads, quinientos_tiros,
breaks=-.5 + (0:10))

# ¿Podemos ver alguna tendencia?
# Al ver qué ocurrió en cada uno de los 500 lanzamientos de 9 monedas
# Se nos muestra la proporción de caras que se obtuvieron en cada uno de los 9 lanzamientos
# Ahora, le pedimos a R que lo haga 10,000 veces
# Con 9 monedas y hacemos una tabla con los resultados
# Si con 500 lanzamientos de 9 monedas es probable que ocurra 1 vez obtener 9 caras
# ¿Cuántas veces ocurriría este evento si lanzamos 9 monedas 10,000 veces?
# Es probable que este evento ocurra 20 veces
# Si corres estas líneas varias veces podrías ver que es probable esperar que ocurra 20 veces
diezmil_veces <- do(10000) * rflip(9, prob = 0.5)
tabla_diezmil <- table(diezmil_veces$heads)
tabla_diezmil
##
## 0 1 2 3 4 5 6 7 8 9
## 22 183 738 1651 2462 2415 1612 733 166 18
# Ahora, le pedimos a R que lo haga 10,000 veces
# Pero ahora con 10 monedas y hacemos una tabla con los resultados
diezmil_veces <- do(10000) * rflip(10, prob = 0.5)
tabla_diezmil <- table(diezmil_veces$heads)
tabla_diezmil
##
## 0 1 2 3 4 5 6 7 8 9 10
## 13 102 436 1118 2035 2491 2079 1169 450 99 8
histogram(~ heads, diezmil_veces, breaks=-.5 + (0:11))

# Podemos ver que de las 10,000 veces que se lanzó 10 veces una moneda:
# La mayoría de proporción de caras obtenida está en 5
# Es muy probable obtener 5 caras al lanzar 10 veces una moneda
# Luego vemos que también es muy probable, pero un poco menos obtener
# entre 4 y 6, caras por cada cada 10 tiros.
# Menos probable obtener 2, 3, 7, y 8 caras en 10 lanzamientos
# Poco probable obtener 1 y 9 caras en 10 lanzamientos
# Muy poco probable obtener 0 y 10
# Esa es una distribución normal:
# Es una función de probabilidad que describe cómo los valores de una variable
# están distribuidas
h <- hist(diezmil_veces$heads, breaks = 10, density = 30,
col = "gray", xlab = "Caras", main = "Caras 10,000 iteraciones 10 lanzamientos")
xfit <- seq(min(diezmil_veces$heads), max(diezmil_veces$heads), length = 50)
yfit <- dnorm(xfit, mean = mean(diezmil_veces$heads), sd = sd(diezmil_veces$heads))
yfit <- yfit * diff(h$mids[1:2]) * length(diezmil_veces$heads)
lines(xfit, yfit, col = "black", lwd = 2)

# Es una distribución simétrica en la que la mayoría de las observaciones se agrupan
# alrededor del pico central y las probabilidades de valores más alejados
# de la media disminuyen por igual en ambas direcciones.
# Los valores extremos en las colas de la distribución son
# muy poco probables.
# La media de una distribución normal, es la tendencia central de la distribución
# Es el pico central de la distribución
# La media, la moda, la mediana son iguales
media <- mean(diezmil_veces$heads)
media
## [1] 5.0151
# La desviación estándar (DE) es la medida de variabilidad
# Define el ancho de la distribución normal. La desviación estándar determina
# qué tan lejos de la media tienden a caer los valores.
#Representa la distancia típica entre las observaciones y el promedio.
des_est <- sd(diezmil_veces$heads)
des_est
## [1] 1.580418
# Regla empírica de la distribución normal
# Cuando tiene datos distribuidos normalmente, la desviación estándar
# se vuelve particularmente valiosa. Puede usarlo para determinar la proporción
# de los valores que se encuentran dentro de un número específico de
# desviaciones estándar de la media.
#Por ejemplo, en una distribución normal,
# El 68% de las observaciones caen dentro de +/- 1 desviación estándar de la media.
media + des_est
## [1] 6.595518
media - des_est
## [1] 3.434682
# El 68% de las interaciones de 10 lanzamientos vamos a obtener entre 3 y 6 caras
# El 95% de las observaciones caen dentro de +/- 2 desviación estándar de la media.
media + (des_est * 2)
## [1] 8.175936
media - (des_est * 2)
## [1] 1.854264
# El 95% de las iteraciones de 10 lanzamientos vamos a obtener entre 2 y 8 caras
# El 99% de las observaciones caen dentro de +/- 3 desviación estándar de la media.
media + (des_est * 3)
## [1] 9.756355
media - (des_est * 3)
## [1] 0.2738453
# La distribución normal es la distribución de probabilidad más importante
# en estadística, es la base de muchas pruebas de estadística inferencial
# porque se ajusta a muchos fenómenos naturales que actúan
# de forma aditiva.
# Por ejemplo, la altura, la presión arterial, el error de medición y
# las puntuaciones de CI siguen la distribución normal.
# También se conoce como distribución gaussiana y curva de campana.
# Monedas y la catadora de té
# Exite una famosa historia sobre una mujer que argumetaba
# que podía distinguir en una taza cualquiera de té con leche,
# si se había vertido primero la leche o primero el té.
# Esta historia es famosa porque la mujer argumentó esto en una fiesta
# en Cambridge, Inglaterra en 1929. De todos los invitados, uno de ellos,
# en lugar de ignorar el argumento de la mujer le propuso poner a prueba
# su hipótesis.
# El científico era R. A. Fisher, quien describió esta situación (lady tasting tea)
# en 1935, en su libro: The Design of Experiments.
# Fisher desarrolló ideas originales en el campo de la inferencia estadística
# y en el diseño de experimentos.
#Entre otras cosas, Fisher es responsable de la hipótesis nula,
# e introduce el concepto con el experimento de la catadora de té.
# ¿Cómo creen que Fisher puso a prueba la hipótesis del té?
# Primero, estableció la hipótesis nula:
# H0 = La mujer no tiene la capacidad de distinguir las tazas de té
# Es posible que sientas curiosidad por saber cómo resultó el experimento.
# ¿Cuántas tazas de té se prepararon?
# ¿Cuántas identificó correctamente la mujer?
# ¿Cuál fue la conclusión?
# Fisher nunca lo dice en su libro.
# Le interesa el método, no los resultados particulares.
# Imaginemos que decidimos hacer la prueba.
# Le vamos a preparar 8 tazas de té ordenadas aleatoriamente
# En cuatro de ellas, la leche se había agregado primero; en las otras cuatro, el té
# La manera en que vamos a preparar el té dependerá de lanzar una moneda.
# Cara (Head) = leche al té
# Cruz (Tail) = té a la leche
rflip(n =1, prob = 0.5)
##
## Flipping 1 coin [ Prob(Heads) = 0.5 ] ...
##
## H
##
## Number of Heads: 1 [Proportion Heads: 1]
# Preparamos un té y se lo llevamos a la catadora de té
# ¿Qué opciones podría haber de su respuesta?
# Tiene dos opciones 0.5 (50%) de probabilidad cada una
# Le llemaos cada una de la 8 tazas de té a la mujer y anotamos su respuesta
# Es fácil darle una puntuación (7 sobre 8, o 5 sobre 8, o lo que sea).
# Es más complicado averiguar qué podemos hacer con su puntuación.
# Incluso si sólo está adivinando y no tiene idea, podría ser que
# muy afortunada y acertar algunos, tal vez incluso las 8 tazas.
# Entonces podemos preguntarnos:
#¿Qué tan probable es que ocurra eso?
# Esta fue la gran idea de Fisher:
# Encontrar qué tan difícil es obtener 8 correctas de 8 adivinando
# Pensemos en todas las posibles combinaciones de cómo le entregamos las tazas
2^8
## [1] 256
# Vemos que hay 256 diferentes combinaciones para poner a prueba a la catadora de té
# La probabilidad de obtener 8 de 8 correctas por azar
1/256
## [1] 0.00390625
# Si sabemos que es muy inusual obtener 8 de 8 correctas por azar,
# podríamos decir que tenemos evidencia de que la mujer parece
# detectar las diferencias en cómo se prepara el té
# Si la mujer está adivinando es como si lanzara una moneda
# Recordemos que vimos (en nuestra distribución normal) que
# es muy poco porobable de obtener 10 caras al lanzar 10 monedas
# P(H,H,H,H,H,H,H,H,H,H) = P(H)^10
0.5^10
## [1] 0.0009765625
# Ahora, veamos qué tan probable es adivinar por azar la
# taza correcta de té las 8 veces que se le puso a prueba
# C = correcta (0.05)
# I = incorrecta (0.05)
# P(C,C,C,C,C,C,C,C) = P(C)^8
prob_adivinar <- 0.5^8
prob_adivinar
## [1] 0.00390625
# Como vimos, la probabilidad de obtener 8 de 8 correctas por azar es
1/256
## [1] 0.00390625
# Sabemos que la probabilidad de que adivine 8 de 8 es 0.004
# Lo podemos ver en porcentaje
# El 0.4% del total o 100% de pruebas es probable que adivine 8 de 8
# Si queremos que ocurra una vez
# ¿Cuántos eventos tienen que ocurrir para que suceda una sola vez?
100/0.4
## [1] 250
# Si repetimos el experimento 250 veces es proable que en 1 de ellos
# se adivinen 8 de 8 tazas de forma correcta
# Es muy poco probable, pero no es imposible
# Recordemos que la función do() le podemos decir a R que realice una operación varias veces
# En este caso le pedimos que haga 250 veces el experimento de las 8 tazas
# C = correcta o Heads (0.05)
# I = incorrecta o Tails (0.05)
experimentos_tazas <- do(250) * rflip(8, prob = 0.5)
experimentos_tabla <- table(experimentos_tazas$heads)
experimentos_tabla
##
## 1 2 3 4 5 6 7
## 8 30 51 68 60 27 6
histogram(~ heads, experimentos_tazas,
breaks=-.5 + (0:10))

# Intervalo de Confianza (lo veremos después a detalle)
# Recordemos que la suma de todas las probabilidades debe dar 1
# IC = 1 - 95 = 5%
# 5% de probabilidad de que nuestros resultados se deben al azar
# p < 0.05
media_t <- mean(experimentos_tazas$heads)
media_t
## [1] 3.988
des_t <- sd(experimentos_tazas$heads)
des_t
## [1] 1.366501
media_t + (des_t * 2)
## [1] 6.721002
# IC = 1 - 99 = 1%
# 1% de probabilidad de que nuestros resultados se deben al azar
media_t + (des_t * 3)
## [1] 8.087503
#Entonces, ¿qué concluimos?
# Es posible que la mujer acierte 8 de 8 tazas adivinando
# pero no es muy probable
# La probabilidad de que suceda por azar es de 0.004 al realizar el experimento
# Y sabemos que esto significa que puede ocurrir 1 vez si lo repetimos 250 veces
# Entonces una de dos cosas debe ser cierta:
# La mujer tuvo inusualmente "suerte"
# La mujer NO está adivinando
# Por lo tanto, si la mujer obtiene 8 de 8 tazas correctas
# es muy poco probable que sus respuestas se deban al azar
# Si es poco probable que nuestro resultado ocurra por azar
# Entonces podemos rechazar H0
# Rechazamos la hipótesis nula
# H0 = La mujer no tiene la capacidad de distinguir las tazas de té
# Aunque Fisher no dijo cómo salió el experimento, otros han informado
# que la mujer correctamente identificó las 8 tazas!