Relaciones bivariadas.
Que dos variables estén asociadas no significa necesariamente que una sea causa de la otra.
Una relación causal entre dos variables requiere que ellas estén asociadas; pero no sucede a la inversa.
La estadística bivariada estudia la relación entre dos variables de una misma muestra o conjunto de datos.
Reflexiona sobre dos variables numéricas en las que pueda existir alguna relación en :
Ciencia Política
Relaciones Internacionales
Gestión Pública
¿Dónde está el caso que corresponde a un pasaje aéreo de 3500 millas y un costo de 220?
- DIAGRAMA DE DISPERSIÓN:
Rejilla bidimensional de las coordinadas de dos variables numérica X, Y.
- COORDENADA:
Punto en un diagrama de dispersión e el que se representan graficamente los valores de X y Y para un caso.
- PATRÓN LINEAL
Aquel en el que las coordenadas de un diagrama de dispersión caen en el patrón algargado que se aproxima a la forma de una recta.
¿Qué se puede observar (analizar) en un diagrama de dispersión?
Dispersión de los datos
Casos atípicos
Forma de la relación
(Si la relación es lineal) Direccionalidad de la relación (positiva o negativa)
Fuerza de la relación
¿Es posible representar más de dos variables en un diagrama de dispersión?
¿Es posible incluir una variable categórica en un diagrama de dispersión?
En ambos casos es sí.
La correlación es el cambio sistemático en las puntuaciones de dos variables numéricas.
El Coeficiente de Correlación Lineal de Pearson mide la dirección y la fuerza de la relación lineal que existe entre dos variables intervalares o cuantitativas.
Para que su cálculo tenga sentido, se requiere que las dos variables sean intervalares o cuantitativas.
Por lo general se le denota con una “r” minúscula.
La fórmula para calcular este coeficiente es la siguiente:
No hace distinción alguna entre variables explicativas (independientes) o variables de respuesta (dependientes)
Solo mide la fuerza de una relación lineal entre dos variables (e informa sobre la dirección de esta relación)
La correlación lineal no mide ni describe otros tipo de relaciones (por ejemplo, relaciones curvilíneas entre variables) aunque estas sean muy fuertes
Tiene valores entre -1 y +1. La fuerza de la relación lineal aumenta a medida que r se aleja de 0 y se acerca a -1 ó +1
r es positivo cuando existe una asociación positiva entre dos variables cuantitativas
r es negativo cuando existe una asociación negativa entre dos variables cuantitativas
Resumiendo …
- Cuando r = 0, no hay relación lineal entre las dos variables
- Cuando r = -1, existe una relación lineal negativa perfecta
- Cuando r = 1, existe una relación lineal positiva perfecta
No posee una unidad de medida y por lo tanto no varía cuando se cambian las unidades de medida de x, y, o de ambas variables (por ejemplo, si en vez de medir el peso en kilogramos se mide en libras o si en vez de medir la altura en centímetros se mide en pulgadas, el valor de r es el mismo)
El coeficiente se ve afectado por observaciones atípicas, al igual que con la media y la desviación típica o estándar
La correlación Rho-Spearman es la alternativa no paramétrica1 disponible para analizar si existe o no asociación entre dos variables intervalares o cuantitativas
Su interpretación es idéntica a la de la correlacion r de Pearson
Existen un conjunto de métodos que no requieren que los presupuestos de los métodos paramétricos. Estos métodos, llamados no paramétricos, son por lo general muy útiles cuando las muestras son pequeñas.