Realizar pruebas de significancia del coeficiente de correlación y el coeficiente la pendiente en modelos de regresión lineal simple.
Se construyen unos datos relacionados con el caso anterior de llamadas y ventas.
Se determina el coeficiente de correlación de Pearson rr
Se determina el valor del coeficiente de determinación r2r2
Se hace la prueba de significancia para determinar si la correlación estimada de una población es diferente de cero para rechazar o aceptar una hipótesis nula.
Se construye el modelo de regresión linea con la ecuación de mínimos cuadrados Y=a+bxY=a+bx
Se determinan los coeficiente aa y bb
Se hace una prueba de significancia para evaluar si el valor de la pendiente o valor de bb tiene un significado estadístico de manera tal que se pueda rechazar una hipótesis nula.
Como los datos provienen de una muestra es necesario contemplar pruebas de significancia para estimar parámetros poblacionales con los que se pueda confiar que las estadísticos son significativos.
Las pruebas de significancia implica determinar un valor de tt que van a ser comparados con valores críticos a partir de los cuantiles qt() de distribuciones t student a ciertos grados de libertar y con el nivel de confianza requerido.
De tal forma que se debe utilizar e interpretar en caso de que el valor de tt esté en una zona de confianza se acepta una hipótesis nula y si está fuera se rechaza la hipótesis nula y se acepta hipótesis alternativa.
Hay dos pruebas que se describen en este caso:
Prueba de significancia para correlación rr para saber si la correlación sería difenrete de cero en una población.
Prueba de significancia para la pendiente bb para saber si estadísticamente el valor de la pendiente de la recta de estimación en una regresión lineal simple es aceptada con valores de una población.
Code
Datos de llamadas que hacen vendedores y las ventas que realizan.
Code
## vendedores llamadas ventas
## 1 V1 96 41
## 2 V2 40 41
## 3 V3 104 51
## 4 V4 128 60
## 5 V5 164 61
## 6 V6 76 29
## 7 V7 72 39
## 8 V8 80 50
## 9 V9 36 28
## 10 V10 84 43
## 11 V11 180 70
## 12 V12 132 56
## 13 V13 120 45
## 14 V14 44 31
## 15 V15 84 30
r=SxySx⋅Syr=SxySx⋅Sy
Code
Code
## [1] 0.8646318
Significa elevar al cuadrado el coeficiente de correlación e interpretar que tanto afecta o representa la variable llamadas a la variable ventas.
coeficiente de determinación=r2coeficiente de determinación=r2
Code
## [1] 0.7475881
Se establecen hipótesis nula y alternativa con respecto al coeficiente de correlación.
La hipótesis nula H0H0 establece que el coeficiente de correlación en una población de donde proviene la muestra sería cero.
La hipótesis alternativa H1H1 establece que el coeficiente de correlación en una población de donde proviene la muestra sería diferente de cero.
La idea es demostrar y rechazar la H0H0
Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0
Utilizar funciones de la distribución t student para encontrar valores críticos de tt a un valor de confianza que puede ser 0.90,0.95,0.990.90,0.95,0.99.
Luego recordar que si se va a evaluar diferente de cero entonce el valor de alfa es: α=(1−confianza)/2α=(1−confianza)/2. A esto se le llama prueba de dos colas.
Se va a utilizar la función qt() para estimar los valores de t.critico.
Se debe calcular el valor de t con respecto a la correlación rr de la siguiente manera:
t=r⋅n−2−−−−−√1−r2−−−−−√t=r⋅n−21−r2
relvalordelacorrelación(n−2)gradosdelibertadrelvalordelacorrelación(n−2)gradosdelibertad
A partir de la fórmula
Code
## [1] 6.205089
Se toma un nivel de confianza al 95%95% usando la función de qt()
Code
## [1] 2.160369
Con la gráfica se ubica el valor de tt con respecto al valor de t.criticot.critico y se estima si está en una zona de aceptación rechazo para concluir que se acepta o se rechaza la H0H0.
Code
## NULL
El valor de t=6.205089t=6.205089 está muy a la derecha del valor crítico (no se visualiza por la escala) de t=2.160369t=2.160369 de tal forma que se entiende o interpreta que está en zona de rechazo.
Al estar en zona de rechazo (azul) se rechaza la H0H0 y se acepta H1H1
Entonces con esto se asegura y se prueba que el valor del coeficiente de correlación que se obtuvo de la muestra sería absolutamente diferente de cero en una población con un nivel de confianza del 95% .
Para evaluar es valor de una pendiente se tiene que construir un modelo de regresión lineal, en este caso sería bajo el modelo de la ecuación de mínimos cuadrados Y=a+bxY=a+bx , de la regresión lineal simple.
Con el modelo se determina el valor del coeficiente de l abcisa aa y el valor de la pendiente bb en la fórmula.
La prueba de significancia del valor de la pendiente bb
Se interpreta de que si este valor de la ecuación obtenido de una muestra tiene significado estadístico en una población y se pudiera utilizar en la fórmula para estimaciones.
Ahora bien, es necesario obtener el valor de t con la siguiente fórmula:
t=b−0Sb∴t=b−0Sb∴
Sb=(yi−Y)2(n−2)−−−−−−√(xi−x¯)2−−−−−−−√Sb=(yi−Y)2(n−2)(xi−x¯)2
Sb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendieneSb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendiene
Se construye el modelo
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Coefficients:
## (Intercept) llamadas
## 19.9800 0.2606
Code
Code
Se presentan una tabla con las columnas con los cálculos necesarios para determinar SbSb a partir de los valores xx e yy.
Code
| x | y | x.media | xi.menos.x.media | xi.menos.x.media.cuad | Y | y.menos.Y | y.menos.Y.cuad |
|---|---|---|---|---|---|---|---|
| 96 | 41 | 96 | 0 | 0 | 45 | -4.00000000000001 | 16.0000000 |
| 40 | 41 | 96 | -56 | 3136 | 30.405 | 10.595 | 112.2540250 |
| 104 | 51 | 96 | 8 | 64 | 47.085 | 3.915 | 15.3272250 |
| 128 | 60 | 96 | 32 | 1024 | 53.34 | 6.66 | 44.3556000 |
| 164 | 61 | 96 | 68 | 4624 | 62.7225 | -1.7225 | 2.9670063 |
| 76 | 29 | 96 | -20 | 400 | 39.7875 | -10.7875 | 116.3701563 |
| 72 | 39 | 96 | -24 | 576 | 38.745 | 0.255000000000003 | 0.0650250 |
| 80 | 50 | 96 | -16 | 256 | 40.83 | 9.17 | 84.0889000 |
| 36 | 28 | 96 | -60 | 3600 | 29.3625 | -1.3625 | 1.8564062 |
| 84 | 43 | 96 | -12 | 144 | 41.8725 | 1.1275 | 1.2712562 |
| 180 | 70 | 96 | 84 | 7056 | 66.8925 | 3.1075 | 9.6565563 |
| 132 | 56 | 96 | 36 | 1296 | 54.3825 | 1.6175 | 2.6163062 |
| 120 | 45 | 96 | 24 | 576 | 51.255 | -6.255 | 39.1250250 |
| 44 | 31 | 96 | -52 | 2704 | 31.4475 | -0.447499999999998 | 0.2002562 |
| 84 | 30 | 96 | -12 | 144 | 41.8725 | -11.8725 | 140.9562563 |
| * | * | * | 0 | 25600 | * | * | 587.1100000 |
De la tabla anterior se obtienen las sumatorias de (xi−x¯)(xi−x¯) y de (yi−Y)2(yi−Y)2. Las sumatorias de las columnas 5 y 8 de la tabla anterior renglón 16.
16,(5,8)16,(5,8)
Code
## [1] 25600
Code
## [1] 587.11
Ahora sólo calcular conforme a la fórmula el valor de SbSb y sería
Code
## [1] 0.04200182
Y calculando el valor de tt conforme a la fórmula sería:
Code
## llamadas
## 6.205089
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.873 -2.861 0.255 3.511 10.595
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.9800 4.3897 4.552 0.000544 ***
## llamadas 0.2606 0.0420 6.205 3.19e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared: 0.7476, Adjusted R-squared: 0.7282
## F-statistic: 38.5 on 1 and 13 DF, p-value: 3.193e-05
Los valores específicos incluyendo el valor de pp que es la probabilidad de las regiones en color azul más adelante visto en la gráfica.
Los asteriscos ‘***’ significan que los coeficientes son estadísticamente significativos a niveles de confianza 0.001, 0.01 o 0.05 y que si son útiles como predictores en la ecuación.
Code
## Estimate Std. Error t value Pr(>|t|)
## 0.2606250000 0.0420018172 6.2050886762 0.0000319277
Nivel de confianza del 95% con valor de t a una cola
H0:b≤0H1:b>0H0:b≤0H1:b>0
Code
## [1] 1.770933
Code
## NULL
Nivel de confianza del 95% con valor de t a dos colas
H0:b=0H1:b≠0H0:b=0H1:b≠0
Code
## [1] 2.160369
Code
## NULL
El valor de t está muy lejos a la derecha de los valores críticos.
Con estos valores de t comparados con cualquier valor de t.critico se interpreta que estos datos de la muestra a un 95% de nivel de confianza se debe rechazar la H0H0 y aceptar la H1H1 con lo cual se concluye que el valor de la pendiente si es un predictor significativo para la ecuación.
En este caso numero 24 generamos datos para utilizarlos en crear tablas y graficas donde determinamos la correlacion ,la prueba de significacia de esta misma ,del valor de la pendiente ,y modelo de regresion lineal ,hicimos calculos manuales utilizando diferente formulas y fuentes de informacion ,claro sacamos probabilidades ,calculamos lo que fue t de student mostrando la distribucion por medio de una grafica.
Caso 24.Prueba de Significancia de correlación y Prueba de Significancia de Pendiente Regresión
Realizar pruebas de significancia del coeficiente de correlación y el coeficiente la pendiente en modelos de regresión lineal simple.
Se construyen unos datos relacionados con el caso anterior de llamadas y ventas.
Se determina el coeficiente de correlación de Pearson rr
Se determina el valor del coeficiente de determinación r2r2
Se hace la prueba de significancia para determinar si la correlación estimada de una población es diferente de cero para rechazar o aceptar una hipótesis nula.
Se construye el modelo de regresión linea con la ecuación de mínimos cuadrados Y=a+bxY=a+bx
Se determinan los coeficiente aa y bb
Se hace una prueba de significancia para evaluar si el valor de la pendiente o valor de bb tiene un significado estadístico de manera tal que se pueda rechazar una hipótesis nula.
Como los datos provienen de una muestra es necesario contemplar pruebas de significancia para estimar parámetros poblacionales con los que se pueda confiar que las estadísticos son significativos.
Las pruebas de significancia implica determinar un valor de tt que van a ser comparados con valores críticos a partir de los cuantiles qt() de distribuciones t student a ciertos grados de libertar y con el nivel de confianza requerido.
De tal forma que se debe utilizar e interpretar en caso de que el valor de tt esté en una zona de confianza se acepta una hipótesis nula y si está fuera se rechaza la hipótesis nula y se acepta hipótesis alternativa.
Hay dos pruebas que se describen en este caso:
Prueba de significancia para correlación rr para saber si la correlación sería difenrete de cero en una población.
Prueba de significancia para la pendiente bb para saber si estadísticamente el valor de la pendiente de la recta de estimación en una regresión lineal simple es aceptada con valores de una población.
Code
Datos de llamadas que hacen vendedores y las ventas que realizan.
Code
## vendedores llamadas ventas
## 1 V1 96 41
## 2 V2 40 41
## 3 V3 104 51
## 4 V4 128 60
## 5 V5 164 61
## 6 V6 76 29
## 7 V7 72 39
## 8 V8 80 50
## 9 V9 36 28
## 10 V10 84 43
## 11 V11 180 70
## 12 V12 132 56
## 13 V13 120 45
## 14 V14 44 31
## 15 V15 84 30
r=SxySx⋅Syr=SxySx⋅Sy
Code
Code
## [1] 0.8646318
Significa elevar al cuadrado el coeficiente de correlación e interpretar que tanto afecta o representa la variable llamadas a la variable ventas.
coeficiente de determinación=r2coeficiente de determinación=r2
Code
## [1] 0.7475881
Se establecen hipótesis nula y alternativa con respecto al coeficiente de correlación.
La hipótesis nula H0H0 establece que el coeficiente de correlación en una población de donde proviene la muestra sería cero.
La hipótesis alternativa H1H1 establece que el coeficiente de correlación en una población de donde proviene la muestra sería diferente de cero.
La idea es demostrar y rechazar la H0H0
Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0
Utilizar funciones de la distribución t student para encontrar valores críticos de tt a un valor de confianza que puede ser 0.90,0.95,0.990.90,0.95,0.99.
Luego recordar que si se va a evaluar diferente de cero entonce el valor de alfa es: α=(1−confianza)/2α=(1−confianza)/2. A esto se le llama prueba de dos colas.
Se va a utilizar la función qt() para estimar los valores de t.critico.
Se debe calcular el valor de t con respecto a la correlación rr de la siguiente manera:
t=r⋅n−2−−−−−√1−r2−−−−−√t=r⋅n−21−r2
relvalordelacorrelación(n−2)gradosdelibertadrelvalordelacorrelación(n−2)gradosdelibertad
A partir de la fórmula
Code
## [1] 6.205089
Se toma un nivel de confianza al 95%95% usando la función de qt()
Code
## [1] 2.160369
Con la gráfica se ubica el valor de tt con respecto al valor de t.criticot.critico y se estima si está en una zona de aceptación rechazo para concluir que se acepta o se rechaza la H0H0.
Code
## NULL
El valor de t=6.205089t=6.205089 está muy a la derecha del valor crítico (no se visualiza por la escala) de t=2.160369t=2.160369 de tal forma que se entiende o interpreta que está en zona de rechazo.
Al estar en zona de rechazo (azul) se rechaza la H0H0 y se acepta H1H1
Entonces con esto se asegura y se prueba que el valor del coeficiente de correlación que se obtuvo de la muestra sería absolutamente diferente de cero en una población con un nivel de confianza del 95% .
Para evaluar es valor de una pendiente se tiene que construir un modelo de regresión lineal, en este caso sería bajo el modelo de la ecuación de mínimos cuadrados Y=a+bxY=a+bx , de la regresión lineal simple.
Con el modelo se determina el valor del coeficiente de l abcisa aa y el valor de la pendiente bb en la fórmula.
La prueba de significancia del valor de la pendiente bb
Se interpreta de que si este valor de la ecuación obtenido de una muestra tiene significado estadístico en una población y se pudiera utilizar en la fórmula para estimaciones.
Ahora bien, es necesario obtener el valor de t con la siguiente fórmula:
t=b−0Sb∴t=b−0Sb∴
Sb=(yi−Y)2(n−2)−−−−−−√(xi−x¯)2−−−−−−−√Sb=(yi−Y)2(n−2)(xi−x¯)2
Sb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendieneSb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendiene
Se construye el modelo
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Coefficients:
## (Intercept) llamadas
## 19.9800 0.2606
Code
Code
Se presentan una tabla con las columnas con los cálculos necesarios para determinar SbSb a partir de los valores xx e yy.
Code
| x | y | x.media | xi.menos.x.media | xi.menos.x.media.cuad | Y | y.menos.Y | y.menos.Y.cuad |
|---|---|---|---|---|---|---|---|
| 96 | 41 | 96 | 0 | 0 | 45 | -4.00000000000001 | 16.0000000 |
| 40 | 41 | 96 | -56 | 3136 | 30.405 | 10.595 | 112.2540250 |
| 104 | 51 | 96 | 8 | 64 | 47.085 | 3.915 | 15.3272250 |
| 128 | 60 | 96 | 32 | 1024 | 53.34 | 6.66 | 44.3556000 |
| 164 | 61 | 96 | 68 | 4624 | 62.7225 | -1.7225 | 2.9670063 |
| 76 | 29 | 96 | -20 | 400 | 39.7875 | -10.7875 | 116.3701563 |
| 72 | 39 | 96 | -24 | 576 | 38.745 | 0.255000000000003 | 0.0650250 |
| 80 | 50 | 96 | -16 | 256 | 40.83 | 9.17 | 84.0889000 |
| 36 | 28 | 96 | -60 | 3600 | 29.3625 | -1.3625 | 1.8564062 |
| 84 | 43 | 96 | -12 | 144 | 41.8725 | 1.1275 | 1.2712562 |
| 180 | 70 | 96 | 84 | 7056 | 66.8925 | 3.1075 | 9.6565563 |
| 132 | 56 | 96 | 36 | 1296 | 54.3825 | 1.6175 | 2.6163062 |
| 120 | 45 | 96 | 24 | 576 | 51.255 | -6.255 | 39.1250250 |
| 44 | 31 | 96 | -52 | 2704 | 31.4475 | -0.447499999999998 | 0.2002562 |
| 84 | 30 | 96 | -12 | 144 | 41.8725 | -11.8725 | 140.9562563 |
| * | * | * | 0 | 25600 | * | * | 587.1100000 |
De la tabla anterior se obtienen las sumatorias de (xi−x¯)(xi−x¯) y de (yi−Y)2(yi−Y)2. Las sumatorias de las columnas 5 y 8 de la tabla anterior renglón 16.
16,(5,8)16,(5,8)
Code
## [1] 25600
Code
## [1] 587.11
Ahora sólo calcular conforme a la fórmula el valor de SbSb y sería
Code
## [1] 0.04200182
Y calculando el valor de tt conforme a la fórmula sería:
Code
## llamadas
## 6.205089
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.873 -2.861 0.255 3.511 10.595
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.9800 4.3897 4.552 0.000544 ***
## llamadas 0.2606 0.0420 6.205 3.19e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared: 0.7476, Adjusted R-squared: 0.7282
## F-statistic: 38.5 on 1 and 13 DF, p-value: 3.193e-05
Los valores específicos incluyendo el valor de pp que es la probabilidad de las regiones en color azul más adelante visto en la gráfica.
Los asteriscos ‘***’ significan que los coeficientes son estadísticamente significativos a niveles de confianza 0.001, 0.01 o 0.05 y que si son útiles como predictores en la ecuación.
Code
## Estimate Std. Error t value Pr(>|t|)
## 0.2606250000 0.0420018172 6.2050886762 0.0000319277
Nivel de confianza del 95% con valor de t a una cola
H0:b≤0H1:b>0H0:b≤0H1:b>0
Code
## [1] 1.770933
Code
## NULL
Nivel de confianza del 95% con valor de t a dos colas
H0:b=0H1:b≠0H0:b=0H1:b≠0
Code
## [1] 2.160369
Code
## NULL
El valor de t está muy lejos a la derecha de los valores críticos.
Con estos valores de t comparados con cualquier valor de t.critico se interpreta que estos datos de la muestra a un 95% de nivel de confianza se debe rechazar la H0H0 y aceptar la H1H1 con lo cual se concluye que el valor de la pendiente si es un predictor significativo para la ecuación.
En este caso numero 24 generamos datos para utilizarlos en crear tablas y graficas donde determinamos la correlacion ,la prueba de significacia de esta misma ,del valor de la pendiente ,y modelo de regresion lineal ,hicimos calculos manuales utilizando diferente formulas y fuentes de informacion ,claro sacamos probabilidades ,calculamos lo que fue t de student mostrando la distribucion por medio de una grafica.
Caso 24.Prueba de Significancia de correlación y Prueba de Significancia de Pendiente Regresión
Realizar pruebas de significancia del coeficiente de correlación y el coeficiente la pendiente en modelos de regresión lineal simple.
Se construyen unos datos relacionados con el caso anterior de llamadas y ventas.
Se determina el coeficiente de correlación de Pearson rr
Se determina el valor del coeficiente de determinación r2r2
Se hace la prueba de significancia para determinar si la correlación estimada de una población es diferente de cero para rechazar o aceptar una hipótesis nula.
Se construye el modelo de regresión linea con la ecuación de mínimos cuadrados Y=a+bxY=a+bx
Se determinan los coeficiente aa y bb
Se hace una prueba de significancia para evaluar si el valor de la pendiente o valor de bb tiene un significado estadístico de manera tal que se pueda rechazar una hipótesis nula.
Como los datos provienen de una muestra es necesario contemplar pruebas de significancia para estimar parámetros poblacionales con los que se pueda confiar que las estadísticos son significativos.
Las pruebas de significancia implica determinar un valor de tt que van a ser comparados con valores críticos a partir de los cuantiles qt() de distribuciones t student a ciertos grados de libertar y con el nivel de confianza requerido.
De tal forma que se debe utilizar e interpretar en caso de que el valor de tt esté en una zona de confianza se acepta una hipótesis nula y si está fuera se rechaza la hipótesis nula y se acepta hipótesis alternativa.
Hay dos pruebas que se describen en este caso:
Prueba de significancia para correlación rr para saber si la correlación sería difenrete de cero en una población.
Prueba de significancia para la pendiente bb para saber si estadísticamente el valor de la pendiente de la recta de estimación en una regresión lineal simple es aceptada con valores de una población.
Code
Datos de llamadas que hacen vendedores y las ventas que realizan.
Code
## vendedores llamadas ventas
## 1 V1 96 41
## 2 V2 40 41
## 3 V3 104 51
## 4 V4 128 60
## 5 V5 164 61
## 6 V6 76 29
## 7 V7 72 39
## 8 V8 80 50
## 9 V9 36 28
## 10 V10 84 43
## 11 V11 180 70
## 12 V12 132 56
## 13 V13 120 45
## 14 V14 44 31
## 15 V15 84 30
r=SxySx⋅Syr=SxySx⋅Sy
Code
Code
## [1] 0.8646318
Significa elevar al cuadrado el coeficiente de correlación e interpretar que tanto afecta o representa la variable llamadas a la variable ventas.
coeficiente de determinación=r2coeficiente de determinación=r2
Code
## [1] 0.7475881
Se establecen hipótesis nula y alternativa con respecto al coeficiente de correlación.
La hipótesis nula H0H0 establece que el coeficiente de correlación en una población de donde proviene la muestra sería cero.
La hipótesis alternativa H1H1 establece que el coeficiente de correlación en una población de donde proviene la muestra sería diferente de cero.
La idea es demostrar y rechazar la H0H0
Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0Hipótesis nula:H0:Correlación=0Hipótesis alternativa:H1:Correlación≠0
Utilizar funciones de la distribución t student para encontrar valores críticos de tt a un valor de confianza que puede ser 0.90,0.95,0.990.90,0.95,0.99.
Luego recordar que si se va a evaluar diferente de cero entonce el valor de alfa es: α=(1−confianza)/2α=(1−confianza)/2. A esto se le llama prueba de dos colas.
Se va a utilizar la función qt() para estimar los valores de t.critico.
Se debe calcular el valor de t con respecto a la correlación rr de la siguiente manera:
t=r⋅n−2−−−−−√1−r2−−−−−√t=r⋅n−21−r2
relvalordelacorrelación(n−2)gradosdelibertadrelvalordelacorrelación(n−2)gradosdelibertad
A partir de la fórmula
Code
## [1] 6.205089
Se toma un nivel de confianza al 95%95% usando la función de qt()
Code
## [1] 2.160369
Con la gráfica se ubica el valor de tt con respecto al valor de t.criticot.critico y se estima si está en una zona de aceptación rechazo para concluir que se acepta o se rechaza la H0H0.
Code
## NULL
El valor de t=6.205089t=6.205089 está muy a la derecha del valor crítico (no se visualiza por la escala) de t=2.160369t=2.160369 de tal forma que se entiende o interpreta que está en zona de rechazo.
Al estar en zona de rechazo (azul) se rechaza la H0H0 y se acepta H1H1
Entonces con esto se asegura y se prueba que el valor del coeficiente de correlación que se obtuvo de la muestra sería absolutamente diferente de cero en una población con un nivel de confianza del 95% .
Para evaluar es valor de una pendiente se tiene que construir un modelo de regresión lineal, en este caso sería bajo el modelo de la ecuación de mínimos cuadrados Y=a+bxY=a+bx , de la regresión lineal simple.
Con el modelo se determina el valor del coeficiente de l abcisa aa y el valor de la pendiente bb en la fórmula.
La prueba de significancia del valor de la pendiente bb
Se interpreta de que si este valor de la ecuación obtenido de una muestra tiene significado estadístico en una población y se pudiera utilizar en la fórmula para estimaciones.
Ahora bien, es necesario obtener el valor de t con la siguiente fórmula:
t=b−0Sb∴t=b−0Sb∴
Sb=(yi−Y)2(n−2)−−−−−−√(xi−x¯)2−−−−−−−√Sb=(yi−Y)2(n−2)(xi−x¯)2
Sb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendieneSb es el error estándar de la estimación de la pendiente o varianza de residuosb es el valor de la pendiene
Se construye el modelo
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Coefficients:
## (Intercept) llamadas
## 19.9800 0.2606
Code
Code
Se presentan una tabla con las columnas con los cálculos necesarios para determinar SbSb a partir de los valores xx e yy.
Code
| x | y | x.media | xi.menos.x.media | xi.menos.x.media.cuad | Y | y.menos.Y | y.menos.Y.cuad |
|---|---|---|---|---|---|---|---|
| 96 | 41 | 96 | 0 | 0 | 45 | -4.00000000000001 | 16.0000000 |
| 40 | 41 | 96 | -56 | 3136 | 30.405 | 10.595 | 112.2540250 |
| 104 | 51 | 96 | 8 | 64 | 47.085 | 3.915 | 15.3272250 |
| 128 | 60 | 96 | 32 | 1024 | 53.34 | 6.66 | 44.3556000 |
| 164 | 61 | 96 | 68 | 4624 | 62.7225 | -1.7225 | 2.9670063 |
| 76 | 29 | 96 | -20 | 400 | 39.7875 | -10.7875 | 116.3701563 |
| 72 | 39 | 96 | -24 | 576 | 38.745 | 0.255000000000003 | 0.0650250 |
| 80 | 50 | 96 | -16 | 256 | 40.83 | 9.17 | 84.0889000 |
| 36 | 28 | 96 | -60 | 3600 | 29.3625 | -1.3625 | 1.8564062 |
| 84 | 43 | 96 | -12 | 144 | 41.8725 | 1.1275 | 1.2712562 |
| 180 | 70 | 96 | 84 | 7056 | 66.8925 | 3.1075 | 9.6565563 |
| 132 | 56 | 96 | 36 | 1296 | 54.3825 | 1.6175 | 2.6163062 |
| 120 | 45 | 96 | 24 | 576 | 51.255 | -6.255 | 39.1250250 |
| 44 | 31 | 96 | -52 | 2704 | 31.4475 | -0.447499999999998 | 0.2002562 |
| 84 | 30 | 96 | -12 | 144 | 41.8725 | -11.8725 | 140.9562563 |
| * | * | * | 0 | 25600 | * | * | 587.1100000 |
De la tabla anterior se obtienen las sumatorias de (xi−x¯)(xi−x¯) y de (yi−Y)2(yi−Y)2. Las sumatorias de las columnas 5 y 8 de la tabla anterior renglón 16.
16,(5,8)16,(5,8)
Code
## [1] 25600
Code
## [1] 587.11
Ahora sólo calcular conforme a la fórmula el valor de SbSb y sería
Code
## [1] 0.04200182
Y calculando el valor de tt conforme a la fórmula sería:
Code
## llamadas
## 6.205089
Code
##
## Call:
## lm(formula = ventas ~ llamadas, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.873 -2.861 0.255 3.511 10.595
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 19.9800 4.3897 4.552 0.000544 ***
## llamadas 0.2606 0.0420 6.205 3.19e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 6.72 on 13 degrees of freedom
## Multiple R-squared: 0.7476, Adjusted R-squared: 0.7282
## F-statistic: 38.5 on 1 and 13 DF, p-value: 3.193e-05
Los valores específicos incluyendo el valor de pp que es la probabilidad de las regiones en color azul más adelante visto en la gráfica.
Los asteriscos ‘***’ significan que los coeficientes son estadísticamente significativos a niveles de confianza 0.001, 0.01 o 0.05 y que si son útiles como predictores en la ecuación.
Code
## Estimate Std. Error t value Pr(>|t|)
## 0.2606250000 0.0420018172 6.2050886762 0.0000319277
Nivel de confianza del 95% con valor de t a una cola
H0:b≤0H1:b>0H0:b≤0H1:b>0
Code
## [1] 1.770933
Code
## NULL
Nivel de confianza del 95% con valor de t a dos colas
H0:b=0H1:b≠0H0:b=0H1:b≠0
Code
## [1] 2.160369
Code
## NULL
El valor de t está muy lejos a la derecha de los valores críticos.
Con estos valores de t comparados con cualquier valor de t.critico se interpreta que estos datos de la muestra a un 95% de nivel de confianza se debe rechazar la H0H0 y aceptar la H1H1 con lo cual se concluye que el valor de la pendiente si es un predictor significativo para la ecuación.
En este caso generamos datos para utilizarlos en crear tablas y graficas donde determinamos la correlacion ,la prueba de significacia de esta misma ,del valor de la pendiente ,y modelo de regresion lineal ,hicimos calculos manuales utilizando diferente formulas y fuentes de informacion ,claro sacamos probabilidades ,calculamos lo que fue t de student mostrando la distribucion por medio de una grafica.
esto nos ayudo mucho a ver de mejor manera las graficas de tal manera que manejamos la informacion y formulas para asi determinar la probabilidad y calculo ya como se muestra en este caso la correlacion.