Dispersión, correlación y regresión de horas lugar videojuego

Rubén Pizarro Gurrola

Objetivo

Construir diagrama de dispersión, calcular correlación de Pearson y construir regesión y hacer predicciones

Desarrollo

Cargar librerías

library(ggplot2)
library(readr)
library(dplyr)
library(knitr)
library(DT)
library(mosaic)
library(PerformanceAnalytics) # Para correlaciones gráficas

Cargar datos

datos <- read.csv("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/datos/datos_horas_juegos_lugar_videojuegos.csv")
datos
    horas_juego lugar categoria
1          2397   210         B
2          2049   490         C
3          2196   374         B
4          1300   812         E
5          1617   766         D
6          1662   713         D
7          1519   920         E
8          2631   189         A
9          1910   593         C
10         1552   807         E
11         1413   978         E
12         1576   725         D
13         1969   499         C
14         2309   270         B
15         2174   264         B
16         1916   455         C
17         1189   920         E
18         1936   544         C
19         1546   989         E
20         2170   265         B
21         2094   410         C
22         1912   594         C
23         1749   625         D
24         2324   321         B
25         1758   649         D
26         2654    29         A
27         1689   606         D
28         1648   702         D
29         1167   938         E
30         3574   109         A
31         2563   145         A
32         2673    41         A
33         2500     9         A
34         2142   233         B
35         1960   534         C
36         2161   374         B
37         2755   110         A
38         1928   589         C
39         1746   743         D
40         1591   628         D
41         1948   571         C
42         1365   938         E
43         2154   349         B
44         1999   447         C
45         3115    40         A
46         1888   566         C
47         2519     2         A
48         1960   497         C
49         1851   670         D
50         2738    48         A
51         1044   853         E
52         2218   239         B
53         1701   679         D
54         1922   587         C
55         2202   313         B
56         3103   146         A
57         1617   652         D
58         2262   395         B
59         2312   290         B
60         2179   368         B
61         2014   453         C
62         2014   452         C
63          985   853         E
64         2265   265         B
65         2640   195         A
66         1841   681         D
67         1949   490         C
68         1632   747         D
69         2676    90         A
70         2050   481         C
71         2773   165         A
72         2755   102         A
73         2793    99         A
74         1731   691         D
75         1988   424         C
76         1395   805         E
77         1940   573         C
78         1915   577         C
79         1741   747         D
80         1779   678         D
81         2114   486         C
82         2275   332         B
83         1433   973         E
84         2448    55         A
85         1975   589         C
86         1816   688         D
87         1452   955         E
88         1803   627         D
89         2405   325         B
90         1796   636         D
91         1975   401         C
92         1848   790         D
93         1842   613         D
94         2707   190         A
95         1959   490         C
96         2008   450         C
97         1115   919         E
98         2129   235         B
99         2668     5         A
100        1522   911         E
101        1939   449         C
102        1695   662         D
103        2460    72         A
104        1998   430         C
105        2384   382         B
106        1880   581         C
107        1895   563         C
108        1876   439         C
109        1306   892         E
110        2369   365         B
111        2103   582         C
112        2257   271         B
113        1911   530         C
114        2009   417         C
115        3102   101         A
116        2137   306         B
117        1212   935         E
118        2470    33         A
119        3374   152         A
120        1625   785         D
121        2119   252         B
122        1742   671         D
123        1682   783         D
124        2529    38         A
125        2144   368         B
126        2525   172         A
127        2194   205         B
128        2029   490         C
129        2582     2         A
130        1123   841         E
131        1486   970         E
132        2862   149         A
133        2325   291         B
134        1595   718         D
135        2001   593         C
136        2838   189         A
137        1174   857         E
138        2128   329         B
139        1237   925         E
140        1874   498         C
141        2404   357         B
142        2384   332         B
143        1873   518         C
144        1076   859         E
145        1592   735         D
146        1916   588         C
147        2405   253         B
148        1592   720         D
149        1863   582         C
150        1365   971         E
151        1816   733         D
152        2101   437         C
153        2840   143         A
154        1832   665         D
155        2396   280         B
156         819   991         E
157        2345   221         B
158        1930   464         C
159         676   978         E
160        2918   172         A
161        1634   621         D
162        1994   474         C
163        2576   183         A
164        1038   948         E
165        1888   401         C
166        1700   695         D
167        1632   739         D
168        1743   674         D
169        1420   910         E
170        1326   917         E
171        2043   548         C
172        2992   105         A
173        2231   325         B
174        1749   625         D
175        1986   513         C
176        1900   475         C
177        2280   280         B
178        1312   813         E
179        1775   698         D
180        2551    13         A
181        1468   880         E
182        1532   852         E
183        1716   727         D
184        2132   269         B
185        1276   899         E
186         605   929         E
187        1878   567         C
188        2642    51         A
189        3138   200         A
190        3001    54         A
191        2059   471         C
192        1715   643         D
193        1423   815         E
194        3101   127         A
195        1984   591         C
196        2468   141         A
197        1539   805         E
198        1785   740         D
199        2733   143         A
200        1978   472         C
201        1777   643         D
202        1951   402         C
203        1352   816         E
204        1614   644         D
205        2343   355         B
206        1628   631         D
207        1553   886         E
208        1619   720         D
209        2528   106         A
210        1961   442         C
211        1615   656         D
212        2334   298         B
213        3398    14         A
214        1563   934         E
215        2088   446         C
216        2284   386         B
217        1866   415         C
218        1459   802         E
219        1815   691         D
220        2107   480         C
221        1884   464         C
222        2197   250         B
223        1737   663         D
224        1799   791         D
225        1898   482         C
226        1533   941         E
227        1756   763         D
228        1468   895         E
229        2859    43         A
230        1708   609         D
231        1824   653         D
232        2334   357         B
233         796   845         E
234        1305   817         E
235        2602     2         A
236        1494   927         E
237        2324   259         B
238        1887   497         C
239        2619   191         A
240        1092   957         E
241        1515   832         E
242        2428   103         A
243        1447   897         E
244        2266   394         B
245        1748   642         D
246        1665   621         D
247        1143   886         E
248        1966   581         C
249        2741   191         A
250        1570   946         E
251        1603   644         D
252        1261   992         E
253        2146   247         B
254        1740   739         D
255        1593   777         D
256        1871   466         C
257        2010   479         C
258        1911   553         C
259        2064   472         C
260        2675   162         A
261        2705   101         A
262        1421   893         E
263        3180    62         A
264        2088   482         C
265        2267   244         B
266        1821   674         D
267        2097   567         C
268        1881   596         C
269        1962   581         C
270        1630   602         D
271        2674   133         A
272        1213   914         E
273        1796   770         D
274        2219   303         B
275        3075    26         A
276        2426   183         A
277        2268   337         B
278        1954   440         C
279        2580   106         A
280        2416     8         A
281        2072   520         C
282        1808   726         D
283        2257   292         B
284        1775   687         D
285        1865   446         C
286        2324   351         B
287         793   893         E
288        1678   777         D
289        1719   766         D
290        1773   761         D
291        1915   403         C
292         749   818         E
293        2264   308         B
294        2138   249         B
295        1579   752         D
296        1954   413         C
297        1690   639         D
298        2045   536         C
299        2233   240         B
300        2648   176         A
301        1708   641         D
302        2034   589         C
303        2184   250         B
304        1932   513         C
305        3204    16         A
306        2593    96         A
307        1472   929         E
308        1588   692         D
309        2208   345         B
310        1419   988         E
311        2054   413         C
312        1677   724         D
313        2337   300         B
314        1848   731         D
315        2856   116         A
316        1510   871         E
317        2332   345         B
318        2028   599         C
319        2168   232         B
320        2450    35         A
321         992   992         E
322        2513    58         A
323        2997   150         A
324        2280   379         B
325        1658   654         D
326        2266   312         B
327        1673   629         D
328        1705   759         D
329        1080  1000         E
330         990   918         E
331        2848   146         A
332        2196   252         B
333        1606   692         D
334        2728   165         A
335        2946   110         A
336        1833   666         D
337        1062   996         E
338        2456   142         A
339        2095   518         C
340        2778    48         A
341        1972   591         C
342        2082   503         C
343        1963   583         C
344        1233   998         E
345        2479    69         A
346        2131   214         B
347        2272   316         B
348        1496   918         E
349        2064   522         C
350        1543   888         E
351        2280   330         B
352        1703   746         D
353        2105   471         C
354        2074   441         C
355        2267   244         B
356        2824   180         A
357        1953   423         C
358        1967   402         C
359        2676    56         A
360        2623    71         A
361        1728   760         D
362        1639   744         D
363        1485   843         E
364        1126   827         E
365        2245   307         B
366        1830   690         D
367        1556   872         E
368        2219   398         B
369        2814    99         A
370        1804   800         D
371        1925   504         C
372        1334   984         E
373        1508   975         E
374        1381   906         E
375        2103   524         C
376        1548   804         E
377        1784   650         D
378        1827   657         D
379        2388   267         B
380        2273   221         B
381        2022   503         C
382        1960   441         C
383        2713   171         A
384        1798   680         D
385        2074   467         C
386        1808   772         D
387        1950   594         C
388         911   856         E
389        2737   169         A
390        1323   915         E
391        1535   917         E
392        2033   456         C
393        1462   900         E
394        2312   290         B
395        2702    73         A
396        1771   623         D
397        1840   659         D
398        2163   369         B
399        2568    88         A
400        1392   984         E
401        1751   743         D
402        2553    41         A
403        2408   332         B
404        2787   118         A
405        2025   436         C
406        1352   874         E
407        1489   963         E
408        1225   859         E
409        2640    68         A
410        2402   395         B
411         782   852         E
412        1443   965         E
413        2134   395         B
414        1585   786         D
415        2327   322         B
416        1320   866         E
417        1609   697         D
418        1161   883         E
419        2341   263         B
420        1969   532         C
421        2013   537         C
422        3038    13         A
423        1179   937         E
424        1859   648         D
425        1882   590         C
426        2260   308         B
427        1763   700         D
428        1574   655         D
429        1820   719         D
430        1552   847         E
431        3086    83         A
432        1369   932         E
433        1257   955         E
434        2302   328         B
435        1602   747         D
436        2395   332         B
437        1224   815         E
438        1778   798         D
439        2162   353         B
440         785   817         E
441        2885   198         A
442        1883   542         C
443        1574   688         D
444        2066   574         C
445        1657   754         D
446        1930   537         C
447         967   928         E
448        2052   436         C
449        1271   918         E
450        2410   211         B
451        1249   895         E
452        1434   899         E
453        1616   730         D
454        2501    39         A
455        2095   466         C
456        2128   393         B
457        2955    66         A
458        1467   900         E
459        2093   481         C
460        2067   451         C
461        2103   582         C
462        2385   235         B
463        1939   520         C
464        1407   982         E
465        2168   242         B
466        1660   739         D
467        2318   276         B
468        1854   660         D
469        2203   339         B
470         664   828         E
471        1399   877         E
472        3164   193         A
473        1044   802         E
474        1739   783         D
475        2040   401         C
476        2365   244         B
477        1322   954         E
478        2539   151         A
479        2304   208         B
480        1789   725         D
481        1958   583         C
482        1845   641         D
483        1842   782         D
484        1690   639         D
485        2298   340         B
486        3047    16         A
487        1867   468         C
488        2577    22         A
489        2488    23         A
490        2356   204         B
491        2771   180         A
492        1492   811         E
493        2134   371         B
494        1633   601         D
495        1759   670         D
496        2144   283         B
497        2402   348         B
498         937   899         E
499        2063   423         C
500        2281   221         B
501        2616   114         A
502        1347   825         E
503        1625   732         D
504        1930   508         C
505        2274   380         B
506        1444   841         E
507        1719   734         D
508        1741   628         D
509        1488   926         E
510        1428   975         E
511        1399   995         E
512        2058   559         C
513         777   913         E
514        3140   139         A
515        2053   575         C
516        2634    88         A
517        2008   420         C
518        1481   924         E
519        2039   570         C
520        1732   652         D
521        2137   285         B
522        2018   589         C
523        2191   232         B
524        1793   665         D
525        2450    21         A
526        2140   296         B
527        1929   552         C
528        2070   559         C
529        1616   622         D
530        1877   499         C
531        2400   351         B
532        2030   455         C
533        1858   674         D
534        1276   854         E
535        1938   525         C
536        2608   118         A
537        2399   378         B
538        2210   260         B
539        1637   755         D
540        2604    76         A
541        2793   136         A
542        2680    30         A
543        1835   706         D
544        1257   948         E
545        1855   696         D
546        1416   912         E
547        2303   201         B
548        2358   349         B
549        1767   706         D
550        2804   178         A
551        2646   127         A
552        2000   425         C
553        2319   231         B
554         777   907         E
555        2342   265         B
556        2186   397         B
557        1898   482         C
558        2046   419         C
559        1378   921         E
560        1472   978         E
561        2338   302         B
562        3184    39         A
563        2090   472         C
564        1625   676         D
565        1947   595         C
566        2029   412         C
567        2219   290         B
568        1860   659         D
569        1904   401         C
570        2421   145         A
571        1946   505         C
572        1674   798         D
573        2080   582         C
574        2065   458         C
575        1202   985         E
576        1718   607         D
577        1780   605         D
578        1808   746         D
579        2215   220         B
580        2668   174         A
581        2038   543         C
582        1041   862         E
583        2193   345         B
584        1254   948         E
585        2357   352         B
586        2144   342         B
587        1925   424         C
588        2307   349         B
589         767   916         E
590        2253   206         B
591        2315   334         B
592        2076   402         C
593        1908   476         C
594        1751   724         D
595        1171   935         E
596        2606   133         A
597        2265   295         B
598        1882   569         C
599        2533   132         A
600        1998   410         C
601        2331   343         B
602        1528   962         E
603        1489   873         E
604        2142   300         B
605        2307   256         B
606        2838   128         A
607        2356   397         B
608        1548   899         E
609        2684   135         A
610        3008     2         A
611        2107   473         C
612        2287   357         B
613        1856   665         D
614        2315   303         B
615        1386   820         E
616        1504   885         E
617        2073   512         C
618        1487   977         E
619        2244   230         B
620        2093   548         C
621        2612   134         A
622        1840   659         D
623        2561   149         A
624        1261   910         E
625        2161   326         B
626        1931   594         C
627        1138   951         E
628        2028   438         C
629        1845   641         D
630        1734   657         D
631        2087   493         C
632        2132   246         B
633        2423   107         A
634        1970   576         C
635        2394   293         B
636        1804   605         D
637        1633   708         D
638        2700   167         A
639        1096   943         E
640        1849   712         D
641        2611    32         A
642        2391   329         B
643        1951   450         C
644        2641   136         A
645        3103   146         A
646        2250   358         B
647        2134   242         B
648        2530    28         A
649        1819   729         D
650        1116   969         E
651        1359   980         E
652        2756   107         A
653        1915   566         C
654        2182   320         B
655        2630    37         A
656        1818   723         D
657        2918    27         A
658        1520   886         E
659        1700   757         D
660         813   847         E
661        2355   296         B
662        1494   925         E
663        2089   447         C
664        2404   214         B
665        2170   388         B
666        1845   783         D
667        2251   359         B
668        1672   767         D
669        1922   524         C
670        1535   964         E
671        1954   477         C
672        2490   161         A
673        2366   361         B
674        1714   774         D
675        2002   567         C
676        2063   564         C
677        2329   340         B
678        2145   254         B
679        2057   583         C
680        2045   495         C
681        2108   574         C
682        1848   638         D
683        2483   133         A
684        1740   762         D
685        2586    75         A
686        2216   338         B
687        1311   831         E
688        2008   404         C
689        1468   895         E
690        2530    77         A
691        2370   221         B
692        1114   901         E
693        1897   567         C
694        2487   190         A
695        2425   100         A
696        2872    45         A
697        2793   136         A
698        1810   687         D
699        1464   849         E
700        2070   463         C
701        2160   352         B
702        2240   271         B
703        1496   827         E
704        1942   445         C
705        2304   318         B
706        2892    12         A
707        1360   986         E
708        1498   897         E
709        1087   875         E
710        1211   959         E
711        1590   619         D
712        1816   678         D
713        2289   313         B
714        1823   682         D
715        1643   738         D
716        1935   404         C
717        2048   598         C
718        2215   258         B
719        1535   836         E
720        1919   487         C
721        1928   568         C
722        1465   804         E
723        2016   511         C
724        2578   166         A
725        2030   455         C
726        1489   853         E
727        2561   154         A
728        1803   685         D
729        2429    73         A
730        2001   499         C
731        1751   743         D
732        1668   698         D
733        1518   879         E
734        2074   416         C
735        2173   393         B
736        2168   229         B
737        1996   575         C
738        2397   210         B
739        1762   649         D
740        2326   363         B
741        2421    36         A
742        1887   546         C
743        3088    58         A
744        2222   287         B
745        1795   774         D
746        2035   513         C
747        2778    20         A
748        2713   171         A
749        2393   308         B
750        2500     5         A

Funciones preparadas

source("https://raw.githubusercontent.com/rpizarrog/probabilidad-y-estad-stica/master/2023/funciones/funciones%20para%20dispersion%20correlacion%20regresion.R", encoding = "UTF-8")

Diagrama de dispersión

f_diag.dispersion(datos)

Covarianza

datos_uso <- datos[,1:2]
cov(datos_uso)
            horas_juego      lugar
horas_juego    246522.7 -129333.75
lugar         -129333.8   79451.91

Correlación de Pearson

cor(datos_uso)
            horas_juego      lugar
horas_juego   1.0000000 -0.9241261
lugar        -0.9241261  1.0000000

Correlación con graph

chart.Correlation(datos_uso, histogram = TRUE)

Significado correlación r

  • -0.90 = Correlación negativa muy fuerte.
  • -0.75 = Correlación negativa considerable.
  • -0.50 = Correlación negativa media.
  • -0.25 = Correlación negativa débil.
  • -0.10 = Correlación negativa muy débil.
  • 0.00 = No existe correlación alguna entre las variables.
  • +0.10 = Correlación positiva muy débil.
  • +0.25 = Correlación positiva débil.
  • +0.50 = Correlación positiva media.
  • +0.75 = Correlación positiva considerable.
  • +0.90 = Correlación positiva muy fuerte.
  • +1.00 = Correlación positiva perfecta (“A mayor X, mayor Y” o “a menor X, menor Y”, de manera proporcional. Cada vez que X aumenta, Y aumenta siempre una cantidad constante).

Regresión lineal simple

\[ Y = a + b \cdot x \]

Se utiliza la función lm() para construir la regresión lineal simple

Construir el modelo

modelo <- lm(data = datos, formula = lugar ~ horas_juego)
modelo

Call:
lm(formula = lugar ~ horas_juego, data = datos)

Coefficients:
(Intercept)  horas_juego  
  1550.6327      -0.5246  

Coeficientes a y b

a <- round(modelo$coefficients[1], 4)
b <- round(modelo$coefficients[2], 4)
paste ("Coeficienets abcisa a= ", a, " pendiente b = ", b)
[1] "Coeficienets abcisa a=  1550.6327  pendiente b =  -0.5246"

Predicciones

\[ Y = a + b \cdot x \therefore \\ Y = 1550.6327 + (-0.5246 \cdot x) \]

Siendo \(x\) cualquier valor de la variable independiente hora de juego y \(Y\) el resultado de una predicción.

Significado de los coeficienes

El valor del coeficiente b representa la pendiente hacia arriba y hacia abajo, en este caso es una pendiente negativa que significa que por cada valor de la variable independiente x (horas de juego), el valor de la predicción de la variable lugar disminuye en 0.5246 unidades.

Predicción manual

Cual es el valor de la predicción \(Y\) o en qué lugar está? un jugador que tiene 1000 horas de juego.

x <- 1000
pred1 <- a + b * x
paste("La predicción es en el lugar o ranking: ", round(pred1, 4))
[1] "La predicción es en el lugar o ranking:  1026.0327"

Predicción con función predict()

pred2 <- predict(object = modelo, newdata = data.frame(horas_juego = x))
paste("La predicción es en el lugar o ranking: ", round(pred2, 4))
[1] "La predicción es en el lugar o ranking:  1026.0005"

Los valores de pred1 y pred2 deben ser lo mismo

La linea de tendencia

Usando función preparada f_linea_tendencia_reg_lineal que imprime su tendencia

f_linea_tendencia_reg_lineal(datos = datos_uso, modelo = modelo)

Tal vez una regresión lineal no sea del todo el mejor modelo para predecir con estos datos.

Evaluación del modelo

resumen <- summary(modelo)
resumen

Call:
lm(formula = lugar ~ horas_juego, data = datos)

Residuals:
    Min      1Q  Median      3Q     Max 
-374.28  -67.23    4.82   72.68  433.40 

Coefficients:
               Estimate  Std. Error t value            Pr(>|t|)    
(Intercept) 1550.632749   16.248248   95.43 <0.0000000000000002 ***
horas_juego   -0.524632    0.007931  -66.15 <0.0000000000000002 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 107.8 on 748 degrees of freedom
Multiple R-squared:  0.854, Adjusted R-squared:  0.8538 
F-statistic:  4376 on 1 and 748 DF,  p-value: < 0.00000000000000022

R-Square es la correlación Pearson al cuadrado

cor(datos_uso) ^ 2
            horas_juego     lugar
horas_juego   1.0000000 0.8540091
lugar         0.8540091 1.0000000
resumen$r.squared
[1] 0.8540091

R square significa que tanto explica la variable horas_juego a la variable lugar o que tanto impacta o que tanto describe la variable independiente a la variable dependiente en la regresión lineal en este modelo y con estos datos.