age sex bmi smoker region children charges
1 21.00000 male 25.74500 no northeast 2 3279.869
2 36.97698 female 25.74416 yes southeast 3 21454.494
3 18.00000 male 30.03000 no southeast 1 1720.354
4 37.00000 male 30.67689 no northeast 3 6801.438
5 58.00000 male 32.01000 no southeast 1 11946.626
6 46.00000 male 26.62000 no southeast 1 7742.110
l’impact des différentes variables si elles sont significatives
Traitement des variables qualitatives et régression de la charge sur toutes autres variables.
Un nombre d’étoiles élévé indique que la probabilité de rejetter l’hypothèes \(H_0\) est faible. Ce critère permet de choisir les variables pertinentes à introduire dans notre modèle de tarification
df$SEX<-model.matrix(~sex-1,data=df)df$smoker<-model.matrix(~smoker-1,data=df)df$region<-model.matrix(~region-1,data=df)res<-lm(charges~age+bmi+ smoker+ region +children+ SEX,data=df)summary(res)
Call:
lm(formula = charges ~ age + bmi + smoker + region + children +
SEX, data = df)
Residuals:
Min 1Q Median 3Q Max
-17498.1 -2638.6 -993.4 766.0 30171.9
Coefficients: (3 not defined because of singularities)
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12544.722 671.949 18.669 < 2e-16 ***
age 241.211 8.026 30.052 < 2e-16 ***
bmi 282.634 17.640 16.022 < 2e-16 ***
smokersmokerno -22886.546 269.288 -84.989 < 2e-16 ***
smokersmokeryes NA NA NA NA
regionregionnortheast 2297.430 279.517 8.219 2.82e-16 ***
regionregionnorthwest 196.729 278.410 0.707 0.4799
regionregionsoutheast 440.997 267.672 1.648 0.0995 .
regionregionsouthwest NA NA NA NA
children 547.455 57.554 9.512 < 2e-16 ***
SEXsexfemale -1182.972 198.983 -5.945 3.02e-09 ***
SEXsexmale NA NA NA NA
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 5701 on 3621 degrees of freedom
Multiple R-squared: 0.7192, Adjusted R-squared: 0.7186
F-statistic: 1159 on 8 and 3621 DF, p-value: < 2.2e-16
Pour toutes les courbes qui suivent, on fait la regression de charge sur une variable choisie pour observer le lien de corrélation avec les charges.