La variable aléatoire X a étudié est les montants de sinistre. D’abord, nous importons le fichier ~/Downloads/devoir20octobre2019/montantsisnitres/montantssinistre12.csv à notre session R on utilisons la fonction read.csv :
db.mntsin <- read.csv2(path)
On uttilisera la deuxième colonne.
J’appelle alors ma fonction getfitdistr qui retourne une liste contenant l’estimation, la p-value, et si l’hypothèse nulle n’est pas rejetée, l’AIC pour les distributions données dans la colonne distributions du résultat. Simultanément, cette fonction crée les courbes des fonctions de distribution cumulative de X et des distributions ajustées.
result <- getfitdistr(db.mntsin[[2]], short=FALSE, plots.as.vars = TRUE)
Les distributions utilisées sont :
result$distributions
## [1] "gamma" "lognormal" "exponential"
On trace la courbe de la fonction de distribution cumulative empirique de X.
result$plot
\(\hat{F}_{X}\) Fonction de distribution cumulative empirique de \(\mathbf{X}\)
On trace la courbe de la fonction de distribution cumulative empirique de X et des fonctions de distribution cumulative des distributions exponentielle, log-normale, gamma.
result$combinedplot
\(\hat{F}_{X}\) et des F.D.Cs des distributions \(\mathbf{gamma}\), \(\mathbf{exponentielle}\) et \(\mathbf{log-normale}\)
On remarque que la distribution de la loi exponentielle est la distribution la mieux ajustée à la distribution de X.
Après avoir utilisé MASS::fitdistr(x, "gamma") pour obtenir la distribution gamma ajustée dans le corps de notre fonction getfitdistr. On retrouvera l’estimation suivantes:
result$gamma$estimate
## shape rate
## 1.016786 2.529258
En utilisant le test de Kolmogorov-Smirnov on retrouvera la \[pvalue = 0.61412647229209 \]
on a donc \(pvalue > 5\%\)
On accepte l’hypothèse Nulle \(\mathcal{H}_0\). Donc la distribution de loi gamma permet de bien modéliser la distribution la valeur aléatoire X. La fonction getfitdistr retourne la valeur de l’AIC \[ AIC = 207.852712601341 \]
Après avoir utilisé MASS::fitdistr(x, "lognormal") pour obtenir la distribution log-normale ajustée dans le corps de notre fonction getfitdistr. On retrouvera l’estimation suivantes:
result$lognormal$estimate
## meanlog sdlog
## -1.477864 1.244806
En utilisant le test de Kolmogorov-Smirnov on retrouvera la \[pvalue = 1.67986979882073e-09 \]
on a donc \(pvalue < 5\%\)
On rejete l’hypthèse Nulle \(\mathcal{H}_0\). Donc la distribution de loi log-normale ne permet pas de modèlisé celle de X.
Après avoir utilisé MASS::fitdistr(x, "exponential") pour obtenir la distribution exponentielle ajustée dans le corps de notre fonction getfitdistr. On retrouvera l’estimation suivantes:
result$exponential$estimate
## rate
## 2.487504
En utilisant le test de Kolmogorov-Smirnov on retrouvera la \[pvalue = 0.768252166387063 \]
on a donc \(pvalue > 5\%\)
On accepte l’hypothèse Nulle \(\mathcal{H}_0\). Donc la distribution de loi exponentielle permet de bien modéliser la distribution la valeur aléatoire X. La fonction getfitdistr retourne la valeur de l’AIC \[ AIC = 206.056699681226 \]
On écrit : \[\mathbf{X}\sim\mathcal{EXP}(2.49)\]