Estimation de densité conditionnelle lorsque l'hypothèse de normalité est insatisfaisante
We aim at modelling fat-tailed densities whose distributions are unknown but are potentially asymmetric. In this context, the standard normality assumption is not appropriate.In order to make as few distributional assumptions as possible, we use a non-parametric algorithm to model the center of the distribution. Density modelling becomes more difficult as we move further in the tail of the distribution since very few observations fall in the upper tail area. Hence we decide to use the generalized Pareto distribution (GPD) to model the tails of the distribution. The GPD can approximate finite, exponential or subexponential tails. The estimation of the parameters of the GPD is based solely on the extreme observations. An observation is defined as being extreme if it is greater than a given threshold. The main difficulty with GPD modelling is to determine an appropriate threshold. Nous cherchons à modéliser des densités dont la distribution est inconnue mais qui est asymétrique et présente des queues lourdes. Dans ce contexte, l'hypothèse de normalité n'est pas appropriée. Afin de maintenir au minimum le nombre d'hypothèses distributionnelles, nous utilisons une méthode non paramétrique pour modéliser le centre de la distribution. La modélisation est plus difficile dans les queues de la distribution puisque peu d'observations s'y trouvent. Nous nous proposons donc d'utiliser la Pareto généralisée (GPD) pour modéliser les queues de la distribution. La GPD permet d'approximer tous les types de queues de distributions (qu'elles soient finies, exponentielles ou sous-exponentielles). L'estimation des paramètres de la GPD est uniquement basée sur les observations extrêmes. Une observation est définie comme étant extrême si elle dépasse un seuil donné. La principale difficulté de la modélisation avec la GPD réside dans le choix d'un seuil adéquat.