Thèse de Diala Wehbe
Soutenance de thèse
Amphithéâtre Pierre Glorieux (CERLA)
SOUTENANCE DE THÈSE DE DIALA WEHBE - laboratoire Painlevé
Simulations et applications des K-processus ponctuels déterminantaux
Résumé :
Avec la croissance exponentielle de la quantité de données. l'échantillonnage est une méthode pertinente pour étudier les populations. Parfois, nous avons besoin d'échantillonner un grand nombre d'objets d'une part pour exclure la possibilité d'un manque d'informations clés et d'autre part pour générer des résultats plus précis. Le problème réside dans le fait que l'échantillonnage d'un trop grand nombre d'individus peut constituer une perte de temps.
Dans cette thèse , noire objectif est de chercher à établir des ponts entre la statistique et le k-processus ponctuel déterminantal(k-DPP) qui est défini via un noyau. Nous proposons trois projets complémentaires pour l'échantillonnage de grands ensembles de données en nous basant sur les k-DPPs. Le but est de sélectionner des ensembles variés qui couvrent un ensemble d'objets beaucoup plus grand en temps polynomial. Cela peut être réalisé en construisant différentes chaines de Markov où les k-OPPs sont les lois stationnaires.
Le premier projet consiste à appliquer les processus déterminantaux à ta sélection d'espèces diverses dans un ensemble d'espèces décrites par un arbre phylogénétique. En définissant le noyau du k-OPP comme un noyau d'intersection, les résultats fournissent une borne polynomiale sur le temps de mélange qui dépend de la hauteur de l'arbre phylogénétique.
Le second projet vise à utiliser le k-OPP dans un problème d'échantillonnage de sommets sur un graphe connecté de grande taille. La pseudo-inverse de la matrice Laplacienne normalisée est choisie d'étudier la vijesse de convergence de la chaîne de Markov créée pour l'échantillonnagede la loi stationnaire k-DPP. Le temps de mélange résultant est borné souscertaines conditions sur les valeurs propres de la matrice Laplacienne.
Le troisième sujet porte sur l'utilisation des k-OPPs dans la planification d'expérience avec comme objets d'étude plus spécifiques les hypercubes latins d'ordre n et de dimension d. La clé est de trouver un noyau positif qui préserve le contrainte de ce plan c'est-à-<lire qui préserve le fait que chaque point se trouve exactement une fois dans chaque hyperplan. Ensuite, en créant une nouvelle chaine de Markov dont le n-DPP est sa loi stationnaire, nous déterminons le nombre d'étapes nécessaires pour construire un hypercube latin d'ordre n selon le n-DPP.
Partager sur X Partager sur Facebook