Date : 13 février 2024 10:30 - Type : Thesis - Radia SPIGA - Amphi A 104 - Espace Fauriel
Modèles autorégressifs pour données entières (INAR) avec variables explicatives pour la prévision des hospitalisations liées aux épidémies saisonnières |
La modélisation des séries temporelles discrètes dans le domaine de la santé se fait habituellement en les assimilant à des données issues d’un processus aléatoire gaussien, ainsi les méthodes de type ARMA peuvent être appliquées. Lorsqu’il s’agit de données de comptage à petite échelle, donc non gaussiennes, il est recommandé d’utiliser des modèles prenant en compte les caractéristiques de la série, plusieurs solutions ont été proposées ces dernières années, parmi elles les modèles basés sur l’opération d’amincissement : la famille des INAR (Integer-Valued Autoregressive times series), dont le principe est basé sur le calcul de la probabilité de survenue d’un évènement, en s’appuyant sur le processus de Markov, garantissant ainsi le résultat entier de la prédiction. Les INAR sont construits pour les distributions dites discrètes et auto-décomposables, telles les lois de Poisson, binomiale négative et géométrique. Plusieurs variantes ont été proposées au fil des années : les INAR périodiques, multivariés, ou incluant des données explicatives, cette dernière se fait à travers les paramètres du modèle, notamment la probabilité d’amincissement, définie entre 0 et 1, elle est liée aux variables explicatives grâce à une relation logistique. Les INAR avec variables explicatives ont été adaptés pour des distributions de Poisson ou binomiales.
Dans ce travail, nous nous intéressons à la prédiction du nombre hebdomadaire de patients hospitalisés à partir des urgences d’un seul établissement : le CHU de Saint-Etienne, ces hospitalisations sont donc non-programmées et susceptibles de provoquer une tension sur les services hospitaliers et une désorganisation de la prise en charge des patients. Ces données ont la particularité d’être surdispersées, et sont souvent de distribution binomiale négative, nous proposons ici d’utiliser des modèles INAR adaptés à la loi de distribution de nos données et d’y inclure des variables explicatives exogènes comme la température.Les INAR pour données binomiales négatives arrivent à reproduire la série de données, mais lorsqu’il s’agit de prédiction, les INAR avec variables explicatives se montrent plus performants.
Mots clés : Série temporelle pour données discrètes, operateur d’amincissement, processus de Markov, lois de distribution discrètes, loi binomiale négative.
Jury : DUPUY Jean-François Professeur, INSA Rennes Rapporteur
DEJEAN Sébastien Ingénieur de recherche, Université Paul Sabatier Rapporteur
CHRETIEN Stéphane Professeur, Université Lumière Lyon 2 Examinateur
TROMBERT-PAVIOT Béatrice Professeure, Faculté de médecine Saint Etienne Examinatrice
BATTON-HUBERT Mireille Professeure, Mines Saint-Etienne Directrice de thèse
SARAZIN Marianne Docteure, Clinique médico-chirurgicale du Groupe Aesio Co-encadrante de thèse