Résumé
Comparaison de plusieurs méthodes issues du Data Mining afin de pouvoir proposer un meilleur modèle pour la prévision de la concentration d'ozone. En effet, le modèle opérant à l'heure actuelle appelé MOCAGE (MOdèle de Chimie Atmosphérique à Grande Echelle) ne permet pas une détection assez fiable de cette concentration. Ainsi, grâce à cette donnée et à d'autres données fournies par Météo France, nous avons pu mettre en oeuvre un comparatif de méthodes et en tirer la plus intéressante d'un point de vue prédictif. Pour cela, le dossier contient de nombreux schémas et tableaux explicatifs.
Extrait:
Aujourd'hui, avec l'augmentation de grands axes routiers périphériques aux villes et le réchauffement climatique, nous observons de plus en plus des pics en concentration d'ozone. Ils sont clairement nocifs pour la santé publique et sont donc évidemment à éviter pour le bien être de la population et de son environnement. Cependant, il est extrêmement difficile de changer le comportement de toute une population et certaines fois, ces pics d'ozone restent inévitables. Il s'agit alors de les prévoir, les prédire, pour que la ville soit alertée de la situation avant qu'il ne soit trop tard.
Nous nous sommes penchés sur ce problème, en tentant d'améliorer la prévision calculée par les services de Météo France. Notre travail consistait à établir une adaptation statistique de la prévision déterministe que propose Météo France, en s'aidant de cette prévision et d'autres variables également prévues par le service météorologique français. Pour cela, à partir des données contenues dans un fichier nommé ozone.dat que nous a transmis Météo France, nous avons testé plusieurs méthodes pour les comparer entre elles et décider laquelle est la plus adaptée à ce type de données (...)
Sommaire:
Résumé
Table des illustrations
Introduction
Extraction des échantillons apprentissage et test
Premier type de méthodes : la régression
Deuxième type de méthodes : l'analyse discriminante
Troisième type de méthode : arbres binaires
A. Arbre de régression
B. Arbre de discrimination
C. Prévision de l'échantillon test
Quatrième type de méthodes : les méthodes connexionnistes
A. La régression
B. La discrimination
C. Prévision de l'échantillon test
Cinquième type de méthodes : agrégation de modèle
Sixième type de méthodes : séparateurs à vaste marge