Résumé
On analyse dans ce rapport la pollution dans la Creuse. En effet, le conseil général du
département de la Creuse s'inquiète des pollutions d'origine agricole et de la qualité des
eaux de la rivière principale : la Creuse qui draine un large bassin versant.
Un laboratoire d'analyse a répondu à l'appel d'offre et a été retenu pour mener une
étude sur la qualité de l'eau de la creuse.
Pour cela, des techniciens ont effectué 151 prélèvements d'eau au niveau de 5 sites,
comme indiqué dans le tableau suivant : (...)
Ces différentes mesures ont été regroupées dans le tableau ci-dessous qui résume des
paramètres des échantillons d'eau.
Avant d'analyser nos données, il a été indispensable de préciser un certain nombre
d'objectifs de l'étude. On veut savoir comment se répartissent les différentes molécules,
s'il y a des minéraux qui influencent le pH ou la température. De plus, il est intéressant
de savoir s'il existe une relation entre la concentration en teneur des minéraux, le pH et la
température.
Le but de cette analyse des données est la mise en relief des relations existant entre
les individus, les paramètres qui les caractérisent. Ces techniques permettent
également de situer globalement ces individus par rapport aux autres et de mesurer
l'importance relative de chacun des paramètres.
Premièrement, on commence par faire une analyse descriptive. Dans un second temps,
on réalise une régression. Ensuite, on réalise une analyse en composante principale
suivi d'une analyse discriminante qui permet de valider ou d'informer à partir de tests
statistiques, des hypothèses formulées a priori (ou après une phase exploratoire) et
d'extrapoler. C'est une méthode dite explicative et prévisionnelle destinée à expliquer
une variable privilégiée à l'aide de variables quantitatifs. (...)
Sommaire:
Introduction
Chapitre 1 : L'Analyse Descriptive
I. Premières vérifications de données
A. Moyenne et écart-type
B. Les histogrammes
C. Les droites d'Henry
D. Les boites à moustaches
II. Liaison linéaire entre les variables
III. Quelle variable choisir ?
Chapitre 2 : La Régression
I. Choix de Y
II. Etude de la matrice de corrélation
III. Régression multiple globale de Y
IV. Régression pas à pas ascendante
A. Analyse des résidus
B. Recherche des individus atypiques
V. Régression pas à pas descendante
Chapitre 3 : L'Analyse en Composante Principale
I. Les valeurs propres
II. Identification des deux composantes principales
III. Représentations graphiques
A. Interprétation des variables
B. Interprétation des individus
IV. Contribution des variables
V. Contribution des individus
VI. Représentation graphique en 3D
Chapitre 4 : L'Analyse Discriminante
I. Langda de wilks
II. Le test du Chi-Deux
III. Les fonctions discriminantes
IV. Factor Structure Matrix
V. Les moyennes des fonctions discriminantes
VI. Représentation graphique
Chapitre 5 : La Classification
I. Les fonctions de classifications
II. La matrice des classifications
III. Distance de Mahalanobis et probabilité a posteriori
IV. Classification des individus