Théorie de l'analyse objective (Mercier,1994)

           Le problème à traiter est le suivant : on dispose de N observations (di, i=1,...,N) d'une variable aléatoire scalaire en des points de l'espaces (Xi, i=1,...,N), et l'on cherche à estimer la valeur du champ au point Xj. Typiquement Xj sera différent des Xi.

                La méthode présentée pour résoudre ce problème a été introduite en océanographie par Bretherton, Davis et Fandry  et est appelée analyse objective ou interpolation optimale ou encore estimation optimale.

           La méthode requiert une connaissance statistique a priori du champ à estimer ainsi que celle du bruit sur les données.

        

Théorème de Gauss Markov

Supposons que nous disposons de m observations du champ  rangées dans le vecteur d et que nous devons estimer le champ  en n points  , i=1,..,n rangés dans le vecteur . Le vecteur contenant les estimateurs des sera noté et le vecteur e sera égal à .

On supposera connues les matrices de corrélation

  •  , du champ

  • , des données (qui diffère de à cause du bruit)

  • , corrélation entre le champ à estimer et les données.

est de dimension  , Cd de dimension et  de dimension .

La relation linéaire entre l'estimateur et les données s'écrira, où A est une matrice de dimension n x m,  

                      

L'estimateur à variance d'erreur minimale sera donné par

et la matrice de covariance des erreurs

                         


Remarques: 

  • Ce ne dépend que de la position des données, pas de leur valeur. Loin (comparé aux distances de corrélation) de toute donnée, la variance de l'erreur tend vers la variance du champ et l'estimateur vers la moyenne du champ (information contenue dans la matrice de corrélation).  

  • Le calcul de  et de  nécessite soit l'inversion de la matrice Cd , soit la résolution d'un système linéaire Cd.X=d qui donne . Pour résoudre le système il peut être intéressant d'utiliser une décomposition de Cholesky. La décomposition de Cholesky permet d'écrire Cd qui est symétrique définit positive, sous la forme Cd=LLT L est une matrice triangulaire.  

  • Pour faire intervenir dans le calcul les erreurs de mesures et les erreurs de représentativité il faut ajouter à Cd la matrice de covariance de ces erreurs R.

On obtient donc

  • On préfère se ramener à un problème d'estimation d'anomalie afin de rapprocher les matrices de moment intervenant dans l’estimateur, d'une matrice de covariance. Le vecteur de donnée devient un vecteur d'anomalie (ou d'innovation) :

Et on a finalement

Les résidus sont définis comme l'écart entre la donnée et l'estimation faite en ce point :