Passer de la covariance à la corrélation
Même sans la fonction COEFFICIENT.CORRELATION() d’Excel, il est facile de passer de la covariance à la corrélation. La formule de définition du coefficient de corrélation entre la variable x et la variable y est la suivante: r = Sxy / SxSy
En termes de mots, la corrélation est égale à la covariance (Sxy) divisée par le produit de l’écart type de x (Sx) et de l’écart-type de y (Sy). La division supprime l’effet des écarts-types des deux variables de la mesure de leur relation. Prenant la propagation des deux variables hors de la corrélation fixe les limites du coefficient de corrélation à un minimum de -1,0 (corrélation négative parfaite), un maximum de +1,0 (corrélation positive parfaite) et un point médian de 0,0 (relation non observée) .
J’insiste sur les calculs de la covariance et du coefficient de corrélation car ils peuvent vous aider à comprendre la nature de ces deux statistiques. Lorsque des valeurs relativement grandes sur les deux variables vont de pair, la covariance est plus grande que dans le cas contraire. Une covariance plus grande entraîne un coefficient de corrélation plus élevé.
En pratique, vous ne réalisez presque jamais les calculs réels, mais laissez-les dans les fonctions de la feuille de calcul Excel COEFFICIENT.CORRELATION() pour le coefficient de corrélation et COVARIANCE.STANDARD () ou COVARIANCE.PEARSON () pour la covariance.
Pourquoi Excel n’a-t-il pas les fonctions COEFFICIENT.CORRELATION. STANDARD () et COEFFICIENT.CORRELATION.PEARSON ()? Supposons d’abord que vous avez affaire à une population de valeurs. Alors la formule pour r utiliserait N pour calculer la covariance de X avec Y. Il utiliserait également la racine carrée de N pour calculer les écarts-types de X et Y. Le dénominateur dans la formule pour r multiplie les deux écarts-types par l’autre, alors vous finissez par diviser N par N.
La situation est équivalente si vous travaillez avec un échantillon de valeurs, mais dans ce cas, vous finissez par diviser (N – 1) par (N – 1).
Plus succinctement, le résultat de l’expression
COVARIANCE.PEARSON (X, Y) / (ECARTYPE.PEARSON (X) * ECARTYPE.PEARSON (Y))
sera toujours égal au résultat de l’expression
COVARIANCE.STANDARD (X, Y) / (ECARTYPE.STANDARD (X) * ECARTYPE.STANDARD (Y)