Variations sur l’étendu dans Excel

La section précédente a discuté de certaines des raisons pour lesquelles l’étendu n’est pas une mesure idéale de la quantité de variabilité dans un ensemble de données. Par exemple, l’étendu est très sensible au nombre de cas dans

l’ensemble de données et résiste au changement sauf si la valeur maximale ou minimale change.
Cependant, plusieurs statistiques sont étroitement liées à l’étendu et sont en fait utiles pour décrire la quantité de variabilité dans un ensemble de données. Ce cours a plus à dire sur ces statistiques dans le chapitre 5, “Graphiques statistiques.” En attendant, voici une brève description de deux statistiques étudiées et développées par John Tukey (Exploratory Data Analysis, Addison-Wesley, 1977): l’étendu interquartile et l’étendu semi-interquartile.

L’étendu interquartile
Cette statistique est passée par plusieurs noms différents depuis les années 1970. Dans des sources plus récentes, vous êtes plus susceptible de voir l’abréviation IQR, en particulier dans l’application statistique freeware R.
L’étendu interquartile est simplement la distance entre le 25e et le 75e centile dans un ensemble de données. Dans les diagrammes à boîte et à moustaches, qui sont couverts dans le chapitre 5, vous pouvez visualiser l’IQR comme la distance entre les deux charnières de la boîte.

Excel n’a aucune fonction de feuille de calcul qui calcule automatiquement l’IQR. Excel offre cependant la fonction QUARTILE.INC (), qui renvoie la valeur occupant les 0e, 25e, 50e,
75e ou 100e centile dans un tableau de valeurs. Les arguments de la fonction QUARTILE.INC () incluent l’adresse du tableau de données sous-jacentes et le quartile que vous recherchez: 1 pour le 25ème centile, 2 pour le 50ème centile, etc. Le tableau sous-jacent n’a pas besoin d’être trié.
Par exemple, étant donné ce tableau, dans la feuille de travail E1: E11
{1; 0; 7; 9; 8; 4; 2; 3; 10; 6; 5}
qui a un nombre impair de valeurs uniques de 0 à 10 et qui n’est pas triée, cette fonction = QUARTILE.INC (E1: E11,1)

renvoie 2,5, la valeur du 25e centile ou premier quartile du tableau. Étant donné que le tableau ne contient aucune valeur correspondant exactement au 25e centile du tableau, Excel détermine la valeur par interpolation.
La formule
= QUARTILE.INC (E1: E11,3)
renvoie le troisième quartile, ou 75ème centile, dans le tableau. Sa valeur est de 7,5, également déterminée par interpolation. Par conséquent, l’IQR dans ce cas est égal à 7,5 – 2,5 ou 5,0. Si vous préférez, vous pouvez utiliser la fonction PERCENTILE.INC () à la place de la fonction QUARTILE.INC (). Par exemple, la formule
= PERCENTILE.INC (E1: E11,0.25)
renvoie la valeur correspondant au premier quartile. La principale différence entre les deux fonctions est que vous spécifiez le nombre du quartile de zéro à cinq, mais la valeur du centile de 0 à 1.

La gamme semi-interquartile
Cette statistique est parfois appelée Q. Elle est exactement la moitié de la taille de l’IQR. Avec l’IQR, il est beaucoup moins probable que la gamme soit influencée par la taille de l’échantillon, et il est donc considéré comme un meilleur indicateur du degré de variabilité dans un ensemble de données que ne l’est l’intervalle.
Une statistique étroitement liée est le midhinge, qui est le résultat de la moyenne des premier et troisième quartiles:
Midhinge = (Q1 + Q3) / 2
Si vous ajoutez et soustrayez la gamme semi-interquartile du midhinge, vous capturez environ 50% des observations dans un ensemble de données qui lui-même se rapproche d’une courbe normale. Et, bien sûr, si vous ajoutez et soustrayez le midhinge de la médiane, vous capturez exactement 50% des observations.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x
()
x