Formule d’échantillonnage dans Excel

L’échantillonnage de population est le processus consistant à prendre un sous-ensemble de sujets représentatif de l’ensemble de la population. L’échantillon doit avoir une taille suffisante pour justifier une analyse statistique. L’échantillonnage est généralement effectué parce qu’il est impossible de tester chaque individu de la population. Cela vise également à économiser du temps, de l’argent et des efforts lors de la réalisation de la recherche. Néanmoins, chaque chercheur doit garder à l’esprit que le scénario idéal est de tester tous les individus pour obtenir des résultats fiables, valides et précis. S’il est impossible de tester tous les individus, c’est la seule fois où nous nous appuyons sur des techniques d’échantillonnage.

1 formule de distribution d’échantillonnage

Une distribution d’échantillonnage est définie comme la distribution basée sur la probabilité de statistiques spécifiques. Sa formule permet de calculer (estimer) la moyenne, la plage, l’écart type et la variance de l’échantillon. 

Pour une taille d’échantillon supérieure à 30, la formule de distribution d’échantillonnage est donnée ci-dessous :

µ͞x =µ et σ ͞x =σ / √n

La moyenne de l’échantillon et de la population représentée par µ͞x et µ.

L’écart type de l’échantillon et de la population est représenté par σ ͞x  et σ.

La taille de l’échantillon supérieure à 30 est représentée par n.

De nombreuses entités utilisent la distribution d’échantillonnage pour la recherche. Il peut s’agir d’analystes, de chercheurs et de statisticiens. Lorsque la population est grande, une telle méthodologie permet de formuler un échantillon plus petit, que l’on pourrait ensuite utiliser pour déterminer les moyennes moyennes et les écarts types. 

On peut calculer la formule pour de distribution d’échantillonnage en suivant les étapes suivantes :

  1. Tout d’abord, trouvez le nombre d’échantillons ayant une taille similaire à n à partir de la plus grande population ayant la valeur N.
  2. Ensuite, séparez les échantillons sous la forme d’une liste et déterminez la moyenne de chaque échantillon.
  3. Ensuite, préparez la distribution de fréquence de la moyenne de l’échantillon telle que déterminée à l’étape 2.
  4. Ensuite, déterminez la distribution de probabilité des moyens d’échantillon déterminés après avoir déterminé la distribution de fréquence à l’étape 3.

Exemple 1

Prenons l’exemple de la population féminine. La taille de l’échantillon est de 100 personnes, avec un poids moyen de 65 kg et un écart type de 20 kg. Aidez le chercheur à déterminer la moyenne et l’écart type de la taille de l’échantillon de 100 femmes.

Solution

Utilisez les données ci-dessous pour le calcul de la distribution d’échantillonnage.

La moyenne de l’échantillon est équivalente à la moyenne de la population puisque la taille de l’échantillon est supérieure à 30.

Le calcul de l’écart type de la taille de l’échantillon est le suivant :

=20/√100

L’écart type de la taille de l’échantillon sera :

σ ͞x =2

Par conséquent, l’écart type de l’échantillon est de 2 et la moyenne de l’échantillon est de 65 kg.

Exemple n°2

Prenons l’exemple des taxes payées par les véhicules. En Californie, l’impôt moyen payé est de 12 225 $, avec un écart type de 5 000 $. Ils ont fait des observations sur un échantillon de 400 camions et remorques combinés. Aidez le service des transports à déterminer la moyenne et l’écart type de l’échantillon.

Solution

Utilisez les données ci-dessous pour le calcul de la distribution d’échantillonnage.

Le calcul de l’écart type de la taille de l’échantillon est le suivant :

= 5 000 $ / √400

L’écart type du Taille de l’échantillon sera –

σ ͞x = 250 $

Par conséquent, l’écart type de l’échantillon, tel qu’évalué par le service des transports, est de 250 $ et la moyenne de l’échantillon est de 12 225 $.

2 Formule de taille de l’échantillon

La formule de taille de l’échantillon aide à calculer ou à déterminer la taille minimale de l’échantillon, qui est nécessaire pour connaître la proportion adéquate ou correcte de la population, ainsi que le niveau de confiance et la marge d’erreur.

Le terme « échantillon » désigne la partie de la population qui nous permet de tirer des conclusions sur la population. Ainsi, la taille de l’échantillon doit être adéquate pour faire des inférences significatives. En d’autres termes, il s’agit de la taille minimale nécessaire pour estimer la proportion réelle de la population avec la marge d’erreur et le niveau de confiance requis. Par conséquent, la détermination de la taille appropriée de l’échantillon est l’un des problèmes récurrents de l’analyse statistique. Son équation peut être dérivée en utilisant la taille de la population, la valeur critique de la distribution normale, la proportion de l’échantillon et Marge d’erreur.

Taille de l’échantillon :

n = N * [Z2 * p * (1-p)/e2] / [N – 1 + (Z2 * p * (1-p)/e2]

■ N = Taille de la population,

■ Z = valeur critique de la distribution normale au niveau de confiance requis,

■ p = Proportion de l’échantillon,

■ e = Marge d’erreur

Au fur et à mesure que la taille de l’échantillon augmente la distribution d’échantillonnage, elle se rapproche de la distribution normale. Pendant ce temps, l’écart-type de la distribution d’échantillonnage change d’une autre manière. De plus, l’écart type diminue à mesure que n augmente.

Si la taille de l’échantillon est petite, cela ne créera pas un résultat approprié, tandis qu’un échantillon trop grand sera à la fois une perte d’argent et de temps. Par conséquent, il faut considérer une taille d’échantillon raisonnable pour les études de marché, les soins de santé et les enquêtes sur l’éducation.

Calculer la taille de l’échantillon? (Étape par étape)

Étape 1 : Tout d’abord, déterminez la taille de la population, qui est le nombre total d’entités distinctes dans votre population, et elle est désignée par N.

Étape 2 : Ensuite, déterminez la valeur critique du Distribution normale au niveau de confiance requis. Par exemple, la valeur critique à un niveau de confiance de 95 % est de 1,96.

Étape 3 : Ensuite, déterminez la proportion de l’échantillon qui peut être utilisée à partir des résultats de l’enquête précédente ou être recueillie en effectuant une petite enquête pilote. [Remarque: en cas de doute, on peut toujours utiliser 0,5 comme approche prudente, et cela donnera la plus grande taille d’échantillon possible.]

Étape 4 : Ensuite, déterminez la marge d’erreur, la fourchette dans laquelle la population réelle s’attend à se situer[Note: Plus la marge d’erreur est petite, plus la précision est grande et donc la réponse exacte.]

Étape 5 : Enfin, l’équation de la taille de l’échantillon peut être dérivée en utilisant la taille de la population (étape 1), la valeur critique de la distribution normale au niveau de confiance requis (étape 2), la proportion de l’échantillon (étape 3) et la marge d’erreur (étape 4), comme indiqué ci-dessous.

La taille maximale idéale de l’échantillon est de 10 % si elle augmente de moins de 1 000. Ainsi, par exemple, si la population est de 10 000 habitants, 10 % équivaudront à 1 000 habitants.

Exemple

Prenons l’exemple d’un détaillant qui souhaite savoir combien de ses clients ont acheté un article chez eux après avoir consulté leur site Web un certain jour. Étant donné que leur site Web compte, en moyenne, 10 000 vues par jour, déterminez la taille de l’échantillon des clients qu’ils doivent surveiller à un niveau de confiance de 95% avec une marge d’erreur de 5% si :

■ Ils sont incertains du taux de conversion actuel.

■ Ils savent par des enquêtes précédentes que le taux de conversion est de 5%.

Données

■ Taille de la population, N = 10 000

■ Valeur critique à un niveau de confiance de 95 %, Z = 1,96

■ Marge d’erreur, e = 5 % ou 0,05

Puisque le taux de conversion actuel est inconnu, supposons p = 0,5

Par conséquent, on peut calculer la taille de l’échantillon en utilisant la formule,

= (10 000 * (1,96 2)*0.5*(1-0.5)/(0.05 2)/(10000 – 1+((1.96 2)* 0.5*(1-0.5)/(0.05 2))))

Par conséquent, 370 clients seront suffisants pour tirer des inférences significatives.

2 – Le taux de conversion actuel est p = 5% ou 0,05

Par conséquent, on peut calculer la taille de l’échantillon en utilisant la formule ci-dessus :

= (10 000 * (1,96 2)*0.05*(1-0.05)/(0.05 2)/(10000 – 1+((1.96 2)* 0.05*(1-0.05)/(0.05 2))))

Par conséquent, une taille de 72 clients sera suffisante pour tirer des inférences significatives dans ce cas.

Le calcul de la taille de l’échantillon est important pour comprendre le concept de la taille d’échantillon appropriée, car on peut l’utiliser pour valider les résultats de la recherche. Dans le cas où il est trop petit, il ne donnera pas de résultats valides, tandis qu’un échantillon trop grand peut être une perte d’argent et de temps. Par conséquent, il convient d’utiliser une taille d’échantillon considérable pour les études de marché, les soins de santé et les enquêtes sur l’éducation.

3 Formule d’erreur d’échantillonnage

Une erreur d’échantillonnage est une erreur statistique qui se produit lorsqu’un analyste ne sélectionne pas un échantillon représentant l’ensemble de la population de données. Par conséquent, les résultats trouvés dans l’échantillon ne représentent pas les résultats qui seraient obtenus auprès de l’ensemble de la population.

L’échantillonnage est une analyse effectuée en sélectionnant un certain nombre d’observations parmi une population plus large. La méthode de sélection peut produire à la fois des erreurs d’échantillonnage et des erreurs non dues à l’échantillonnage.

Points clés à retenir

■ Une erreur d’échantillonnage se produit lorsque l’échantillon utilisé dans l’étude n’est pas représentatif de l’ensemble de la population. 

■ L’échantillonnage est une analyse effectuée en sélectionnant un certain nombre d’observations parmi une population plus large.

■ Même les échantillons randomisés comporteront un certain degré d’erreur d’échantillonnage car un échantillon n’est qu’une approximation de la population dont il est tiré.

■ La prévalence des erreurs d’échantillonnage peut être réduite en augmentant la taille de l’échantillon.

■ En général, les erreurs d’échantillonnage peuvent être classées en quatre catégories : erreur spécifique à la population, erreur de sélection, erreur de la base de sondage ou erreur de non-réponse.

Selon la formule, l’erreur d’échantillonnage est calculée en divisant l’écart type de la population par la racine carrée de la taille de l’échantillon, puis en multipliant le résultat par la valeur du score Z basée sur l’intervalle de confiance.

Une erreur d’échantillonnage est un écart entre la valeur échantillonnée et la valeur réelle de la population. Des erreurs d’échantillonnage se produisent parce que l’échantillon n’est pas représentatif de la population ou est biaisé d’une manière ou d’une autre. Même les échantillons randomisés comporteront un certain degré d’erreur d’échantillonnage car un échantillon n’est qu’une approximation de la population dont il est tiré.

Calcul étape par étape de l’erreur d’échantillonnage

La formule d’erreur d’échantillonnage est utilisée pour calculer l’erreur d’échantillonnage globale dans l’analyse statistique. L’erreur d’échantillonnage est calculée en divisant l’ écart type de la population par la racine carrée de la taille de l’échantillon, puis en multipliant le résultat par la valeur du score Z, basée sur l’intervalle de confiance.

Erreur d’échantillonnage = Z x (σ / √ n)

Où,

■ Z est la valeur du score Z basée sur l’intervalle de confiance

■ σ est l’écart type de la population

■ n est la taille de l’échantillon

Voici les étapes pour calculer l’erreur d’échantillonnage.

  1. Rassemblé tous les ensembles de données appelés la population. Calculez les moyennes de la population et l’écart type de la population.
  2. Il faut maintenant déterminer la taille de l’échantillon. De plus, la taille de l’échantillon doit être inférieure à la population et ne doit pas être supérieure.
  3. Déterminez le niveau de confiance. En conséquence, on peut déterminer la valeur du score Z à partir de son tableau.
  4. Maintenant, multipliez le score Z par l’écart type de la population et divisez-le par la racine carrée de la taille de l’échantillon pour arriver à une marge d’erreur ou erreur de la taille de l’échantillon.

Types d’erreurs d’échantillonnage

Il existe différentes catégories d’erreurs d’échantillonnage.

Erreur spécifique à la population

Une erreur spécifique à une population se produit lorsqu’un chercheur ne comprend pas qui enquêter.

Erreur de sélection

Une erreur de sélection se produit lorsque l’enquête est auto-sélectionnée ou lorsque seuls les participants intéressés par l’enquête répondent aux questions. Les chercheurs peuvent tenter de surmonter les erreurs de sélection en trouvant des moyens d’encourager la participation.

Erreur d’image d’échantillon

Une erreur de base de sondage se produit lorsqu’un échantillon est sélectionné à partir de mauvaises données de population.

Erreur de non-réponse

Une erreur de non-réponse se produit lorsqu’une réponse utile n’est pas obtenue à partir des enquêtes parce que les chercheurs n’ont pas pu contacter les répondants potentiels (ou que les répondants potentiels ont refusé de répondre).

Exemple 1

Supposons que l’écart type de la population soit de 0,30 et que la taille de l’échantillon soit de 100. Quelle sera l’erreur d’échantillonnage à un niveau de confiance de 95 % ?

Solution

Nous avons donné l’écart type de la population ainsi que la taille de l’échantillon. Par conséquent, nous pouvons utiliser la formule ci-dessous pour calculer la même chose.

Utilisez les données suivantes pour le calcul.

■ Valeur du facteur Z : 1,96

■ La population de l’écart type : 0,3

■ Taille de l’échantillon : 100

Par conséquent, le calcul de l’erreur d’échantillonnage est le suivant :

Exemple n°2

Gautam suit actuellement des cours de comptabilité et a réussi son examen d’entrée. Il s’est désormais inscrit au niveau intermédiaire et rejoindra également un comptable senior en tant que stagiaire. De plus, il travaillera sur un audit des entreprises manufacturières. 

L’une des entreprises qu’il visitait pour la première fois a demandé à vérifier si les factures de toutes les transactions d’achat étaient raisonnablement disponibles. La taille de l’échantillon qu’il a sélectionné était de 50 et l’écart type de la population pour celui-ci était de 0,50.

Sur la base des informations disponibles, vous devez calculer l’erreur d’échantillonnage à des intervalles de confiance de 95 % et 99 %.

Solution

On nous donne ici l’écart type de la population ainsi que la taille de l’échantillon ; par conséquent, nous pouvons utiliser la formule ci-dessous pour calculer la même chose.

Le score Z pour un niveau de confiance de 95 % sera de 1,96 (disponible dans le tableau des scores Z).

Utilisez les données suivantes pour le calcul.

■ Valeur du facteur Z : 1,96

■ La population de l’écart type : 0,50

■ Taille de l’échantillon : 50

Le calcul est donc le suivant,

L’erreur d’échantillonnage sera :

Élimination des erreurs d’échantillonnage

Il est essentiel de comprendre ce concept car il doit décrire dans quelle mesure on peut s’attendre à ce que les résultats de l’enquête reflètent la vision globale de la population. Il ne faut pas oublier qu’une enquête utilise une population plus petite appelée taille d’échantillon (également appelée répondants à l’enquête) pour représenter une population plus grande.

On peut y voir un moyen de calculer l’efficacité de l’enquête. Lorsque la marge d’échantillonnage est plus élevée, cela signifie que les conséquences de l’enquête pourraient s’écarter de la représentation réelle de la population totale. D’un autre côté, une erreur d’échantillonnage ou marge d’erreur un chiffre plus petit que cela indiquera que les conséquences sont désormais plus proches de la véritable représentation de la population dans son ensemble et qui renforcera un niveau de confiance plus élevé dans l’enquête en cours.

La prévalence des erreurs d’échantillonnage peut être réduite en augmentant la taille de l’échantillon . À mesure que la taille de l’échantillon augmente, l’échantillon se rapproche de la population réelle, ce qui diminue le risque d’écarts par rapport à la population réelle. Considérez que la moyenne d’un échantillon de 10 varie plus que la moyenne d’un échantillon de 100. Des mesures peuvent également être prises pour garantir que l’échantillon représente adéquatement l’ensemble de la population.

Les chercheurs pourraient tenter de réduire les erreurs d’échantillonnage en reproduisant leur étude. Cela pourrait être accompli en prenant les mêmes mesures à plusieurs reprises, en utilisant plus d’un sujet ou plusieurs groupes, ou en entreprenant plusieurs études.

L’échantillonnage aléatoire est un moyen supplémentaire de minimiser l’apparition d’erreurs d’échantillonnage. L’échantillonnage aléatoire établit une approche systématique pour sélectionner un échantillon. Par exemple, plutôt que de choisir les participants à interroger au hasard, un chercheur pourrait choisir ceux dont les noms apparaissent en premier, 10ème, 20ème, 30ème, 40ème, et ainsi de suite, sur la liste.

S’abonner
Notifier de
0 Commentaires
Inline Feedbacks
Voir tous les commentaires

Initiation à Excel

Fonctions Excel

Excel VBA

Macros VBA Utiles

Plus d'outils

Sur Facebook

Sur YouTube

0
Nous aimerions avoir votre avis, veuillez laisser un commentaire.x