Les statistiques descriptives résument les données fournies et fournissent un résumé des statistiques clés pour les données telles que la moyenne, le mode, la médiane, la variance, l’écart type, l’asymétrie, le nombre, le maximum et le minimum, etc. Lorsque vous travaillez avec un grand ensemble de données, connaître les informations statistiques clés sur votre ensemble de données et les tendances de vos données pourraient être utiles.

Microsoft Excel possède diverses fonctions intégrées qui peuvent calculer de nombreuses valeurs statistiques individuellement telles que la moyenne, la variance, le nombre, etc. Excel dispose également d’un outil complémentaire appelé Analysis Toolpak qui vous aide à générer toutes les statistiques descriptives en une seule fois. Dans cet article, nous allons vous expliquer comment calculer des statistiques descriptives de vos données dans Excel.

Comment installer l’outil d’analyse de données sur Excel

L’analyse de données (ou statistiques de données) est un outil d’analyse de données avancé qui prend une grande quantité de données et calcule une série de statistiques clés de l’ensemble de données. L’outil d’analyse de données est accessible à partir de l’onglet Données du programme Excel. Avant de pouvoir utiliser l’outil d’analyse de données, vous devez installer un complément appelé Data Analysis ToolPak. Voici comment vous pouvez installer Data Analysis ToolPak dans Excel.

Tout d’abord, allez dans l’onglet “Fichier” dans le coin supérieur gauche.

Ensuite, cliquez sur “Options” en bas du panneau de gauche.

 Lorsque la boîte de dialogue Options Excel apparaît, cliquez sur “Compléments” dans le volet de gauche.

En bas du volet de droite, choisissez “Compléments Excel” dans le menu déroulant Gérer et cliquez sur “Aller…”.

Une nouvelle boîte de dialogue Compléments apparaîtra. Ici, cochez ou sélectionnez l’option ‘Analysis ToolPak’ et cliquez sur ‘OK’.

Une fois que vous avez fait cela, l’outil “Analyse des données” apparaîtra dans le coin droit du ruban sous l’onglet “Données”.

Comment obtenir des statistiques descriptives dans Excel

Une fois l’outil d’analyse de données activé, vous pouvez calculer des statistiques descriptives pour votre ensemble de données.

Supposons que vous ayez l’exemple de jeu de données ci-dessous où nous avons le nombre de livres vendus dans différentes villes. Pour cet ensemble de données, nous voulons calculer des statistiques descriptives. Voici comment procéder :

Pour obtenir des statistiques descriptives, accédez à l’onglet “Données” et cliquez sur l’outil “Analyse des données” dans la section Analyse.

Dans la fenêtre de dialogue Analyse des données, sélectionnez “Statistiques descriptives” sous Outils d’analyse et cliquez sur “OK”.

Cela ouvrira la boîte de dialogue Statistiques descriptives dans laquelle vous devrez configurer les options d’entrée et de sortie.

Voyons comment remplir chaque champ de la boîte de dialogue Statistiques descriptives.

Plage d’entrée : La plage d’entrée est le champ le plus important de la boîte de dialogue. Pour cela, sélectionnez la plage de variables/valeurs que vous souhaitez analyser.

Vous pouvez entrer manuellement la plage dans le champ ou cliquer sur le bouton fléché vers le haut à la fin du champ pour choisir une plage.

Après cela, sélectionnez la plage dans la feuille et cliquez sur le bouton fléché vers le bas pour confirmer la plage.

Regroupés par : choisissez comment vous souhaitez organiser vos variables (ligne ou colonne).

Labels in first row : Si vous avez sélectionné ou saisi la plage (dans Input Range) avec en-têtes, vous devez cocher cette option. Dans cet exemple, nous avons sélectionné la plage d’entrée sans les étiquettes, nous l’avons donc laissée décochée.

Plage de sortie : sélectionnez l’endroit où vous souhaitez afficher le résultat des statistiques. Si vous souhaitez afficher le résultat dans la feuille de calcul en cours ou dans d’autres feuilles de calcul, cliquez sur le bouton radio “Plage de sortie” et spécifiez la plage dans le champ à côté.

New Worksheet Ply : Si vous souhaitez afficher les résultats dans une nouvelle feuille de calcul, sélectionnez simplement le bouton radio “New Worksheet Ply”.

Nouveau classeur : Si vous souhaitez afficher le résultat dans un tout nouveau classeur, choisissez l’option « Nouveau classeur ».

Statistiques récapitulatives : Si vous souhaitez calculer et afficher la plupart des statistiques descriptives (telles que la moyenne, le mode, la dispersion, l’écart type, etc.), cochez cette option.

Niveau de confiance pour la moyenne : sélectionnez cette option si vous souhaitez afficher un intervalle de confiance pour la moyenne. Entrez ensuite le niveau de confiance que vous souhaitez calculer pour la moyenne de l’échantillon. La valeur par défaut est 95 %.

Kth Largest : Cette option affichera la plus grande valeur de l’ensemble de données. Lorsque vous sélectionnez cette option, la valeur par défaut est 1, ce qui signifie qu’elle affichera la première valeur la plus élevée. Si vous entrez ‘2’, il affichera la deuxième plus grande valeur, 3 affichera la troisième plus grande valeur, et ainsi de suite.

Kth Smallest : Cette option affichera la plus petite valeur dans l’ensemble de données. La valeur par défaut est 1, ce qui signifie qu’il affichera la plus petite valeur. Si vous entrez ‘2’, il affichera la deuxième plus petite valeur, 3 affichera la troisième plus petite valeur, et ainsi de suite.

Enfin, cliquez sur ‘OK’ pour générer les statistiques.

Et vous obtiendrez un résumé des statistiques descriptives comme indiqué ci-dessous.

Comment lire les résultats des statistiques descriptives

L’explication de chaque résultat statistique est la suivante :

  • Moyenne – La moyenne est la valeur moyenne de vos données d’échantillon qui est calculée en additionnant toutes les valeurs de l’ensemble de données et en divisant par le nombre de valeurs de l’échantillon.
  • Erreur standard – Cela montre les valeurs d’erreur standard des données d’échantillon. Il s’agit d’une mesure de la distance entre chaque moyenne de population et la moyenne d’un échantillon (différence entre la valeur prédite et la valeur réelle).
  • Médiane – Il s’agit de la valeur médiane dans l’ensemble de données. Il est trouvé en organisant l’échantillon dans l’ordre croissant ou décroissant et en extrayant la valeur médiane exacte dans la liste. Si le nombre de valeurs dans la liste est pair, la moyenne des deux valeurs du milieu sera calculée pour trouver la médiane.
  • Mode – Ceci représente la valeur qui apparaît le plus fréquemment dans les données d’échantillon. Cette valeur statistique est utile pour les données catégorielles et ordinales. Dans l’exemple ci-dessus, il n’y a pas de valeur la plus courante, nous obtenons donc #N/A.
  • Écart type – Il montre l’écart type de votre ensemble de données qui est une différence type entre chaque point de données et la moyenne. Plus l’écart-type est élevé, plus la variabilité est élevée.
  • Variance de l’échantillon – La variance de l’échantillon est la moyenne des écarts-types au carré.
  • Aplatissement – ​​La valeur d’aplatissement est une mesure de la façon dont les pointes/pics et les queues de votre distribution diffèrent de la distribution normale. La distribution normale a généralement une valeur d’aplatissement de 0. Si la valeur d’aplatissement est positive, cela signifie que votre distribution est une distribution avec pic et les valeurs négatives indiquent une distribution relativement plate.
  • Asymétrie – L’asymétrie représente l’asymétrie de votre distribution où 0 indique une distribution parfaitement symétrique. Si la valeur Skewness est supérieure à 0 (positive), votre distribution est positivement asymétrique, ou vers la droite. Si la valeur d’asymétrie est inférieure à 0, votre distribution est asymétrique négativement ou vers la gauche.
  • Plage – La plage représente la différence entre les valeurs les plus grandes et les plus petites de vos données. Il est trouvé en soustrayant la valeur la plus basse de la valeur la plus élevée dans l’ensemble de données.
  • Minimum – Il s’agit de la valeur la plus basse de votre ensemble de données.
  • Maximum – Il s’agit de la valeur la plus élevée de votre ensemble de données.
  • Somme – La somme est simplement le total de toutes les valeurs de l’ensemble de données.
  • Compter – Il s’agit du nombre de toutes les valeurs de vos données.
  • Le plus grand – Il indique le plus grand nombre de votre ensemble de données en fonction du nombre que vous avez choisi pour l’option “Kth le plus grand” lors de la configuration.
  • Le plus petit – Il indique le plus petit nombre dans votre ensemble de données en fonction du nombre que vous avez choisi pour l’option ‘Kth Smallest’ lors de la configuration.
  • Niveau de confiance (95,0 %) – Le niveau de confiance indique la plage de valeurs pouvant contenir un paramètre de population ou une moyenne. 

Vous pouvez également trouver les limites supérieure et inférieure de l’intervalle de confiance à l’aide de la valeur Niveau de confiance à partir des résultats.

Pour obtenir la limite supérieure de l’intervalle de confiance, il suffit d’ajouter la moyenne à la valeur du niveau de confiance. Pour ce faire, utilisez une formule similaire – =B3+B18, qui donne 95,8891.

Pour obtenir la limite inférieure de l’intervalle de confiance, il suffit de soustraire la moyenne de la valeur du niveau de confiance. Pour ce faire, utilisez une formule similaire – =B3-B18, qui donne 48,3109.

Calculer des statistiques individuelles à l’aide de formules

L’outil d’analyse de données vous permet d’effectuer une analyse avancée de vos données et de générer automatiquement une série de 16 statistiques clés pour vos données. Mais si vous souhaitez uniquement trouver certaines statistiques pour vos données (telles que les moyennes, l’écart type, etc.), vous pouvez utiliser des formules individuelles pour calculer chaque mesure statistique. Ces formules produiront le même résultat que l’outil d’analyse de données.

Voici une liste de formules pour calculer des statistiques descriptives dans Excel :

Moyenne:

=AVERAGE(B2:B21)

Où remplacer B2:B21par la plage de valeurs de votre échantillon.

Erreur d’écart type :

=STDEV.S(B2:B21)/SQRT(COUNT(B2:B21))

Médian:

=MEDIAN(B2:B21)

Ecart type :

=STDEV.S(B2:B21)

Écart d’échantillon

=VAR.S(B2:B21)

Mode:

=MODE.SNGL(B2:B21)

Aplatissement :

=KURT(B2:B21)

Asymétrie :

=SKEW(B2:B21)

Varier:

=MAX(B2:B21)-MIN(B2:B21)

Minimes :

=MIN(B2:B21)

Maximum:

=MAX(B2:B21)

SOMME :

=SUM(B2:B21)

Compter

=COUNT(B2:B21)

1ère valeur la plus élevée

=LARGE(B2:B21,1)

Où remplacer 1 par le kème plus grand nombre. Par exemple, si vous souhaitez trouver la première valeur la plus élevée, entrez 1, 2 pour la deuxième valeur la plus élevée, et ainsi de suite.

2e plus petit

=SMALL(B2:B21,2)

Où remplacer 2par le kème plus petit nombre.

Si vous avez aimé cet article, veuillez- vous abonner à notre communauté reddit pour en discuter. Vous pouvez également nous retrouver sur Twitter et Facebook .

5/5 - (1 vote)