CalculatriceCliquez pour ouvrir
Leçon principale
- La distribution normale est caractérisée par sa moyenne et son écart type.
- La distribution normale standard a une moyenne de 0 et un écart type de 1.
- Environ 68,3 % des données dans une distribution normale se situent à un écart type de la moyenne.
- La valeur Z normalise les données pour faciliter le calcul et l’interprétation à l’aide d’un tableau de distribution normale.
- La distribution normale modélise souvent des phénomènes du monde réel tels que l’altitude, ce qui facilite les calculs de probabilité.
Qu’est-ce qu’une distribution normale ?
La formule de distribution normale s’appuie sur deux paramètres simples : la moyenne et l’écart type pour quantifier les caractéristiques d’un ensemble de données donné. Alors que la moyenne représente le « centre » ou la valeur moyenne de l’ensemble des données, l’écart type représente la « propagation » ou la variation des points de données autour de cette moyenne. La courbe de distribution normale est importante car elle facilite l’analyse et l’interprétation des données.
Nous utilisons plusieurs exemples concrets pour illustrer ces concepts et montrer comment les tableaux de distribution normale peuvent être appliqués à différents domaines, tels que le trading d’actions, fournissant ainsi un aperçu des calculs de probabilité pertinents pour l’analyse des données du monde réel.
Un exemple de la distribution normale en action
Considérez les 2 ensembles de données suivants :
- Ensemble de données 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
- Tuple 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
Pour Dataset1, moyenne = 10 et écart type (stddev) = 0
Pour Dataset2, moyenne = 10 et écart type (stddev) = 2,83
Traçons ces valeurs pour DataSet1 :
Idem pour DataSet2 :
La ligne horizontale rouge dans les deux graphiques ci-dessus représente la valeur « moyenne » ou médiane de chaque ensemble de données (10 dans les deux cas). La flèche rose dans le deuxième graphique représente le degré d’écart ou de variation des valeurs des données par rapport à la moyenne. Ceci est démontré par la valeur d’écart type de 2,83 dans le cas de DataSet2. Puisque DataSet1 a toutes les mêmes valeurs (chaque valeur est 10) et aucune variation, la valeur stddev est 0 et donc la flèche rose n’est pas applicable.
La valeur stddev possède plusieurs caractéristiques importantes et utiles qui sont extrêmement utiles dans l’analyse des données. Pour une distribution normale, les valeurs des données sont réparties symétriquement de part et d’autre de la moyenne. Pour tout ensemble de données normalement distribué, en traçant avec stddev sur l’axe horizontal et le nombre de valeurs de données sur l’axe vertical, le graphique suivant est obtenu.
Principales caractéristiques de la distribution normale
- La courbe normale est symétrique par rapport à la moyenne ;
- La valeur moyenne se situe au milieu et divise la zone en deux moitiés ;
- L’aire totale sous la courbe est égale à 1 avec moyenne=0 et stdev=1 ;
- La distribution est complètement décrite par sa moyenne et son stddev
Comme le montre le graphique ci-dessus, stddev représente ce qui suit :
- 68,3% des valeurs de données contenues dans 1 écart type de la moyenne (-1 à +1)
- 95,4% des valeurs de données contenues dans 2 écarts types de valeur moyenne (-2 à +2)
- 99,7% des valeurs de données contenues dans 3 écarts types de valeur moyenne (-3 à +3)
L’aire sous la courbe en cloche, lorsqu’elle est mesurée, indique la probabilité attendue d’une plage donnée :
- plus petit que X : par ex. probabilité que la valeur des données soit inférieure à 70
- supérieur à X : par ex. probabilité que la valeur des données soit supérieure à 95
- entre X1 et X2: par exemple, la probabilité d’obtenir des valeurs de données comprises entre 65 et 85
où X est la valeur d’intérêt (exemple ci-dessous).
Le traçage et le calcul de la zone ne sont pas toujours pratiques car différents ensembles de données auront des valeurs moyennes et standard différentes. Pour faciliter une méthode standard unifiée facilitant le calcul et l’application aux problèmes du monde réel, une conversion standard en valeur Z a été introduite, qui fait partie du Tableau de répartition standard.
Z = (X – Moyenne)/stddev, où X est une variable aléatoire.
Essentiellement, cette conversion force la moyenne et l’écart type à être normalisés respectivement à 0 et 1, ce qui permet d’obtenir un ensemble standard défini de valeurs Z (de Tableau de répartition standard) est utilisé pour des calculs faciles. Un instantané de la table de valeurs z standard contient les valeurs de probabilité suivantes :
|
z |
0,00 |
0,01 |
0,02 |
0,03 |
0,04 |
0,05 |
0,06 |
|
0,0 |
0,00000 |
0,00399 |
0,00798 |
0,01197 |
0,01595 |
0,01994 |
… |
|
0,1 |
0,0398 |
0,04380 |
0,04776 |
0,05172 |
0,05567 |
0,05966 |
… |
|
0,2 |
0,0793 |
0,08317 |
0,08706 |
0,09095 |
0,09483 |
0,09871 |
… |
|
0,3 |
0,11791 |
0,12172 |
0,12552 |
0,12930 |
0,13307 |
0,13683 |
… |
|
0,4 |
0,15542 |
0,15910 |
0,16276 |
0,16640 |
0,17003 |
0,17364 |
… |
|
0,5 |
0,19146 |
0,19497 |
0,19847 |
0,20194 |
0,20540 |
0,20884 |
… |
|
0,6 |
0,22575 |
0,22907 |
0,23237 |
0,23565 |
0,23891 |
0,24215 |
… |
|
0,7 |
0,25804 |
0,26115 |
0,26424 |
0,26730 |
0,27035 |
0,27337 |
… |
|
… |
… |
… |
… |
… |
… |
… |
… |
Pour trouver la probabilité associée à une valeur z de 0,239865, arrondissez-la d’abord à 2 décimales (c’est-à-dire 0,24). Vérifiez ensuite les 2 premiers chiffres significatifs (0,2) dans les lignes et le chiffre le moins significatif (0,04 restant) dans la colonne. Cela donnerait la valeur 0,09483.
Vous pouvez retrouver le tableau complet de distribution normale, avec une précision jusqu’à 5 décimales pour les valeurs de probabilité (y compris celles pour les valeurs négatives), ici.
Regardons quelques exemples concrets. Les tailles des individus dans un grand groupe suivent un modèle de distribution normale. Supposons que nous ayons une population de 100 individus dont les tailles sont enregistrées et dont les valeurs moyennes et standard sont calculées comme étant respectivement de 66 et 6 pouces.
Voici quelques exemples de questions auxquelles il est facile de répondre à l’aide d’un tableau de valeurs z :
Quelle est la probabilité qu’une personne du groupe mesure 70 pouces ou moins ?
La question est de trouver valeur cumulée de P(X<=70) signifie que dans l'ensemble de données complet de 100, combien de valeurs seront comprises entre 0 et 70.
Convertissez d’abord la valeur X de 70 en valeur Z équivalente.
Z = (X – Moyenne)/stddev = (70-66)/6 = 4/6 = 0,66667 = 0,67 (arrondi à 2 décimales)
Nous devons maintenant trouver P (Z <= 0,67) = 0,24857 (à partir du tableau z ci-dessus)
c’est-à-dire qu’il y a une probabilité de 24,857 % qu’un individu du groupe mesurera moins ou égale à 70 pouces.
Mais attendez, ce qui précède n’est pas complet. N’oubliez pas que nous recherchons la probabilité de toutes les hauteurs possibles jusqu’à 70, c’est-à-dire de 0 à 70. Ce qui précède ne vous donne que la partie allant de la moyenne à la valeur souhaitée (c’est-à-dire 66 à 70). Nous devons ajouter l’autre moitié, de 0 à 66, pour obtenir la bonne réponse.
Puisque 0 à 66 représente une demi-fraction (c’est-à-dire une fraction extrême à moyenne), sa probabilité est simplement de 0,5.
Par conséquent, la probabilité correcte qu’une personne mesure 70 pouces ou moins = 0,24857 + 0,5 = 0. 74857 = 74,857%
Graphiquement (en calculant la surface), voici deux régions totales qui représentent la solution :
Quelle est la probabilité qu’une personne mesure 75 pouces ou plus ?
c’est-à-dire trouver Accumulation supplémentaire P(X>=75).
Z = (X – moyenne)/stddev = (75-66)/6 = 9/6 = 1,5
P (Z >=1,5) = 1- P (Z <= 1,5) = 1 – (0,5+0,43319) = 0,06681 = 6,681 %
Quelle est la probabilité qu’une personne mesure entre 52 pouces et 67 pouces ?
Trouvez P(52<=X<=67).
P(52<=X<=67) = P ((52-66)/6 <= Z <= (67-66)/6) = P(-2,33 <= Z <= 0,17)
= P(Z <= 0,17) –P(Z <= -0,233) = (0,5+0,56749) - (.40905) =
Ce tableau de distributions normales (et de valeurs z) est couramment utilisé pour tout calcul probabiliste des mouvements de prix attendus sur le marché boursier des actions et des indices. Ils sont utilisés dans le trading de range, identifiant les tendances haussières ou baissières, les niveaux de support ou de résistance et d’autres indicateurs techniques basés sur le concept de distribution normale de la moyenne et de l’écart type.
Conclusion
Une distribution normale est basée sur la moyenne et l’écart type. La valeur Z est utilisée pour simplifier les calculs de probabilité complexes. La distribution normale peut prédire les tendances du marché boursier, effectuer des analyses techniques et comprendre les modèles de données. Les propriétés statistiques clés incluent la symétrie de la moyenne et les modèles de distribution, qui donnent un sens à l’analyse des données.
