Biais : biais positif et négatif définis avec la formule

Qu’est-ce que l’asymétrie ?

L’asymétrie fait référence à une distorsion ou à une asymétrie qui s’écarte de la courbe en cloche symétrique, ou distribution normale, dans un ensemble de données. Si la courbe se décale vers la gauche ou vers la droite, on dit qu’elle est asymétrique. L’asymétrie peut être quantifiée comme une représentation de la mesure dans laquelle une distribution donnée varie par rapport à une distribution normale. Une distribution normale a une asymétrie de zéro, tandis qu’une distribution log-normale, par exemple, présenterait un certain degré d’asymétrie vers la droite.

Points clés à retenir

  • L’asymétrie, en statistique, est le degré d’asymétrie observé dans une distribution de probabilité.
  • Les distributions peuvent être asymétriques vers la droite (positives) ou asymétriques vers la gauche (négatives) à des degrés divers. Une distribution normale (courbe en cloche) montre une asymétrie nulle.
  • Les investisseurs notent un biais à droite lorsqu’ils jugent une distribution de rendement car, comme l’aplatissement excessif, il représente mieux les extrêmes de l’ensemble de données plutôt que de se concentrer uniquement sur la moyenne.
  • L’asymétrie informe les utilisateurs de la direction des valeurs aberrantes, mais ne leur indique pas le nombre de valeurs aberrantes.
  • L’asymétrie se retrouve souvent dans les rendements boursiers ainsi que dans la répartition du revenu individuel moyen.

comprendre l’asymétrie

Il existe plusieurs types de distributions et de biais. La «queue» ou la chaîne de points de données éloignés de la médiane est affectée à la fois par des biais positifs et négatifs. Le biais négatif fait référence à une queue plus longue ou plus épaisse du côté gauche de la distribution, tandis que le biais positif fait référence à une queue plus longue ou plus épaisse du côté droit. Ces deux biais font référence à la direction ou au poids de la distribution.

De plus, une distribution peut avoir un biais nul. L’écart zéro se produit lorsqu’un graphique de données est symétrique. Quelle que soit la longueur ou l’épaisseur des queues de distribution, une asymétrie nulle indique une distribution normale des données. Un ensemble de données peut également avoir un biais indéfini si les données ne fournissent pas suffisamment d’informations sur sa distribution.

La moyenne des données asymétriques positives sera supérieure à la médiane. Dans une distribution négativement asymétrique, c’est exactement le contraire qui se produit : la moyenne des données négativement asymétriques sera inférieure à la médiane. Si les données sont tracées symétriquement, la distribution a une asymétrie nulle, quelle que soit la longueur ou l’épaisseur des queues.

Les trois distributions de probabilité présentées ci-dessous sont positivement asymétriques (ou asymétriques vers la droite) à un degré croissant. Les distributions asymétriques négativement sont également appelées distributions asymétriques à gauche.

L’asymétrie est utilisée en conjonction avec l’aplatissement pour mieux juger de la probabilité d’événements tombant dans les queues d’une distribution de probabilité.

Mesure d’asymétrie

Il existe plusieurs façons de mesurer l’asymétrie. Les premier et deuxième coefficients d’asymétrie de Pearson sont deux méthodes courantes. Le premier coefficient d’asymétrie de Pearson, ou asymétrie modale de Pearson, soustrait le mode de la moyenne et divise la différence par l’écart type. Le deuxième coefficient d’asymétrie de Pearson, ou asymétrie médiane de Pearson, soustrait la médiane de la moyenne, multiplie la différence par trois et divise le produit par l’écart type.

Formule de l’asymétrie de Pearson

 S k 1 = X ˉ − M os ‾ S k 2 = 3 X ˉ − M ds où : S k 1 = le premier coefficient d’asymétrie de Pearson et S k 2 le second s = l’écart type pour l’échantillon X ˉ = est le valeur moyenne M o = la valeur modale (mode) M d = est la valeur médiane \begin{aligned} &\begin{pooled} Sk _1 = \frac {\bar{X} – Mo}{s} \\ \ underline {\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\qquad\quad} \\ Sk _2 = \frac {3\bar{X} – Md}{s} \end { collecté }\\ &\textbf{où :}\\ &Sk_1=\text{le premier coefficient d’asymétrie de Pearson et }Sk_2\\ &\qquad\ \ \ \text{ le second}\\ &s=\text{l’écart type pour le sample}\\ &\bar{X}=\text{est la valeur moyenne}\\ &Mo=\text{la valeur modale (mode)}\\ &Md=\text{est la valeur médiane} \ end{aligned} ​Sk1​=sXˉ−Mo​​Sk2​=s3Xˉ−Md​​où : Sk1​=le premier coefficient d’asymétrie de Pearson et Sk2​ secondes=l’écart type pour l’échantillonXˉ=est la valeur moyenne Mo =la valeur modale (mode) Md = est la valeur de la médiane

Le premier coefficient d’asymétrie de Pearson est utile si les données montrent un mode fort. Si les données ont un mode faible ou plusieurs modes, le deuxième coefficient de Pearson peut être préférable, car il ne repose pas sur le mode comme mesure de tendance centrale.

L’asymétrie vous indique où les valeurs aberrantes se produisent, mais elle ne vous indique pas combien de valeurs aberrantes se produisent.

Que vous dit l’asymétrie ?

Les investisseurs remarquent une asymétrie lorsqu’ils jugent une distribution de rendement car, comme le kurtosis, il considère les extrêmes de l’ensemble de données plutôt que de se concentrer uniquement sur la moyenne. Les investisseurs à court et moyen terme, en particulier, devraient surveiller les extrêmes car ils sont moins susceptibles de détenir une position suffisamment longtemps pour croire que la moyenne se résoudra d’elle-même.

Les investisseurs utilisent souvent l’écart type pour prédire les rendements futurs, mais l’écart type suppose une distribution normale. Étant donné que peu de distributions de performances s’approchent de la normale, l’asymétrie est une meilleure mesure sur laquelle baser les prédictions de performances. Cela est dû au risque d’asymétrie.

Le risque d’asymétrie est le risque le plus élevé qu’un point de données fortement asymétrique apparaisse dans une distribution asymétrique. De nombreux modèles financiers qui tentent de prédire la performance future d’un actif supposent une distribution normale, dans laquelle les mesures de la tendance centrale sont égales. Si les données sont biaisées, ce type de modèle sous-estimera toujours le risque de biais dans ses prédictions. Plus les données sont biaisées, moins ce modèle financier sera précis.

Distribution des rendements asymétrique vers la droite.

Exemples de distribution asymétrique

El alejamiento de los retornos “normales” se ha observado con más frecuencia en las últimas dos décadas, comenzando con la burbuja de Internet de fines de la década de 1990. De hecho, los rendimientos de los activos tienden a estar cada vez más sesgados hacia la droite. Cette volatilité s’est produite lors d’événements notables, tels que les attentats terroristes du 11 septembre, l’effondrement de la bulle immobilière et la crise financière qui a suivi, ainsi que pendant des années d’assouplissement quantitatif (QE).

Le marché boursier au sens large est souvent considéré comme ayant une distribution asymétrique négative. L’idée est que le marché renvoie plus souvent un petit rendement positif plus souvent une grande perte négative. Cependant, des études ont montré que les capitaux propres d’une entreprise individuelle peuvent avoir tendance à être biaisés vers la gauche.

Un exemple courant d’asymétrie est la répartition du revenu des ménages aux États-Unis, car les gens sont moins susceptibles de gagner un revenu annuel très élevé. Par exemple, considérons les statistiques sur le revenu des ménages de 2020. Le quintile de revenu le plus bas variait de 0 $ à 27 026 $, tandis que le quintile de revenu le plus élevé variait de 85 077 $ à 141 110 $. sont plus étalés et provoquent une distribution positivement asymétrique.

Que nous dit l’asymétrie ?

L’asymétrie nous indique la direction des valeurs aberrantes. Dans un biais positif, la queue d’une courbe de distribution est plus longue du côté droit. Cela signifie que les valeurs aberrantes sur la courbe de distribution sont plus à droite et plus proches de la moyenne à gauche. L’asymétrie ne rapporte pas le nombre de valeurs aberrantes ; il ne signale que la direction des valeurs aberrantes.

Qu’est-ce qui cause l’asymétrie?

L’asymétrie est simplement le reflet d’un ensemble de données où l’activité est fortement condensée dans une plage et moins condensée dans une autre. Imaginez les scores mesurés dans une compétition olympique de saut en longueur. De nombreux sauteurs sont susceptibles d’atterrir sur de plus longues distances, tandis qu’un plus petit nombre est susceptible d’atterrir sur des distances plus courtes. Cela crée souvent une distribution asymétrique à droite. Par conséquent, la relation entre les points de données et la fréquence à laquelle ils se produisent génère une asymétrie.

L’asymétrie est-elle normale ?

L’asymétrie est couramment rencontrée lors de l’analyse d’ensembles de données, car il existe des situations où l’asymétrie est simplement un composant de l’ensemble de données en cours d’analyse. Par exemple, considérons la durée de vie humaine moyenne. Étant donné que la plupart des gens ont tendance à mourir plus tard dans la vie, relativement moins d’individus ont tendance à mourir lorsqu’ils sont plus jeunes. Dans ce cas, l’asymétrie est normale et attendue.

Que signifie une forte asymétrie ?

Une asymétrie élevée signifie qu’une courbe de distribution a une courte queue à une extrémité, une courbe de distribution et une longue queue à l’autre. L’ensemble de données suit une courbe de distribution normale ; cependant, des données plus asymétriques signifient que les données ne sont pas uniformément réparties. Les points de données favorisent un côté de la distribution en raison de la nature des données sous-jacentes.