Qu’est-ce qu’un intervalle de confiance et comment est-il calculé ?

Qu’est-ce qu’un intervalle de confiance ?

Un intervalle de confiance, en statistique, fait référence à la probabilité qu’un paramètre de population se situe entre un ensemble de valeurs pendant une proportion de temps donnée. Les analystes utilisent souvent des intervalles de confiance qui contiennent 95 % ou 99 % des observations attendues. Par conséquent, si une estimation ponctuelle est générée à partir d’un modèle statistique de 10,00 avec un intervalle de confiance à 95 % de 9,50 à 10,50, on peut en déduire qu’il existe une probabilité de 95 % que la valeur réelle se situe dans cette plage.

Les statisticiens et autres analystes utilisent des intervalles de confiance pour comprendre la signification statistique de leurs estimations, inférences ou prédictions. Si un intervalle de confiance contient la valeur zéro (ou une autre hypothèse nulle), alors on ne peut pas affirmer de manière satisfaisante qu’un résultat de données générées par des tests ou une expérimentation est attribuable à une cause spécifique plutôt qu’au hasard.

Points clés à retenir

  • Un intervalle de confiance indique la probabilité qu’un paramètre se situe entre une paire de valeurs autour de la moyenne.
  • Les intervalles de confiance mesurent le degré d’incertitude ou de certitude d’une méthode d’échantillonnage.
  • Ils sont également utilisés dans les tests d’hypothèses et les analyses de régression.
  • Les statisticiens utilisent souvent des valeurs de p ainsi que des intervalles de confiance pour mesurer la signification statistique.
  • La plupart du temps, ils sont construits en utilisant des niveaux de confiance de 95% ou 99%.

Comprendre les intervalles de confiance

Les intervalles de confiance mesurent le degré d’incertitude ou de certitude d’une méthode d’échantillonnage. Ils peuvent prendre n’importe quel nombre de limites de probabilité, la plus courante étant un niveau de confiance de 95 % ou 99 %. Les intervalles de confiance sont établis à l’aide de méthodes statistiques, comme un test t.

Les statisticiens utilisent des intervalles de confiance pour mesurer l’incertitude dans une variable d’échantillon. Par exemple, un chercheur sélectionne au hasard différents échantillons de la même population et calcule un intervalle de confiance pour chaque échantillon pour voir dans quelle mesure il peut représenter la vraie valeur de la variable de population. Les ensembles de données résultants sont tous différents ; certains intervalles incluent le paramètre de population réel et d’autres non.

un intervalle de confiance est une plage de valeurs, délimitée au-dessus et au-dessous de la moyenne de la statistique, qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l’intervalle de confiance contienne le vrai paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire. Ou, dans la langue vernaculaire, “nous sommes sûrs à 99 % (niveau de confiance) que la plupart de ces échantillons (intervalles de confiance) contiennent le véritable paramètre de population”.

La plus grande idée fausse concernant les intervalles de confiance est qu’ils représentent le pourcentage de données d’un échantillon donné qui se situe entre les limites supérieure et inférieure. Par exemple, on pourrait mal interpréter l’intervalle de confiance à 99 % susmentionné de 70 à 78 pouces comme indiquant que 99 % des données d’un échantillon aléatoire se situent entre ces nombres. Ceci est incorrect, bien qu’il existe une méthode distincte d’analyse statistique pour faire une telle détermination. Cela implique d’identifier la moyenne et l’écart type de l’échantillon et de tracer ces nombres sur une courbe en cloche.

L’intervalle de confiance et le niveau de confiance sont interdépendants, mais ils ne sont pas exactement la même chose.

Calcul de l’intervalle de confiance

Supposons qu’un groupe de chercheurs étudie les hauteurs des joueurs de basket-ball du secondaire. Les chercheurs prennent un échantillon aléatoire de la population et établissent une taille moyenne de 74 pouces.

La moyenne de 74 pouces est une estimation ponctuelle de la moyenne de la population. Une estimation ponctuelle en elle-même est d’une utilité limitée car elle ne révèle pas l’incertitude associée à l’estimation ; Vous n’avez pas une bonne idée de la distance entre cette moyenne d’échantillon de 74 pouces et la moyenne de la population. Ce qui manque, c’est le degré d’incertitude dans cet échantillon unique.

Les intervalles de confiance fournissent plus d’informations que les estimations ponctuelles. Al establecer un intervalo de confianza del 95 % utilizando la media y la desviación estándar de la muestra, y asumiendo una distribución normal representada por la curva de campana, los investigadores llegan a un límite superior e inferior que contiene la media real el 95 % de les fois.

Supposons que la plage se situe entre 72 pouces et 76 pouces. Si les chercheurs prennent 100 échantillons aléatoires de la population de joueurs de basket-ball du secondaire dans son ensemble, la moyenne devrait se situer entre 72 et 76 pouces dans 95 de ces échantillons.

Si les chercheurs veulent une confiance encore plus élevée, ils peuvent élargir l’intervalle de confiance à 99 %. Cela crée invariablement une plage plus large, car cela laisse de la place pour un plus grand nombre de moyennes d’échantillons. S’ils fixent l’intervalle de confiance à 99 % entre 70 et 78 pouces, ils peuvent s’attendre à ce que 99 des 100 échantillons testés contiennent une valeur moyenne entre ces nombres.

Un niveau de confiance de 90 %, d’autre part, implique que nous nous attendrions à ce que 90 % des estimations d’intervalle incluent le paramètre de population, et ainsi de suite.

Que révèle un intervalle de confiance ?

Un intervalle de confiance est une plage de valeurs, délimitée au-dessus et au-dessous de la moyenne de la statistique, qui contiendrait probablement un paramètre de population inconnu. Le niveau de confiance fait référence au pourcentage de probabilité, ou de certitude, que l’intervalle de confiance contienne le vrai paramètre de population lorsque vous tirez plusieurs fois un échantillon aléatoire.

Pourquoi utilise-t-on des intervalles de confiance ?

Les statisticiens utilisent des intervalles de confiance pour mesurer l’incertitude dans une variable d’échantillon. Par exemple, un chercheur sélectionne au hasard différents échantillons de la même population et calcule un intervalle de confiance pour chaque échantillon pour voir dans quelle mesure il peut représenter la vraie valeur de la variable de population. Les ensembles de données résultants sont tous différents, certains intervalles incluant le paramètre de population réel et d’autres non.

Qu’est-ce qu’une idée fausse commune sur les intervalles de confiance ?

La plus grande idée fausse concernant les intervalles de confiance est qu’ils représentent le pourcentage de données d’un échantillon donné qui se situe entre les limites supérieure et inférieure. En d’autres termes, il serait incorrect de supposer qu’un intervalle de confiance de 99 % signifie que 99 % des données d’un échantillon aléatoire se situent entre ces limites. Ce que cela signifie vraiment, c’est que l’on peut être sûr à 99% que la plage contiendra la moyenne de la population.

Qu’est-ce qu’un test t ?

Les intervalles de confiance sont établis à l’aide de méthodes statistiques, comme un test t. Un test t est un type de statistique inférentielle utilisé pour déterminer s’il existe une différence significative entre les moyennes de deux groupes, qui peut être liée à certaines caractéristiques. Le calcul d’un test t nécessite trois valeurs de données clés. Ils incluent la différence entre les valeurs moyennes de chaque ensemble de données (appelée différence moyenne), l’écart type de chaque groupe et le nombre de valeurs de données dans chaque groupe.

Comment sont interprétés les P-values ​​et l’intervalle de confiance ?

Une valeur de p est une mesure statistique utilisée pour valider une hypothèse par rapport aux données observées qui mesure la probabilité d’obtenir les résultats observés, en supposant que l’hypothèse nulle est vraie. En général, une valeur de p inférieure à 0,05 est considérée comme statistiquement significative, auquel cas l’hypothèse nulle doit être rejetée. Cela peut correspondre quelque peu à la probabilité que la valeur de l’hypothèse nulle (qui est souvent zéro) soit contenue dans un intervalle de confiance de 95 %.

La ligne du bas

Les intervalles de confiance permettent aux analystes de comprendre la probabilité que les résultats des analyses statistiques soient réels ou dus au hasard. Lorsque vous essayez de faire des inférences ou des prédictions basées sur un échantillon de données, il y aura une certaine incertitude quant à savoir si les résultats d’une telle analyse correspondent réellement à la population réelle étudiée. L’intervalle de confiance représente la plage probable dans laquelle la valeur réelle devrait se situer.