Intéressant

Exemple d'intervalle de confiance pour une variance de population

Exemple d'intervalle de confiance pour une variance de population

La variance de population donne une indication sur la manière de répartir un ensemble de données. Malheureusement, il est généralement impossible de savoir exactement quel est ce paramètre de population. Pour compenser notre manque de connaissances, nous utilisons un sujet de statistiques inférentielles appelé intervalles de confiance. Nous verrons un exemple de la manière de calculer un intervalle de confiance pour une variance de population.

Intervalle de confiance

La formule de l'intervalle de confiance (1 - α) sur la variance de la population. Est donné par la chaîne d'inégalités suivante:

(n - 1)s2 / B < σ2 < (n - 1)s2 / UNE.

Ici n est la taille de l'échantillon, s2 est la variance de l'échantillon. Le nombre UNE est le point de la distribution chi-carré avec n -1 degrés de liberté pour lesquels exactement α / 2 de l'aire sous la courbe est à gauche de UNE. De la même manière, le nombre B est le point de la même distribution chi-carré avec exactement α / 2 de l'aire sous la courbe à droite de B.

Préliminaires

Nous commençons avec un ensemble de données avec 10 valeurs. Cet ensemble de valeurs de données a été obtenu par un échantillon aléatoire simple:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

Une analyse exploratoire des données serait nécessaire pour montrer qu'il n'y avait pas de valeurs aberrantes. En construisant un diagramme à tiges et à feuilles, nous constatons que ces données proviennent probablement d'une distribution approximativement normalement distribuée. Cela signifie que nous pouvons rechercher un intervalle de confiance de 95% pour la variance de la population.

Variance de l'échantillon

Nous devons estimer la variance de la population avec la variance de l’échantillon, indiquée par s2. Nous commençons donc par calculer cette statistique. Nous faisons essentiellement la moyenne de la somme des écarts carrés de la moyenne. Cependant, plutôt que de diviser cette somme par n on le divise par n - 1.

Nous constatons que la moyenne de l'échantillon est 104.2. En utilisant cela, nous avons la somme des écarts carrés de la moyenne donnée par:

(97 - 104.2)2 + (75 - 104.3)2 +… + (96 - 104.2)2 + (102 - 104.2)2 = 2495.6

Nous divisons cette somme par 10 - 1 = 9 pour obtenir un échantillon de variance de 277.

Distribution du Chi-Square

Nous passons maintenant à notre distribution chi-carré. Puisque nous avons 10 valeurs de données, nous avons 9 degrés de liberté. Puisque nous voulons les 95% moyens de notre distribution, nous avons besoin de 2,5% dans chacune des deux queues. Nous consultons une table chi-carré ou un logiciel et constatons que les valeurs de table de 2.7004 et 19.023 englobent 95% de la surface de la distribution. Ces chiffres sont UNE et B, respectivement.

Nous avons maintenant tout ce dont nous avons besoin et nous sommes prêts à établir notre intervalle de confiance. La formule pour le point final gauche est (n - 1)s2 / B. Cela signifie que notre extrémité gauche est:

(9 x 277) / 19,023 = 133

Le bon terminal se trouve en remplaçant B avec UNE:

(9 x 277) / 2,7004 = 923

Nous sommes donc convaincus à 95% que la variance de population se situe entre 133 et 923.

Déviation standard de la population

Bien entendu, l’écart type étant la racine carrée de la variance, cette méthode pourrait être utilisée pour construire un intervalle de confiance pour l’écart type de la population. Tout ce que nous avons besoin de faire est de prendre des racines carrées des points finaux. Le résultat serait un intervalle de confiance de 95% pour l'écart type.