Intéressant

Médians de distribution exponentielle

Médians de distribution exponentielle

La médiane d'un ensemble de données est le point médian où exactement la moitié des valeurs de données sont inférieures ou égales à la médiane. De la même manière, nous pouvons penser à la médiane d'une distribution de probabilité continue, mais plutôt que de trouver la valeur médiane dans un ensemble de données, nous trouvons le milieu de la distribution d'une manière différente.

La surface totale sous une fonction de densité de probabilité est 1, représentant 100%. Par conséquent, la moitié de celle-ci peut être représentée par un demi ou 50%. Une des grandes idées de la statistique mathématique est que la probabilité est représentée par l'aire sous la courbe de la fonction de densité, qui est calculée par une intégrale, et donc la médiane d'une distribution continue est le point de la droite des nombres réels où exactement la moitié de la zone se trouve à gauche.

Cela peut être indiqué plus succinctement par l'intégrale incorrecte suivante. La médiane de la variable aléatoire continue X avec fonction de densité F( X) est la valeur M telle que:

0,5 = ∫m −ff (x) dx0,5 = int_ {m} ^ {- infty} f (x) dx0,5 = m − f (x) dx

Médiane pour la distribution exponentielle

Nous calculons maintenant la médiane pour la distribution exponentielle Exp (A). Une variable aléatoire avec cette distribution a une fonction de densité F(X) = e-X/UNE/ A pour X tout nombre réel non négatif. La fonction contient également la constante mathématique e, approximativement égal à 2,71828.

Comme la fonction de densité de probabilité est nulle pour toute valeur négative de X, tout ce que nous devons faire est d’intégrer les éléments suivants et de résoudre pour M:

0,5 = ∫0M f (x) dx

Depuis l'intégrale e-X/UNE/Un dX = -e-X/UNE, le résultat est que

0,5 = -e-M / A + 1

Cela signifie que 0,5 = e-M / A et après avoir pris le logarithme naturel des deux côtés de l'équation, nous avons:

ln (1/2) = -M / A

Depuis 1/2 = 2-1, par propriétés de logarithmes, nous écrivons:

- ln2 = -M / A

Multiplier les deux côtés par A nous donne le résultat que la médiane M = A ln2.

Inégalité médiane moyenne en statistique

Une conséquence de ce résultat doit être mentionnée: la moyenne de la distribution exponentielle Exp (A) est A, et puisque ln2 est inférieur à 1, il en résulte que le produit Aln2 est inférieur à A. Cela signifie que la médiane de la distribution exponentielle est inférieur à la moyenne.

Cela a du sens si l’on pense au graphique de la fonction de densité de probabilité. En raison de la longue queue, cette distribution est biaisée vers la droite. Plusieurs fois, lorsqu'une distribution est asymétrique à droite, la moyenne est à droite de la médiane.

En termes d'analyse statistique, cela signifie que nous pouvons souvent prédire que la moyenne et la médiane ne sont pas directement corrélées étant donné la probabilité que les données soient faussées à droite, ce qui peut être exprimé par la preuve de l'inégalité médiane moyenne connue sous le nom d'inégalité de Chebyshev.

A titre d'exemple, considérons un ensemble de données selon lequel une personne reçoit 30 visiteurs au total en 10 heures, le temps d'attente moyen d'un visiteur étant de 20 minutes, tandis que l'ensemble de données peut indiquer que le temps d'attente médian se situe quelque part. entre 20 et 30 minutes si plus de la moitié de ces visiteurs sont venus dans les cinq premières heures.