Среднее значение является наиболее часто используемым показателем центра, но бывают случаи, когда рекомендуется использовать медиану для отображения и анализа данных. Когда было бы целесообразно использовать медиану вместо среднего?

Среднее значение является наиболее часто используемым показателем центра, но бывают случаи, когда рекомендуется использовать медиану для отображения и анализа данных. Когда было бы целесообразно использовать медиану вместо среднего?
Anonim

Когда в вашем наборе данных есть несколько экстремальных значений.

Пример:

У вас есть набор данных 1000 случаев со значениями, не слишком далеко друг от друга. Их среднее значение равно 100, как и их медиана. Теперь вы заменяете только один случай на случай, который имеет значение 100000 (только для крайности). Среднее значение резко возрастет (почти до 200), в то время как медиана останется неизменной.

Расчет:

1000 случаев, среднее = 100, сумма значений = 100000

Потерять 100, добавить 100000, сумма значений = 199900, среднее = 199,9

Медиана (= случай 500 + 501) / 2 остается прежней.