polenadisto: (bat)
[personal profile] polenadisto
Когда еще в курсе теорвера рассказывают о параметрах случайных величин, как-то стороной обходят причину того, что основным параметром разброса является дисперсия, то есть средний квадрат отклонения от среднего (да, точнее говорить про математическое ожидание, чем про среднее, но тут сойдет и так).
Вначале обычно бойко доказывается, что бессмысленно использовать среднее отклонение от среднего - ибо оно равно нулю для любой случайной величины (на то оно и среднее!). После чего говорится, что вот - чтобы положительные и отрицательные величины друг с другом не аннигилировали. Правда, в итоге показатель разброса оказывается несоизмерим с самой величиной и ее средним значением: меряете вы длину - а дисперсия оказывается площадью, меряете объемы - а дисперсия вообще шестимерными гиперобъемами оказывается! Да, из дисперсии извлекают корень и получают среднеквадратичное отклонение. Но почему исходно не взять, например, модуль?! Что за прихоть математиков?
Помнится, когда я спросил своего преподавателя Мамбы на биофаке, почему не модуль - он ушел от ответа. Ну я так и оставил это дело.
Потом как-то Николай Николаевич Константинов (если кто не знает: ссылка 1 ссылка 2) на беломорской практике биокласса обронил, что, мол, дисперсия в квадрате не потому, что надо положительные и отрицательные отклонения спасти от гарантированного взаимного уничтожения - а потому что "иначе у Гаусса теория не получилась"! Я тогда почему-то вдаваться в детали не стал, но сейчас уже несколько лет разъясняю школьникам и студентам пользу именно такой странной дисперсии (как Гаусс или кто еще из отцов теорвера до этого дошел - всё еще не знаю).

Есть у дисперсии замечательное свойство: дисперсия суммы независимых случайных величин равна сумме их дисперсий. Проще говоря, дисперсию можно раскладывать на компоненты, объясняющие ту или иную долю общей вариации. На это строится и дисперсионный анализ, и метод главных компонент, и количественная генетика - и много чего еще!
А ведь таким свойством не обладает ни гипотетический средний модуль отклонения от среднего, не соизмеримый со средним квадратный корень из дисперсии

Date: 2016-01-27 03:49 pm (UTC)
From: [identity profile] chyyr.livejournal.com
Когда допустимые значения лежат не в евклидовом пространстве, а просто в каком-то множестве с заданным на нем расстоянием между точками. Если на этом множестве не определено сложение точек, мы принципиально не можем определить среднее стандартным образом.


Например, пусть есть какая-то случайная величина со значениями на сфере. Скажем, координаты падения метеоритов на какую-то планету. Хочется найти, куда "в среднем" они падают.

Если просто взять среднее значение по обычной формуле, у нас почти всегда получится точка, лежащая под поверхностью планеты. Выходит, что "в среднем" метеориты падают внутрь планеты - что выглядит довольно странно. А вот если мы для всякой точки А на поверхности посчитаем среднеквадратичное отклонение M|X-A|^2, а потом найдем точку (или, иногда, точки), для которой(ых) оно минимально, то эта точка по определению будет лежать на поверхности. (И если вдруг каким-то чудом планета плоская, эта точка будет совпадать с обычным матожиданием)

April 2017

S M T W T F S
      1
23 45 678
9101112131415
16171819202122
23242526272829
30      

Style Credit

Expand Cut Tags

No cut tags
Page generated Jul. 12th, 2025 05:20 pm
Powered by Dreamwidth Studios