Что такое центральная предельная теорема?

Что такое центральная предельная теорема?
Anonim

Ответ:

Центральная предельная теорема делает строгой интуитивную идею о том, что оценки среднего значения (оцененного по некоторой выборке) некоторого измерения, связанного с некоторой популяцией, улучшаются с увеличением размера выборки.

Объяснение:

Представьте себе лес, содержащий 100 деревьев.

Теперь представьте (довольно нереально), что, измеряемая в метрах, четверть из них имеет высоту 2, четверть из них имеет высоту 3, четверть из них имеет высоту 4, а одна четверть имеет высота 5.

Представьте себе, что вы измеряете высоту каждого дерева в лесу и используете эту информацию для построения гистограммы с подходящими размерами бинов (например, от 1,5 до 2,5, от 2,5 до 3,5, от 3,5 до 4,5 и от 5,5 до 6,5; я понимаю, что я не указал мусорное ведро, к которому принадлежат границы, но это не имеет значения здесь).

Вы можете использовать гистограмму для оценки вероятности распределения деревьев. Понятно, что это не будет нормальным.Фактически, при условии, что конечные точки были выбраны надлежащим образом, они были бы единообразными, поскольку в каждом бине было бы одинаковое количество деревьев, соответствующих одной из указанных высот.

Теперь представьте, что вы идете в лес и измеряете высоту всего двух деревьев; вычислите среднюю высоту этих двух деревьев и запишите это. Повторите эту операцию несколько раз, чтобы у вас была коллекция средних значений для выборок размера 2. Если бы вы строили гистограмму оценок среднего, она больше не была бы однородной. Вместо этого, вероятно, будет больше измерений (оценки среднего значения на основе выборок размера 2) вблизи общей средней высоты всех деревьев в лесу (в данном конкретном случае,

#(2 + 3 + 4 + 5)/4 = 3.5# метров).

Как было бы больше оценки среднего недалеко от истинное население означает (что известно в этом нереалистичном примере), чем далеко от среднего, форма этой новой гистограммы была бы ближе к нормальному распределению (с пиком около среднего).

Теперь представьте, что вы идете в лес и повторяете упражнение, за исключением того, что вы измеряете высоту 3 деревьев, вычисляете среднее значение в каждом случае и записываете это. Гистограмма, которую вы построите, будет иметь еще больше оценок среднего значения около истинного среднего с меньшим разбросом (вероятность выбора трех деревьев в любой выборке, так что все они будут получены из любой из конечных групп - либо из самой высокий или очень короткий --- меньше, чем три дерева с выбором высоты). Форма вашей гистограммы, содержащей оценку среднего размера (каждое среднее на основе трех измерений), будет ближе к форме нормального распределения, и соответствующее стандартное отклонение (оценок среднего, а не родительской совокупности) будет меньше.

Повторите это для 4, 5, 6 и т. Д., Деревьев на среднее значение, и построенная гистограмма будет все больше и больше походить на нормальное распределение (с постепенно увеличивающимися размерами выборки) со средним значением распределение оценки среднего быть ближе к истинному среднему значению, а стандартное отклонение оценок среднего становится все более и более узким.

Если вы повторите упражнение для (вырожденного) случая, в котором измеряются все деревья (в нескольких случаях отмечая среднее значение в каждом случае), то гистограмма будет иметь оценки среднего только в одном из бинов. (тот, который соответствует истинному среднему значению), без каких-либо изменений, так что стандартное отклонение (распределение вероятностей, оцененное из) этой «гистограммы» будет равно нулю.

Итак, центральная предельная теорема отмечает, что среднее значение некоторой оценки среднего некоторой совокупности асимптотически приближается к истинному среднему значению, а стандартное отклонение оценки среднего (а не стандартное отклонение распределения родительской совокупности) становится постепенно меньше для больших размеров выборки.