Математическая статистика - (лекции)
p>Это могут быть, условно говоря, "параметрические" программы, ориентированные на тот или иной тип распределения. Их назначение–найти по данным имеющихся наблюдений статистическую значимость гипотез о параметрах таких распределений или, наоборот, по заданным пользователем параметрам рассчитать вероятности всех (! ) заданных им ситуаций. Вполне реально создание и использование "непараметрических" программ –способных анализировать входные данные наблюдений и проверять гипотезы о принадлежности случайной величины к любому из "известных этой программе" закону распределения.Наконец, использование компьютерной техники современного уровня позволяет решать за вполне приемлемое время и небольшую цену еще один вид задач–статистического моделирования. Сущность этого термина раскрывается в специальной области кибернетики– системном анализе, но кратко может быть раскрыта следующим образом. Пусть некоторая случайная величина Z является, по нашим представлениям, функцией двух других случайных величин – X и Y. При этом оказывается, что X зависит от двух также случайных величин A и B, а Y зависит от трех случайных событий C, D и E. Так вот, в этом "простом" случае мы знаем или предполагаем, что знаем вероятности всех событий и законы распределения всех случайных величин, кроме "выходной" величиныZ.
Для простоты будем считать функциональные зависимости также известными (например, – вытекающими из некоторых законов природы):
Z = X – ; X = A + ;
A = 1, 2 , … 16 и распределена по биномиальному закону с параметром p= 0. 42; B – распределена по нормальному закону с m=12 и s =2;
Y = 42, если произошло событие C, а события D и E не произошли; Y = 177, если произошли события D и E, независимо от того, произошло ли C; Y = –15 во всех остальных случаях.
Ясно, что попытка строить для этого примера–шутки логическую схему, по которой можно было бы вычислять возможные значения Z и соответствующие этим значениям вероятности, обречена на провал –слишком сложными и не поддающимися аналитическому описанию окажутся наши выкладки.
Однако же, при наличии знаний хотя бы основных положений прикладной статистики и умении программировать, вполне оправданно потратить некоторое время на создание программы и ее обкатку, проверку по правилам статистики.
Далее можно будет "проигрывать" все возможные ситуации и буквально через секунды получать "распределение случайной величиныZ" в любом виде (кроме, разумеется, формульного). Итак, надо уметь программировать операции, дающие случайную величину с заранее оговоренным законом распределения. Большинство языков программирования высокого уровня имеют встроенные подпрограммы (процедуры или функции в языкеPascal), обеспечивающие генерацию случайной величины R, равномерно распределенной в диапазоне 0…1. Будем полагать, что в нашем распоряжении имеется такой "датчик случайных чисел".
Покажем, как превратить такую величину R в дискретную с биномиальным законом распределения. Пусть нам нужна случайная величинаK, с целочисленными значениями от 0 до N при значении заданном значении параметра p. Один из вариантов алгоритма такой генерации мог бы выглядеть так. Var X, P: Real;
I, K, N: Integer;
K: =0;
For I: =1 to N Do
Begin
X: = R;
If X>(1– p)
Then K: =K+1
End;
После очередного цикла генерации мы получаем случайную величину K, распределенную по биномиальному закону настолько надежно, насколько удачной является функция генерации числаR. Во избежание сомнений стоит потратить время на обкатку такого алгоритма –повторив цикл 100 или 1000 раз и проверив надежность генерации по данным "наблюдений" с помощью теоретических значений математического ожиданияN·p и дисперсии N·p·(1–p).
Несколько более сложно генерировать непрерывные случайные величины, в частности для популярных распределений– нормального, "хи–квадрат", Стьюдента и т. п.
Дело здесь в том, что непрерывная случайная величина имеет бесконечное число допустимых значений, даже если интервал этих значений ограничен.
Но, вместе с тем, для конкретного закона распределения непрерывной случайной величины известна плотность вероятности–предел, к которому стремится вероятность попадания такой величины в заданный интервал при сужении интервала до нуля.
Покажем эти трудности и пути их преодоления на примере нормального распределения. Пусть нам требуется генерировать нормированную случайную величинуZ с нормальным законом распределения.
Для такой величины m =0, s =1, а попадание ее значений в диапазон более 3 или менее –3 практически невероятно (около 0. 0027).
Разобьем диапазон –3…+3 на 2N+1 интервалов, шириной 2d каждый. При достаточно малом d= 3 / N, вероятность попадания Z в любой из них вычисляется легко: P(–d
P( d P(3d P(5d ……………………………………………
P(2·d– d ………………………………………………………
P(2N·d– d
Поскольку 2·P0+2·P1+2·P2+ …+2·PN @1, то можно предложить следующий алгоритм генерации нормированной случайной величины Z .
Вся шкала допустимых значений генерации равномерно распределенной случайной величиныX (0…1) разбивается на интервалы с шириной, соответствующей значениям PK, в порядке убывания. Если при очередной генерации равномерно распределенной случайной величины X ее значение попадает в интервалы – 0. 5 – P0
0. 5 + P0
0. 5+P0+P1
0. 999
Литература
Название
Автор
Год
Прикладная Статистика
Айвазян С. А. и др.
1983
Стохастические модели социальных процессов
Бартоломью Д.
1987
Прикладная комбинаторная математика
Беккенбах Э. (ред. )
1968*
Математическая статистика вып. 1, 2
Бикел П. , Доксам М.
1987
Таблицы математической статистики
Большев Л. Н. , Смирнов Н. В.
1965*
Комбинаторика
Виленкин Н. Я.
1969*
Многомерное шкалирование
Дейвисон М.
1988
Методы анализа данных
Дидэ Э. и др.
1987
Теория распределений
Кэндалл М. , Стьюарт А.
1966
Статистические выводы и связи
Кэндалл М. , Стьюарт А.
1973*
Теоретическая статистика
Кокс Д. , Хинкли Д.
1978*
Математические методы статистики
Крамер Г.
1975*
Ранговые корреляции
Кэндалл М.
1975*
Математические методы в социальных науках
Лазарсфельд П. , Генри Н.
1973*
Проверка статистических гипотез
Леман Э.
1985
Метод наименьших квадратов
Линник Ю. В.
1962
Справочник по прикладной статистике т. 1
Ллойд Э. , Ледерман У.
1989*
Справочник по прикладной статистике т. 2
Ллойд Э. , Ледерман У.
1990*
Наука об управлении. Байесовский подход
Моррис У.
1971*
Вероятность
Мостеллер Ф.
1969*
Вычисл. алгоритмы в прикладной статистике
Мэйндоналд Дж.
1988*
Стат. оценивание и проверка гипотез на ЭВМ
Петрович М. Л. , Давидович М. И.
1989*
Математическое открытие
Пойа Д.
1970*
Теория вероятностей
Прохоров Ю. В. , Розанов Ю. А.
1973*
Прикладная теория статистических решений
Райфа Г. , Шлейфер Р.
1987
Введение в комбинаторный анализ
Риордан Дж.
1963*
Справочник по непараметрической статистике
Рунион Р.
1982*
Сборник задач по теории вероятностей…
Свешников А. А.
1965*
Непараметрические методы статистики
Тюрин Ю. Н.
1978
Статист. модели в инженерных задачах
Хан Г. , Шапиро С.
1969*
Статист. выводы, основанные на рангах
Хеттманспергер Т.
1987
Непараметрические методы статистики
Холлендер М. , Вулф Д.
1983
Элементарная теория статистических решений
Чернов Г. , Мозес Л.
1962*
Теория вероятностей, мат. статистика…
Шторм Р.
1970*
© От автора $
Конспект содержит расширенное содержание лекций и семинаров по курсу "Математическая статистика" для специальностей "Финансы и кредит" (набора 1995 г. ) и соответствует сокращенной программе (18 часов лекций, 18 часов семинаров). Онтодидактическое назначение курса– создание логико–математической базы для изучения курса "Основы теории систем и системного анализа", а также для курса "Экономическая статистика", от которого и была, по сути дела, отделена примерно третья часть под данный курс. Назначение его, кроме отмеченного выше, –обеспечить запас фундаментальных знаний, необходимый для восприятия еще двух дисциплин цикла информационных технологий–"Компьютерная техника и программирование" (в части курсового проекта) и "Основы теории информационных систем".
Проф. Корнилов Г. И.
март 1997 г.
Оглавление
1. Введение в курс 1—2
1. 1 Основные определения 1—2
1. 2 Вероятности случайных событий 1—3
2. Распределения вероятностей случайных величин 2—5
2. 1 Шкалирование случайных величин 2—5
2. 2 Законы распределений дискретных случайных величин. 2—6
2. 3 Односторонние и двухсторонние значения вероятностей 2—9 2. 4 Моменты распределений дискретных случайных величин. 2—9 2. 5 Распределения непрерывных случайных величин 2—13
2. 5. 1 Нормальное распределение 2—14
2. 5. 2 Распределения выборочных значений параметров нормального распределения 2—16 3. Взаимосвязи случайных величин 3—16
3. 1 Парная корреляция 3—16
3. 2 Множественная корреляция 3—17
4. Проверка статистических гипотез 4—18
4. 1 Понятие статистической гипотезы 4—18
4. 2 Критерии статистических гипотез 4—19
4. 3 Ошибки при проверке статистических гипотез 4—20
5. Выборочные распределения на шкалах Int и Rel 5—21
5. 1 Оценка наблюдений при неизвестном законе распределения 5—22 5. 2 Оценка наблюдений при известном законе распределения 5—24 5. 2. 1 Оценка параметров нормального распределения 5—24
5. 2. 2 Оценка параметров дискретных распределений 5—27
6. Выборочные распределения на шкале Nom 6—28
6. 1 Случай двухзначной случайной величины, N 6. 2 Случай двухзначной случайной величины, N>50 6—29
6. 3 Случай многозначной случайной величины 6—30
7. Выборочные распределения на шкале Ord 7—31
8. Материал семинарских занятий 8—34
8. 1 Введение в комбинаторику 8—34
8. 2 Методы вычисления моментов распределений 8—36
8. 3 Алгоритмы простейших статистических расчетов 8—36
8. 3. 1 Вычисление моментов выборочных распределений 8—37
8. 3. 2 Проблема переполнения 8—37
8. 3. 3 Моделирование законов распределения 8—38
9. Литература 9—42
Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12