Национальный цифровой ресурс Руконт - межотраслевая электронная библиотека (ЭБС) на базе технологии Контекстум (всего произведений: 634699)
Контекстум
.

Математическая статистика (110,00 руб.)

0   0
АвторыКаширина Ирина Леонидовна, Чудинова Ксения Владиславовна
ИздательствоИздательский дом ВГУ
Страниц51
ID748001
АннотацияУчебно-методическое пособие подготовлено на кафедре математических методов исследования операций факультета прикладной математики, информатики и механики Воронежского государственного университета.
Кому рекомендованоРекомендовано для студентов 2-го курса факультета прикладной математики, информатики и механики, изучающих предмет «Теория вероятностей и математическая статистика».
Математическая статистика / И.Л. Каширина, К.В. Чудинова .— Воронеж : Издательский дом ВГУ, 2019 .— 51 с. — 51 с. — URL: https://rucont.ru/efd/748001 (дата обращения: 24.04.2024)

Предпросмотр (выдержки из произведения)

Математическая_статистика.pdf
Стр.1
Стр.3
Стр.6
Стр.7
Стр.8
Стр.9
Стр.10
Математическая_статистика.pdf
МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ» И.Л. Каширина, К.В. Чудинова МАТЕМАТИЧЕСКАЯ СТАТИСТИКА Учебно-методическое пособие Воронеж Издательский дом ВГУ 2019
Стр.1
Оглавление Математическая статистика. ..............................................................................4 Статистическое распределение выборки. .........................................................5 Полигон частот, гистограмма частот. ............................................................7 Числовые характеристики статистического распределения выборки. ......9 Статистические оценки параметров распределения. ................................ 14 Методы получения оценок. .......................................................................... 15 1) Метод моментов. ................................................................................... 15 2) Метод максимального правдоподобия. ............................................... 16 Оценки параметров генеральной совокупности по случайной выборке. 17 Интервальные оценки параметров. ............................................................. 25 Построение доверительного интервала для генеральной средней и генеральной доли по большим выборкам. ..................................................... 25 Оптимальный объем выборки ..................................................................... 27 Таблица для определения оптимального объема выборки ................... 28 Оценка характеристик генеральной совокупности по малой выборке 31 Проверка статистических гипотез .................................................................. 32 Проверка гипотез о равенстве средних двух совокупностей. .................. 34 Проверка гипотез о равенстве дисперсий .................................................. 37 Регрессионный анализ. .................................................................................... 44 Поле корреляции. Эмпирическая линия регрессии ...................................... 45 3
Стр.3
генеральной совокупности извлечена выборка объёма n наблюдаемых значений этой случайной величины, причём значение 𝑥1 наблюдается в выборке 𝑛1 раз, 𝑥2 − 𝑛2 раз, … 𝑥𝑘 − 𝑛𝑘 раз, при этом ∑ 𝑛 𝑘 𝑖=1 𝑖 = 𝑛. Различные наблюдаемые значения 𝑥𝑖 случайной величины Х называют вариантами. Последовательность вариант, записанная в порядке неубывания, называется вариационным рядом. Количество повторений 𝑛𝑖 называется частотой варианты 𝑥𝑖. А отношение 𝑛𝑖 𝑛 относительной частотой (или частостью) варианты 𝑥𝑖. Статистическим распределением выборки называется перечень вариант и соответствующих им частот (или относительных частот). Пример 1: Рассмотрим выборку, составленную из оценок 20 студентов на экзамене по теории вероятностей. 1) Выборка: 5,4,3,3,2,4,4,4,5,4,5,4,3,3,2,4,4,4,5,4. 2) Вариационный ряд: 2, 2,3,3,3,3,4,4,4,4,4,4,4,4,4,4,5,5,5,5. 3) Статистический ряд (распределение выборки): xi 2 3 4 5 ni 2 4 10 4 Обозначим через 𝑛𝑥 – число наблюдений в выборке, в которых наблюдаемое значение признака было меньше, чем x. Эмпирической функцией распределения называют функцию 𝐹∗(𝑥) = 𝑛𝑥 эмпирической функции распределения выборки 𝐹∗(𝑥), функцию распределения F(x) случайной величины Х, вычисленную по всей генеральной совокупности, называют теоретической функцией распределения. Эмпирическая функция распределения используется для оценки теоретической функции распределения генеральной совокупности. При возрастании объема выборки различия между F*(x) и F(x) уменьшаются. 6 𝑛 . В отличие от
Стр.6
Рис. 1. График эмпирической функции распределения для примера 1. Свойства эмпирической функции распределения аналогичны свойствам теоретической функции распределения случайной величины: 1) F*(x) – неубывающая функция; 2) 0≤ F*(x) ≤1 ; 3) если x1 – наименьшая варианта, а xk – наибольшая, то F*(x)=0 при x ≤x1 и F*(x)=1 при x>xk. Полигон частот, гистограмма частот Полигоном частот называют ломаную линию, которая соединяет точки (𝑥1, 𝑛1); (𝑥2, 𝑛2); … (𝑥𝑘, 𝑛𝑘). 0 1 2 3 4 5 6 7 8 9 1 2 3 4 5 Рис. 2 Полигон частот для примера 1. Полигоном относительных частот (частостей) называют ломаную, 7 6
Стр.7
которая соединяет точки (𝑥𝑖, 𝜔𝑖); где 𝜔𝑖 = 𝑛𝑖 𝑛 . В тех случаях, когда различных значений наблюдаемых значений признака слишком много (когда значение признака – непрерывная случайная величина), принято строить не полигон частот, а гистограмму частостей. Для этого значение признака разбивают на несколько интервалов и для каждого интервала подсчитывают сумму частот вариант, попавших в этот интервал. Гистограммой относительных частот (частостей) называют ступенчатую фигуру, составленную из прямоугольников, основаниями которых служат интервалы длиной ℎ𝑖, а высотой 𝑛𝑖 𝑛ℎ𝑖 . Значения ℎ𝑖 чаще всего выбирают одинаковые (но это не обязательно). Формула Стерджесса: рекомендуемое число интервалов определяется 𝑚 = [1 + 3.3221 lg 𝑛], где [.] – целая часть. Величина 𝑚𝑎𝑥−𝑥𝑖 по формуле интервала Δ = 𝑥𝑖 1+3.3221 lg 𝑛. 𝑚𝑖𝑛 Пример 2 : Рассмотрим выборку, составленную из роста 50-ти случайно отобранных студентов-юношей факультета ПММ. 1) Выборка: 173, 175, 180,182, 170, 168, 177, 187, 180, 176, 182, 164, 170, 174, 188, 177, 168, 176, 178, 185, 172, 174, 180, 166, 172, 178, 190, 174, 177, 178, 175,170, 172, 189, 180, 192, 166,187, 180, 177, 184, 180, 176, 175, 184, 169, 193, 171, 177. Согласно формуле Стерджесса m=6, Δ=4.3. С учетом того, что рост измерялся с точностью до целого значения, округлим Δ до 4-х. Получим: xi [164;169) [169;174) [174;179) [179;184) [184;189) [189;194) ni 6 10 16 Посчитаем частости по формуле 𝑤𝑖 = 𝑛𝑖 гистограмму (рис. 3) 8 9 6 3 𝑛Δ , с учетом n=50, Δ=4, и построим
Стр.8
0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0 [164;169) [169;174) [174;179) [179;184) [184;189) [189;194) Рис. 3. Гистограмма относительных частот для примера 2. Числовые характеристики статистического распределения выборки элементов выборки: Выборочной средней называют среднее арифметическое значение всех 𝑥̅ = 1 𝑛 ∑ 𝑥𝑖 𝑛 распределение выборки, то применяют сокращённую формулу: 𝑥̅ = 1 𝑛 ∑ 𝑥𝑖𝑛𝑖 𝑘 𝑖=1 . Если статистический ряд представлен в интервальной форме, тогда в качестве 𝑥𝑖 берётся середина каждого интервала. Свойства выборочной средней: 1. Если все элементы выборки увеличить (или уменьшить) в одно и то же число раз, то выборочная средняя увеличится (или уменьшится) в такое же число раз: 𝑘𝑥̅̅̅ = 𝑘𝑥̅. 2. Если все элементы выборки увеличить (или уменьшить) на одно и то же число, то выборочная средняя увеличится (или уменьшится) на это число: 𝑐 + 𝑥̅̅̅̅̅̅̅ = 𝑐 + 𝑥̅. 3. Выборочная средняя суммы (или разности) нескольких признаков ̅̅̅̅̅̅̅ = равна сумме (или разности) выборочных средних этих признаков: 𝑥 ± 𝑦 𝑥̅ ± 𝑦̅. 9 𝑖=1 . Если известно статистическое
Стр.9
4. Среднее отклонение от выборочной средней равно 0: 𝑥 − 𝑥̅ 5. Если объединить несколько выборок, то выборочная средняя ̅̅̅̅̅̅̅ =0. объединённого ряда является средним значением групповых средних, причём весами являются объёмы выборок: 𝑥̅ = 1 𝑛 ∑ 𝑥𝑖̅𝑛𝑖 𝑘 𝑖=1 выборочная средняя i-й выборки, 𝑛 = ∑ 𝑛𝑖 𝑘 𝑖=1 . Выборочная мода Mв– это варианта с наибольшей частотой. Выборочная медиана – значение признака, приходящееся на середину вариационного ряда. Если объём выборки n – чётное число, то медиана 𝑀𝑒 = 𝑥𝑛 2 +𝑥𝑛 2+1 2 , если n – нечётное число, то 𝑀𝑒 = 𝑥𝑛+1 2 . Вариационный размах R – разность между последним и первым элементом вариационного ряда. Выборочная дисперсия – среднее значение квадратов отклонения вариант от выборочной средней: 𝐷в = 1 𝑛 ∑ (𝑥𝑖 − 𝑥̅)2𝑛𝑖 𝑘 𝑖=1 . Свойства выборочной дисперсии: 1. Дисперсия признака, имеющего постоянное значение, равна 0. 2. Если все варианты увеличить или уменьшить в k раз, то выборочная 𝑘2 дисперсия увеличится или уменьшится в 𝐷в(𝑘𝑥) = 𝑘2𝐷в(𝑥) раз. 3. Если все варианты увеличить или уменьшить на одно и то же число, то выборочная дисперсия не изменится: 𝐷в(𝑥 ± 𝑐) = 𝐷в(𝑥) 4. Сокращённая формула для вычисления выборочной дисперсии имеет вид: 𝐷в = 1 5. 𝑛 ∑ 𝑥𝑖 𝑘 𝑖=1 2𝑛𝑖 − 𝑥̅2 = 𝑥2 − (𝑥̅)2. Если выборка состоит из нескольких групп наблюдения, то общая дисперсия равна сумме среднего значения групповых дисперсий и межгрупповой дисперсии: 𝐷в = 𝐷̅в 𝑖 + ∆2, где 𝐷̅в 𝑖 = 1 10 𝑛 ∑ 𝐷в 𝑖 𝑛𝑖 𝑘 𝑖=1 , 𝑛𝑖  объём iой группы, k  количество групп, Dв 𝑖  выборочная дисперсия в i-ой группе, , где 𝑥𝑖̅
Стр.10

Облако ключевых слов *


* - вычисляется автоматически
.