МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
«ВОРОНЕЖСКИЙ ГОСУДАРСТВЕННЫЙ
УНИВЕРСИТЕТ»
Ю.С. Радченко, А.В. Захаров, А.В. Зюльков
МЕТОДЫ ОБРАБОТКИ И ПЛАНИРОВАНИЯ
ЭКСПЕРИМЕНТА
Часть 1
ОЦЕНКА РАСПРЕДЕЛЕНИЙ И ИХ ПАРАМЕТРОВ
Учебно-методическое пособие
Воронеж
Издательский дом ВГУ
2016
Стр.1
ОГЛАВЛЕНИЕ
Введение....................................................................................................... 4
1. Методы оценок числовых характеристик распределений
случайных величин ............................................................................................ 5
2. Оценки при известном (с точностью до параметров) распределении
выборки .............................................................................................................. 13
3. Выборочные распределения и их анализ............................................ 18
4. Оценки, основанные на порядковых статистиках ............................. 27
5. Робастные оценки параметров ............................................................. 32
Библиографический список ..................................................................... 38
3
Стр.3
1 1
1 1
Fn x z,()
cnormx()
0.5
Fn x z,()
cnorm x()
0.5
0
0
0
− 4
4 20 2
x
n = 1000
Рис. 1.1
На рис. 1.1 приведены выборочная функция распределения ()n
(1.1) при разных n и теоретическая функция распределения.
Fx
Предположим, что случайная величина X~ N m,σ ()2
Оценка числовых характеристик и параметров нормального
распределения по независимым результатам наблюдений
Точечные оценки
iX наблюдается
непосредственно (без аномальных ошибок, обусловленных «засорением»
выборки). Можно показать, что оценки параметров m и 2Xσ будут определяться
следующими выражениями для всех методов:
− оценка математического ожидания (выборочное среднее)
mX X
== n =
1 n
σ
;
i 1
i
− оценка дисперсии (выборочная дисперсия):
при условии, что математическое ожидание известно,
≡= − Xm ;
22
XX i
i
s
n =1
XX i()2
6
≡= − =SX X
1 ()
n
2
при условии, что математическое ожидание неизвестно
22
σ nn n==
(1.5)
2
11
11
ii
−−−
Xi
11 1
nn
n
−
X .
2
(1.4)
(1.3)
4
4
0
4
− 4
2 024
x
n = 200
4
Стр.6
фективными. Их дисперсии определяются следующим образом:
{ }
при условии, что математическое ожидание известно,
{ }24 422
DSX XX= σ
nnS≈
σ
; (при n >> 1);
при условии, что математическое ожидание не известно,
{ }24 422
X 11
DS XX=
nn s
−−≈
ся следующими выражениями:
()
mX 1= x ;
n
n
k
ki
i=1
M (X )= x X ;
n
ki
i=1
1
(при n >> 1).
Старшие начальные и центральные выборочные моменты определяютn
()k
− ()
k= 3, 4, ... ,
которые дают состоятельные и эффективные оценки характеристик гауссовской
случайной величины.
Для определения коэффициентов асимметрии и эксцесса можно воспользоваться
следующими выражениями:
A X=
{} () ()3
3
1
E X= X m / S –iX 3 .
i=1
{} () ()4
4
1
n −
nSX
n
Интервальные оценки параметров
Для совместного анализа точности и надежности рассмотренных оценок
используют доверительные интервалы, соответствующие заданной доверительной
вероятности P0 :
ния ()Xγ
Пусть ()Xγ
)
Pd () () 12 0θ≤≤ =
X d X P .
dX X
dX X
1
2
() () ,
() () .
γ
γ
=−Δ
=+Δ
p
p
Тогда можно записать (1.6) с учетом (1.7)
()
7
PX Pγθ−Δ ≤ − ≤ Δ = .PP 0
1.8)
(1.6)
– точечная оценка. Тогда (для симметричного распределе
(1.7)
2
−X m ;
i
n
i=1
Эти оценки (1.3)−(1.5) являются несмещенными и асимптотически эфDX
2X= σ /n ;
Стр.7
Таким образом, зная распределение случайной величины ()Xγ θ−
можно найти P
Δ .
Следует отметить, что наилучшее качество интервального оценивания
гарантируется только при гауссовском распределении и резко падает при
отклонениях от него.
Оценка математического ожидания при известной
дисперсии выборки
Оценка математического ожидания, определенная в соответствии с выражением
(1.3), является несмещенной и имеет гауссовское распределение
2
XN(, )x
рительный интервал
PX m
PP0
[]
1
δ
−≤ ≤ =
−Δ ≤ − ≤ Δ = PPP 0
Pn Xm n
=
Δ− Δ
−≤ ≤
При заданной дисперсии 2xσ статистика
стандартное гауссовское распределение
x dx
Учитывая, что () (
2π−δ
qP
()0
exp −=Φδδ .
2
2
Φ−δδ1= −Φ , получаем
()
)
Обозначим qλ – квантиль порядка q распределения ().0,1N
=+ . Чаще всего берут 0
21 PδΦ− = или δ − 1 1 P0
2
0
1/2
1
P 0.9=
=Φ +
.
, где
, следовательно λ =P 1.645
d= X σλ +p / () /n;
d= X +σλ +p / () /n.
− x 12
2
Очевидно, что 21
dd 2 P
2Δ =
σx
x 12
P λ+P
1/2
n
.
(1.10)
(1.11)
−= Δ . Тогда из полученных соотношений (1.10)
()
На рис. 1.2 приведен график коридора vn
8
() /=Δ σ λ+ (1 )/2
P
x =
n
.
(1.12)
=Δ n /.
−Φ −
Px
= P0
PP
xx
x
=n N
η σ
Xm
x
−
δσ Откуда:
() ( )
σσσ
δη δ
n
P0 .
(1.9)
(0,1) имеет
m n
σ . Поэтому, как правило, рассматривается симметричный дове,
Стр.8
1.645
vn
()
− ()
0
vn
1.5
2
0.5
1
0.5
0
1.5
1
− 1.645
2
0
1
5
10
n
Рис. 1.2
Как видно из графика на рис. 1.2, уменьшение доверительного интервала
с увеличением n замедляется. Так уменьшение доверительного интервала
в 10 раз требует увеличения выборки в 100 раз.
Оценка математического ожидания
при неизвестной дисперсии выборки
В таком случае вместо 2
x
σ берут ее оценку =−− () .
2
SX X
n
2
деление Стьюдента с ν=n − степенями свободы. Границы доверительных
интервалов получаются следующие:
Если дисперсия неизвестна, статистика
1
d= X S t`X 11 2
−
1
2
−
t n1, q qλ
− ≈
d= X S t`X 11 2
n, +P /
n, +P /
− () / n;
− () / n;
(1.13)
(1.14)
Следует отметить, что при достаточно больших n ( n 60...100≥
и вместо выражений (1.13)–(1.14) могут быть использованы
)
(1.10)–(1.11), в которые вместо истинных значений xσ подставляются их
оценки XS.
Расчет длины выборки n
Если задана ширина двустороннего интервала 2 pΔ , в котором с вероятностью
0P должно содержаться истинное значение математического ожидания
m, диапазон отклонений
Δ− X m
(1.11) можно определить n :
9
, то из выражений (1.12), (1.10),
1
Xm
X
Xi
i
1 =1
ξ=nS
−
имеет t − распреn
15
20
20
Стр.9
− при условии известной дисперсии 2
x
px p
− при условии неизвестной дисперсии 2
≥
n λσ / Δλ σ / Δ ;≥= p x p
σx
() (
22
)
ns tn1, 1+P /Xp2
2()2
− () / Δ .
Заданы: Пусть задана доверительная вероятность 0
выборки n , диапазон отклонений Δ− X m
четную формулу
σ n
λ
x = Δ .
q
ки n , дисперсия ошибки единичного измерения. Тогда из (1.12) получаем
(1 )/2
n
Заданы: Задана доверительная вероятность 0
Δ=σλ+
xP
.
В таком случае диапазон нахождения параметра mX
=±Δ .
Оценка числовых характеристик случайных величин
по сгруппированным данным
Пусть исходная выборка XX { }i=
0.274
0.25
0.3
p k
0.15
0.2
0.05
0.1
410
Ч
− 3
0
3
− 2.8
2 10 1
x k
Рис. 1.3
10
2
2.8
3
сгруппирована в M интервалов
длиной h , x j – центр j–го интервала. Соответствующие частоты (оценки
вероятностей попадания в i подинтервал) p j j= ,M ,M n .<<
{ }()1
Расчет доверительной области
P ( 0
Расчет допустимой погрешности измерения x
P ( 0
σ
P = 0.9), объем
. Тогда из (1.12) получаем расσ
для оценки m
22
(1.15)
(1.16)
P = 0.9), объем выбор
Стр.10