М.М. Герасимова
МЕТОДЫ ОБРАБОТКИ
ЭКСПЕРИМЕНТАЛЬНЫХ ЗАДАЧ НА ЭВМ
Красноярск 2011
Стр.1
Министерство образования и науки Российской Федерации
ГОУ ВПО «СИБИРСКИЙ ГОСУДАРСТВЕННЫЙ
ТЕХНОЛОГИЧЕСКИЙ УНИВЕРСИТЕТ»
Лесосибирский филиал
М.М. Герасимова
Методы обработки
экспериментальных задач на ЭВМ
Утверждено редакционно-издательским советом СибГТУ в качестве
лабораторного практикума для студентов специальности 250401
Лесоинженерное дело направления 250400 Технология
лесозаготовительных и деревообрабатывающих производств очной формы
обучения
Красноярск 2011
Стр.2
2
Герасимова, М.М. Методы обработки экспериментальных задач на
ЭВМ [Текст]: лабораторный практикум для студентов специальности
250401 Лесоинженерное дело направления 250400 Технология
лесозаготовительных и деревообрабатывающих производств очной формы
обучения / М.М. Герасимова. - Красноярск: СибГТУ, 2011. - 104 с.
Рецензенты: канд. физ. - мат. наук Е.Н. Яковлева (СФУ);
доц. Н.Г. Черноусова (научно-методический совет СибГТУ).
Лабораторный
лабораторных
работ
практикум предназначен
по
для
выполнения
дисциплине «Методы обработки
экспериментальных задач на ЭВМ». Он содержит теоретическую,
практическую части и контрольные вопросы по основным темам курса.
© М.М. Герасимова, 2011
© ГОУ ВПО «Сибирский государственный
технологический университет»,
Лесосибирский филиал, 2011
Стр.3
3
СОДЕРЖАНИЕ
Введение ....................................................................................................................... 4
Раздел 1 Статистическая обработка результатов эксперимента ............................ 6
1.1 Статистический анализ вариационных рядов ................................................. 6
Лабораторная работа 1 Получение и статистический анализ
вариационных рядов (4 ч) .................................................................................. 6
1.2 Статистическая проверка статистических гипотез ....................................... 31
Лабораторная работа 2 Проверка гипотезы о нормальном
распределении генеральной совокупности (2 ч) ........................................... 31
Раздел 2 Дисперсионный анализ ............................................................................. 39
2.1 Однофакторный дисперсионный анализ ....................................................... 39
Лабораторная работа 3 Однофакторный дисперсионный анализ (2 ч) ...... 39
Раздел 3 Корреляционно-регрессионный анализ ................................................... 51
3.1 Парная регрессия и корреляция ...................................................................... 51
Лабораторная работа 4 Парный регрессионный анализ (4 ч) ..................... 51
Раздел 4 Метод полного факторного эксперимента .............................................. 73
4.1 Сущность метода полного факторного эксперимента ................................. 73
Лабораторная работа 5 Расчет реализованного плана полного
факторного эксперимента (4 ч) ....................................................................... 73
Библиографический список...................................................................................... 93
Приложение А (справочное) Статистико-математические таблицы ................... 94
Стр.4
4
Введение
Успешное решение задач, стоящих перед лесной промышленностью,
связано с созданием гибких производственных процессов, малоотходных и
ресурсосберегающих технологий, компьютеризацией и автоматизацией
управления производством. Эффективное использование вычислительных
средств с целью принятия научно обоснованных решений в процессе
планирования и управления
возможно
соответствующих методов и программ, а также умении самостоятельно
ставить задачи, решать их с помощью ЭВМ и грамотно анализировать
результаты. Поэтому возникла необходимость в подготовке инженеров,
обладающих соответствующими знаниями математических методов и
моделей, составляющих основу математического обеспечения ЭВМ.
Цель данного лабораторного практикума - научить студентов
современным способам обработки информации, необходимым знаниям
математических методов, которые используются в лесоинженерном деле, и
умению на основе результатов сделать профессиональный вывод.
Лабораторный практикум построен на основе рабочего учебного
плана специальности 250401.65 Лесоинженерное дело направления 250400
Технология лесозаготовительных и деревообрабатывающих производств.
Курс «Методы обработки экспериментальных задач на ЭВМ» общим
объемом 60 часов изучается в течение VI семестра, из них лекций –18
часов, лабораторных занятий – 16 часов, и 26 часов дается студенту на
самостоятельную работу. Изучение курса завершается зачетом.
Лабораторный практикум содержит теоретическую и практическую
части по основным темам курса. В ходе выполнения лабораторной работы
студент получает навыки автоматической обработки данных с помощью
табличного процессора Microsoft Exсel, выполняет расчёты и делает вывод
по обработке статистической информации.
только при знании
Стр.5
5
Прежде чем приступить к выполнению лабораторной работы,
студент должен понять задание, ознакомиться с технологией выполнения
работы и примером решения аналогичной задачи. Выполнив работу,
студент предъявляет отчет, который должен содержать следующие
сведения:
− дату выполнения;
− номер и название работы;
− исходные данные варианта;
− результаты и анализ решения задачи.
Обязательной является защита лабораторной работы. Требования к
защите: студент должен пояснить применение метода решения задачи,
объяснить основные этапы ее решения, сделать выводы и ответить на
контрольные вопросы.
Стр.6
6
Раздел 1 Статистическая обработка результатов
эксперимента
1.1 Статистический анализ вариационных рядов
Лабораторная работа 1
Получение и статистический анализ вариационных рядов
(4 ч)
Цель работы: приобретение навыков получения вариационных
рядов, их графического представления и вычисления оценок основных
числовых характеристик выборки.
Теоретическая часть. При проведении наблюдений и
экспериментов получают количественную информацию по какому-либо
признаку Х. Отдельные значения (варианты) признака
x , 2x ,…, nx
1 `
образуют непрерывный ряд. Последовательность вариант, записанных в
возрастающем порядке, называется вариационным рядом.
Любой вариационный ряд можно преобразовать в дискретный
(интервальный) ряд. Интервальный вариационный ряд получается
группировкой данных, в результате исходный ряд разбивается на
определённое количество интервалов. Каждый интервал характеризуют
его нижняя и верхняя границы, середина интервала и количество значений
признака, которые в него попадают (частота).
Группировка данных выполняется в следующем порядке:
1. Определяется количество интервалов. При производственных
исследованиях исходят из того, что количество интервалов k при малой
выборке (n<30) должно быть k =5 - 6, при большой выборке (n>30) k =8 - 10.
В научных исследованиях количество интервалов рассчитывается по
формуле:
k =1 3,3 lg2+
n,
(1)
Стр.7
7
где п – объём выборки.
Вычисляется длина интервала h по формуле:
х
h =
max − х
k
min
=
1 3,3 lg21
min
х
max − х
+
⋅
n
,
(2)
где хmax,, хmin – максимальное и минимальное значения признака.
2. Устанавливаются нижняя и верхняя границы интервалов. Нижняя
граница первого интервала определяется следующим образом:
2
а
0 = хmin
−
а аi
i = −1
+
h
.
Верхняя граница интервала с номером i определяется по формуле
h
,
где а - верхняя граница ( 1 )−i
интервала);
i− 1
(3)
(4)
- го интервала (нижняя граница i - го
i = 1,2,3 .... .
4. Составляются интервальный и дискретный ряды распределения
случайной величины Х (таблицы 1, 2).
Таблица 1 – Форма табличного представления интервального ряда
распределения
Границы интервала
Частота i
n
Относительная частота i
w
Таблица 2 – Форма табличного представления дискретного ряда
распределения
Середина интервала i
х
Частота i
n
Относительная частота i
w
Стр.8
8
Серединой интервала является среднее значение указанного
интервала, которое для i -го интервала вычисляется по формуле
2
хi = −i 1 + ai
a
.
(5)
Ряд делится на интервалы до тех пор, пока максимальное значение
хmax не попадёт в последний интервал.
Частота – это количество значений признака, которые попадают в
данный интервал.
Относительная частота вычисляется по формуле
w ni
где i
i = ,
n
w - относительная частота, соответствующая i-му интервалу;
i
(6)
n - частота, соответствующая i-му интервалу.
Сгруппированный ряд распределения может быть представлен как в
табличной форме (таблицы 1, 2), так и в графическом виде. Существует
несколько графических способов изображения данных. Так, ряд
распределения может быть представлен гистограммой и полигоном
распределения.
Гистограмма частот (относительных частот) строится для
изображения ряда распределения в виде прямоугольников. На оси абсцисс
откладываются верхние и нижние границы интервалов, на оси ординат
откладывают частоту (относительную частоту). Граничные линии
проводятся перпендикулярно оси абсцисс (рисунок 1).
Полигон частот (относительных частот) – это ломаная, отрезки
которой соединяют точки (xi n;
i )
( (xi w;
i )) . На оси абсцисс откладывают
середины интервалов, а на оси ординат – частоту (относительную частоту)
(рисунок 2).
Стр.9
9
10
15
20
25
0
5
15
21
27
33
39
Середина интервала
Рисунок 1 – Гистограмма частот
10
15
20
25
0
5
0 6 12 18 24 30 36 42 48 54 60
Середина интервала
Рисунок 2 – Полигон частот
Основными статистическими показателями ряда распределения
являются средние значения и показатели вариации признака.
Выборочная средняя для сгруппированного ряда распределения
вычисляется по формуле
x = =1
i
∑ ixni
n
n
,
(7)
45
51
Частота
Частота
Стр.10
10
где x - выборочная средняя;
i
n – частота, соответствующая i – му интервалу;
х – середина i –го интервала;
i
n – объём выборки.
Центр ряда распределения, кроме среднего значения, характеризуют
непараметрические показатели – медиана и мода.
Медиана – это значение вариационного ряда, которое делит его на
две равные совокупности.
Мода – это наиболее часто встречающееся значение вариационного
ряда.
Для характеристики варьирования признака вычисляют следующие
статистики: выборочная дисперсия, выборочное среднее квадратическое
отклонение, коэффициент вариации.
Выборочная дисперсия характеризует разброс значений признака X
относительно выборочной средней:
n
S
2
∑ (xi − x ni
2
)
= 1i=
n
.
(8)
Эта величина показывает среднюю изменчивость вариант в ряду
распределения, но так как дисперсия - величина квадратичная, это не
позволяет использовать данный статистический показатель
в
сравнительном анализе.
Выборочное среднее квадратическое отклонение показывает среднее
отклонение вариант от центра ряда распределения:
∑ (xi − x ni
2
n
S
=
i=1
n
)
.
(9)
Стр.11
11
Среднее квадратическое отклонение – величина линейная, что
позволяет характеризовать выборочную совокупность, показывая меру
рассеяния вариант по отношению к центру распределения. Но этот
статистический показатель не может использоваться для сравнения
изменчивости разных признаков.
Коэффициент вариации характеризует изменчивость признаков в
сопоставимых единицах (процентах):
V S
= ⋅1 %00
x
,
(10)
где x - выборочная средняя;
S – выборочное среднее квадратическое отклонение.
По величине коэффициента вариации устанавливают меру
изменчивости признака (таблица 3).
Таблица 3 – Соответствие между коэффициентом вариации и
изменчивостью признака
Коэффициент вариации
до 5%
6 – 10%
11 – 20%
21 – 50%
51% и более
Изменчивость признака
слабая
умеренная
значительная
большая
очень большая
Достоинство этого показателя в том, что он может использоваться
для сравнения изменчивости признаков, имеющих разную размерность,
недостаток заключается в том, что коэффициент вариации зависит от
среднего значения, поэтому при небольших значениях средних величин
наблюдаются высокие величины коэффициентов вариации.
Выборочный коэффициент асимметрии характеризует асимметрию
распределения:
Стр.12
12
А* ∑ (xi − x ni
3
n
=
Выборочный
i=1
n S
⋅
коэффициент
островершинность распределения
Э =
* ∑ (xi − x ni
4
n
i=1
n S
⋅
4
)
− 3.
(12)
Эти числовые характеристики служат для сравнения эмпирического
(наблюдаемого) распределения с нормальным, для которого оба этих
коэффициента равны нулю. Для предварительного выбора закона
распределения вычисляют средние квадратические ошибки определения
коэффициентов асимметрии и эксцесса:
SA =
( ) ( )3
n
SЭ =
+ ⋅ +
−
6 (n
1
( ) ( ) ( )5
2
n
24 (n n
1
− ⋅ + ⋅ +
− ⋅ −
n
2) (n
3
n
1)
n
,
3)
.
(13)
(14)
Если выборочные коэффициенты асимметрии и эксцесса отличаются
от нуля не более чем на удвоенные средние квадратические ошибки их
определения, то можно сделать предположение, что эмпирическое
распределение случайной величины Х является нормальным.
Пример выполнения работы
Выполним статистический анализ результатов наблюдений,
представленных в таблице 4.
3
)
.
эксцесса
(11)
характеризует
Стр.13
13
Таблица 4 – Исходные данные
5,2 4,8 3,8 4,4 4
7,8 9,1 7 6,2 7
6
5
6 7,6 5 4,8
5 11 6,4 5,6
6,2 4,4 7,2 5,8 6,8 6 6,8 6,6 5,8 7,8
4,2 9 8,2 6,6 9,4 5,6 6,6 6,2 5,2 6,4
8,6 9,3 7 6,2 5,2 5
7 7,8 5,8 5
7,4 6,2 2,8 5 4,8 4,8 6,8 7 6,8 4,4
8 7,6 5,6 4,8 4,8 8,4 7,2 4,8 4,6 9
7
5,4 10,3 2,4 6 5,6 5 5,6 5,4 7,6 5,4
6,2 6 5,4 2,8 4,4 6,4 4,6 4,6 7,8 6,4
1. Для удобства обработки данных их надо сгруппировать. С этой
целью найдем наибольшее и наименьшее наблюдаемые значения
исследуемой случайной величины Х:
х = х
max
1 ,1 min
= 2, 4 . Вычисление этих
значений выполняется в Excel с помощью функций МАКС и МИН.
Все остальные наблюдаемые значения находятся в промежутке
[х , хm ]ax
min
. Разобьем этот отрезок на интервалы. По формуле (2)
определим длину частичного интервала h:
1 2,41
h =
−
1 3,321 l 100g
+
⋅
a =
0 2,4 1,1 =−
=1, 1.
Начало первого интервала рассчитаем по формуле (3):
2 1, 85
.
Таким образом, минимальное значение случайной величины
Х (СВ )X попадает в середину первого частичного интервала. Для
определения конца интервала с номером i будем использовать формулу
(4), где
i = 1,2,3 .... . Процесс вычислений прекращаем, когда при каком -
8 5,2 5,6 4,8 6,6 6,4 9,2 7,2 7,6
Стр.14
14
либо значении i
a
a станет больше или равно max
i
интервалы будем считать закрытыми справа.
0 1,8 ,5=
a =
a =
a =
a =
a =
a =
a =
a =
a =
нужно.
После разбивки всего диапазона изменений значений СВХ на 9
частичных интервалов необходимо подсчитать число значений, попавших
в каждый из них, т.е. частоту i
n , соответствующую данному интервалу.
Частоту можно найти в табличном редакторе Microsoft Excel при помощи
функции ЧАСТОТА. Ее аргументами являются массив данных и массив
интервалов.
Массивом данных являются значения случайной величины Х из
таблицы 1. В Excel они введены в ячейки А1:А100. Массив интервалов -
1 1, 58 1,1 2, 95,
2 2, 59 1,1 4, 05 ,
3 4, 50 1,1 5, 15,
4 5, 51 1,1 6, 25,
5 6, 52 1,1 7, 35,
6 7, 53 1,1 8, 45,
7 8, 54 1,1 9, 55,
8 9, 55 1,1 1 , 650
9 1 , 50 6 1,1 1 , 751
+ =
+ =
+ =
+ =
+ =
+ =
+ =
+ =
+ =
15,32> max
х . Полученные
,
.
х , поэтому дальнейшее вычисление производить не
Стр.15
15
значения границ интервалов, в нашем примере это значения 0a ,…, a , в
9
Excel - массив С2:С11 (рисунок 3). Формулу для подсчета частот
необходимо ввести как формулу массива. Сначала формула вводится в
одну ячейку, например, D2. Затем выделяем диапазон D2:D11, нажимаем
клавишу F2, а затем - клавиши CTRL+SHIFT+ENTER.
Рисунок 3 – Окно Аргументы функции ЧАСТОТА
В ячейках D2:D11 выводится количество значений случайной
величины Х, находящихся в интервале, правой границей которого является
соответствующее значение в массиве С2:С11. Так, например, значение в
ячейке D3, равное 3, есть частота, соответствующая интервалу (1,8 ;2,9 ]55
.
Так как в массиве данных нет значений, меньших, чем нижняя граница
первого интервала, то в ячейке D2 выводится значение, равное нулю
(рисунок 4).
На основании результатов вычислений по формуле (6) определим
относительные частоты iw , по формуле (5) - середины частичных
интервалов и составим интервальный и дискретный ряды распределения
случайной величины Х (таблицы 5, 6).
Стр.16