Розділ 2 теоретичні І експерементальні дослідження



Сторінка1/3
Дата конвертації12.11.2019
Розмір0.84 Mb.
Назва файлу2й раздел.docx
  1   2   3

РОЗДІЛ 2 ТЕОРЕТИЧНІ І ЕКСПЕРЕМЕНТАЛЬНІ ДОСЛІДЖЕННЯ

2.1 ? =)

2.2 Розробка алгоритму для підтримки прийняття рішень, щодо класифікації залізничних коліс після ультразвукового контролю

5.1 Постановка задачі

В наш час наукова діяльність в техніці, медицині, біології, фізики та інших областях тісно пов'язана з обробкою й аналізом масивів даних, які містять інформацію про об'єкти предметної області. У ході аналізу таких даних, наприклад, в дослідженнях та діагностиці складних багатопараметричних технічних об’єктів, досліднику доводиться вирішувати типові завдання виявлення структурних особливостей у даних, які несуть інформацію про стан об’єкту, а також цілеспрямованого пошуку цих особливостей в даних з метою ідентифікації шуканих станів. Зусилля багатьох дослідників спрямовані на автоматизацію вирішення цих завдань шляхом створення ефективних математичних методів та їх реалізації в алгоритмах класифікації, званих «розпізнаванням з учителем» , і алгоритмах автоматичної класифікації, званих «розпізнаванням без вчителя» або кластеризації . Розробка таких методів представляє для дослідників серйозну проблему, яка називається «проблемою побудови процедури класифікації» , або «проблемою машинного навчання» , центральним питанням якої є вибір (побудова) заходів відмінностей (однорідності) вибірок вимірів багатопараметричних об’єктів. Розглянемо підхід до побудови міри відмінностей, яка призначена для виявлення структурних особливостей у значеннях характеристик елементів досліджуваних множин, та розробці на її основі алгоритмів класифікації, наприклад, залізничних коліс за їх експериментальними даними.



Розглянемо об'єкти класифікації, що знаходяться під впливом трьох чинників, що зумовлюють їх стан. Перша причина пов'язана зі зміною параметру та статистично пов’язана з вимірюваннями та які зв’язуються законами розподілу , .

Друга причина пов’язана із змінами параметру та описується виразами , . Відповідно за третьою причиною , . У цьому випадку для вибірок з нормальним розподілом умовний закон запишеться у вигляді

.

Введемо наступні позначення для спрощення запису законів розподілу , , , та їх кореляційні залежності , , , , , . У цьому випадку випадкові величини , , мають нульове математичне сподівання та одиничну дисперсію, а їх трьохвимірний закон розподілу ймовірностей запишеться у вигляді

.

Цей закон розподілу ймовірностей можливо представити у вигляді .



Вважаючи відомими коефіцієнти кореляції, можна записати вираз для умовних законів розподілу ймовірностей

,

,

.

Умовні математичні сподівання та дисперсії дорівнюють , , , , , .

Ці знання дозволяють формувати тривимірні вибірки випадкових величин для проведення обчислювальних експериментів. Якщо , , , де – нормальні випадкові величини з нульовим математичним сподіванням та одиничною дисперсією (). Коефіцієнти , , визначимо з системи рівнянь



Вирішивши систему рівнянь (5.6) отримаємо коефіцієнти , , .

Маючи у розпорядженні деяке число залізничних коліс з випадковими параметрами та вибірками їх вимірювань, необхідно виділити класи об’єктів з однаковими параметрами. Цю задачу можна вирішити шляхом ентропійних перетворень вибірок вимірювань та перевіркою гіпотез про рівність їх зсувів, масштабів і кореляційних зв’язків на основі критеріїв Ван-дер-Вардена, Клотца та Буша-Вінда.

Розглянемо цю задачу на прикладі наступних двох видів різниці об’єктів. Перший від відмінностей:

1) об’єкти відрізняються лише параметром зсуву;

2) об’єкти відрізняються лише параметром масштабу;

3) об’єкти відрізняються лише статистичними зв’язками (коефіцієнтом кореляції).

Другий вид відмінностей (зсувів, масштабів та кореляції):

1) об’єкти відрізняються одним (невідомим) параметром;

2) об’єкти відрізняються двома (невідомим) параметрами;

3) об’єкти відрізняються всіма (трьома) параметрами.



Проведемо навчальний обчислювальний експеримент, щоб отримати інформацію про відмінності відповідних ентропійних перетворень, їх гістограми, мінімальні, максимальні та середні значення, вибіркові дисперсії та коефіцієнти варіації та розмахів. Якщо коефіцієнт варіації – це відношення , то коефіцієнт розмаху – . Вважаючи параметри трьох еталонних гаусових вибірок вимірювань відомими (див. таблицю 5.1) визначимо їх ідеальний ентропійний перетворювач .

Таблиця 5.1 – Параметри еталонного ентропійного перетворювача

Параметри



















Еталон

10

20

30

1

2

3

0,8

0,8

0,8

де ,



,

.

Маючи у розпорядженні три вибірки вимірювань незалежних нормальних випадкових величин з нульовим математичним сподіванням та одиничною дисперсією , , , сформуємо три вибірки взаємокорельованих випадкових величин , , . Змінюючи їх параметри дослідимо статистичні закономірності ентропійних перетворювачів відповідно до вказаних вище типів відмінностей змодельованих вибірок від еталону. За першим видом маємо три варіанти відмінностей: 1) , , ; 2) , , ; 3) , ,. Обсяг вимірювань становить .

Статистичні показники ентропійного перетворювача представимо у вигляді таблиці 5.2.



Таблиця 5.2 – Статистичні показники ентропійного перетворювача
















Еталон

3330

5,834

3330

3289

0,018

7,773

1

3337

5,889

3342

3294

0,017

7,7

2

3422

6,112

3446

3399

0,017

7,7

3

5,141

1,487

3,653

11,281

0,237

6,252

За даними таблиці 5.2 можна стверджувати, що, незважаючи на зміни математичного сподівання та дисперсії вхідних даних, зсув та масштаб ентропійного перетворювача лишаються практично незмінними, а при зміни кореляції відбувається суттєве змінення математичного сподівання, та зменшується дисперсія перетворювача. На рисунку 5.1 зображено гістограми тривимірних ентропійних перетворень еталону (рисунок 5.1а) та випадку, коли вхідні дані відрізняються зсувом при незмінних масштабах та коефіцієнтах кореляції еталону (рисунок 5.1б)



Рисунок 5.1 – Гістограми тривимірних ентропійних перетворень а) еталонний ентропійний перетворювач; б) ентропійний перетворювач при зменшені математичного сподівання вхідних даних

З аналізу рисунка 5.1 випливає, що вид закону розподілу ймовірностей ентропійного перетворювача не залежить від зміни статистичних показників вхідних даних.



Дослідимо вплив на перетворювач другого виду відмінностей, а саме: змінимо параметри лише першої з трьох еталонних вибірок (див. таблицю 5.1): 1) , , ; 2) першої та другої еталонних вибірок , , ; , , ; 3) усіх трьох вибірок , , ; , , ; , , . Статистичні показники ентропійного перетворювача представимо у вигляді таблиці 5.3

Таблиця 5.3 – Статистичні показники ентропійного перетворювача
















Еталон

3330

5,834

3330

3289

0,018

7,773

1

4769

7,323

4776

4707

0,015

9,312

2

2805

5,05

2809

2771

0,018

7,58

3

2638

4,413

2642

2609

0,016

7,363

Аналізуючи дані таблиці 5.3 приходимо до висновку, що різниця одного параметру впливає на статистичні показники ентропійного перетворювача набагато сильніше, ніж загальне збільшення чи зменшення математичного сподівання або дисперсії.

Для перевірки можливості використання критерію Буша-Вінда для виявлення відмінностей статистичних закономірностей ентропійних перетворювачів дослідимо ймовірності прийняття рішень щодо однаковості об’єктів контролю у порівнянні з еталоном, при умові, що другий об’єкт моє відмінності від еталону першого і другого класу, при параметрах вказаних вище. Обсяг вимірювань становить , кількість реалізацій 1000. Результати досліду представлені в таблиці 5.4.



Таблиця 5.4 – Ймовірності прийняття рішень щодо однорідності ентропійних перетворювачів за критерієм Буша-Вінда




Еталон

1 клас відмінностей

(параметри, що змінюються)



2 клас відмінностей

(параметри, що змінюються)



МО

Дис.

Кор.



та

, ,



0,994

0,003

0,007

0,894

0,793

0,433

0,004

За даними таблиці 5.4 можна зробити висновок щодо високої ефективності сумісного використання комплексного непараметричного критерію Буша-Вінда та ентропійних перетворень в задачах дефектоскопії. Оскільки критерій в сукупності з ентропійними перетвореннями дають змогу визначити зміни як лише одного з параметрів вимірювань, так і зміну статистичних показників однієї вибірки багатовимірного об’єкту неруйнівного контролю.

5.2 Обробка ентропійних перетворень багатопараметричних вимірювань в задачах підготовки даних для підтримки прийняття класифікаційних рішень


Якщо відомі вибірки вимірювань параметрів об’єктів, то шляхом їх ентропійного перетворення отримаємо одновимірних вибірок і вони мають бути класифіковані. Для вирішення цього завдання скористаємося статистичними критерієм близькості Буша-Вінда для виділення об'єктів, параметри яких відповідають заданим вимогам. В якості еталону візьмемо вибірку та порівняємо її з вибірками , , обчисливши показників Буша-Вінда. Вони є випадковими величинами і при розмірах вибірок описуються законом розподілу хі-квадрат з чотирма ступенями свободи, якщо зсуви і масштаби порівнюваних вибірок рівні. У цьому випадку з ймовірністю 0,95 буде виконаються нерівність [9]. Таким чином з об'єктів можна виділити клас аномальних і використовувати ці знання в задачах дефектоскопії контрольованих об'єктів.

Використовуючи послідовність критеріїв виділимо з неї ті, які відносяться до першого класу



,

де – функція одиничного стрибка

Очевидно, що їх відносне число може служити оцінкою технології виробництва цих об'єктів

.

На основі ентропіних перетворювачів описаних в другому розділі були проведені ентропійні перетворення багатопараметричних об’єктів та досліджена їх статистика для множини об’єктів. Припустимо, що після класифікації виборів виявлено об’єкти четирьох видів.



В якості оброки ентропійних перетворювань пропонується використовувати комплексний критерій непараметричної статистики Буша-Вінда. Як було показано в розділі 4 цей критерій виявляється найефективнішим при обробці даних з невідомими статистичними показниками.

Вважаючи першу вибірку еталонною, обчислимо критерій Буша-Вінда для трьох розмірів та побудуємо гістограми (), а також оцінимо їх математичні сподівання й дисперсії. Дані для проведення експериментів наведені в таблиці 5.5.

Таблиця 5.5 – Параметри об’єкту першого класу






















Норма

10

20

30

1

2

3

0,8

0,8

0,8



Рисунок 5.2 – Гістограми показника Буша-Вінда по ентропійним перетворенням

Порогові значення для цих довжин вибірок дорівнюють 8,65; 9,09 та 9,5. Визначимо число критеріїв . Відношення є оцінкою ймовірності прийняття правильних рішень класифікації:, , .

Результати експерименту представлені в таблиці 5.6.



Таблиця 5.6 – Статистичні показники критерію Буша-Вінда



10

25

50



0,637

0,982

0,993



3,552

5,435

8,863



0,684

1,071

1,427

Статистика показника Буша-Вінда відповідає теоретичним розрахункам авторів, тобто підкоряються розподілу ймовірностей хі-квадрат з чотирма ступенями свободи, при . Розпізнавання об'єктів, як належать до класу 1, зростає при збільшенні обсягу вибірки вимірювань.

Припустимо, що відомі параметри об'єктів другого класу, що відрізняються від параметрів першого класу , , ;, , ; , , . Сфоруємо вибірок ентропійного перетворення з різними варіантами змінених параметрів і проведемо факторний аналіз їх впливу на статистичні закономірності критерію Буша-Вінда. Досліджено вплив на ефективність класифікації тільки зсувів, тільки масштабів і тільки коефіцієнтів кореляції, а також їх різні поєднання. У таблиці 5.7 наведені результати обчислювальних експериментів. Вони містять показники ймовірностей розпізнавання об'єктів класу 2, як об'єктів, що відносяться до перших класу, а також статистику показника Буша-Вінда.



Таблица 5.7 – Ститистичні показники критерію Буша-Вінда














10

25

50

10

25

50

10

25

50

10

25

50



0,993

0,589

0,02

0,954

0,641

0,046

0,997

0,613

0,045

0,996

0,98

0,9



2,76

2,876

2,598

5,542

8,076

13,877

6,47

8,308

14,17

3,305

4,127

6,011



0,993

1,292

1,478

1,816

2,633

2,902

1,039

2,624

3,111

1,274

2,133

2,471

За результатами таблиці 5.7 побудовані гістограми (рисунок 5.3) показника Буша-Вінда для різних довжин вибірок вихідних даних (), у випадку, коли об'єкти класу 2 відрізняються від об'єктів класу 1 за всіма трьома показниками (математичним сподіванням, дисперсією та коефіцієнтом корреляції).



Рисунок 5.3 – Гістограми показника Буша-Вінда по ентропійним перетворенням при розпізнаванні об'єктів класу 2, як об'єктів класу 1

З аналізу таблиці 5.7 і рисунку 5.3 випливає, що зміна будь-яких показників вхідних величин тягне за собою зміну статистичних показників ентропійних перетворень і показників критерію Буша-Вінда. При збільшенні тільки зсувів зростає математичне сподівання показника Буша-Вінда, при збільшенні дисперсії зростає також математичне сподівання. При руйнуванні кореляції математичне сподіванная показника Буша-Вінда зростає в 3 рази, і також збільшується дисперсія. У випадку, коли змінюються всі статистичні показники вхідних даних розпізнавання об'єктів відбувається з більшою похибкою.



Спостерігається висока ймовірність розпізнавання класу об’єкту контролю при використані критерію непараметричної статистики Буша-Вінда для обробки ентропінйих перетворень багатопараметричних об’єктів. При обсягах вимірювань , ймовірність похибки не перевищує 3-5%.

5.3 Дослідження потенційних можливостей класифікації ентропійних вибірок випадкових величин


Задачу оцінки потенційних можливостей класифікації можна вирішити шляхом проведення обчислювальних експериментів. Сформуємо по двадцять трипараметричних вибірок вимірювань з обсягом , маючи у розпорядженні параметри , , , , , , , і , , , , , , , . Оберемо три перших з них і оцінимо їх параметри, наприклад , , , , , , , , та сформуємо ентропійний перетворювач об’єктів 1-ого класу за формулою (5.7).



Поділіться з Вашими друзьями:
  1   2   3


База даних захищена авторським правом ©bezref.in.ua 2019
звернутися до адміністрації

    Головна сторінка