загрузка...
 
2.10 Оптимізація рівнів селекції координат двійкових еталонних векторів
Повернутись до змісту

2.10 Оптимізація рівнів селекції координат двійкових еталонних векторів

У загальному випадку адаптація математичного опису на вході класифікатора за ІЕІ-технологією з метою побудови безпомилкових за навчальною матрицею вирішальних правил полягає в реалізації багатоциклічної ітераційної процедури оптимізації за інформаційним КФЕ просторово-часових параметрів функціонування, які впливають на функціональну ефективність ІС, що навчається. Серед таких параметрів важливу роль відіграє рівень селекції (квантування за рівнем) координат двійкових еталонних векторів-реалізацій, образів, які визначають геометричні центри контейнерів класів розпізнавання.

Визначення 2.10.1. Рівнем селекції координат еталонного двійкового вектора називається рівень квантування дискрет полігона емпіричних частот потрапляння значень ознак розпізнавання у свої поля контрольних допусків.

Полігон будується для кожного класу так: по осі абсцис відкладаються ранги ознак розпізнавання, які відповідають номерам ознак у векторі-кортежі  , а по осі ординат – відносні частоти  wm,i =ni /n, де  ni – кількість випробувань, при яких значення  і-ї ознаки знаходиться в своєму полі контрольних допусків. За замовчуванням на практиці приймається рівень селекції  rm= 0,5. Якщо у процесі навчання знайдено оптимальне значення  <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено  >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.

Оптимізація рівнів селекції у рамках ІЕІ-технології дозволяє розв’язувати такі важливі для підвищення асимптотичної достовірності класифікатора задачі:

центрування контейнерів класів розпізнавання, тобто наближення геометричних центрів контейнерів класів розпізнавання до їх емпіричних центрів розсіювання реалізацій образу;

 максимізація середньої міжкласової кодової відстані для заданого алфавіту у відповідності до максимально-дистанційного  принципу теорії розпізнавання образів.

Параметр  пов’язаний з інформативністю ознак розпізнавання. Наприклад, якщо у процесі навчання знайдено оптимальне значення  <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.

Оптимізацію рівнів селекції координат еталонних векторів доцільно здійснювати за паралельно-послідовним алгоритмом, що дозволяє за алгоритмом паралельної оптимізації визначити стартову квазіоптимальну систему рівнів селекції, а за послідовним – оптимальні рівні селекції для всіх координат еталонних векторів-реалізацій образу. При цьому за умови обґрунтування у загальному випадку нечіткої гіпотези компактності реалізацій образу оптимізацію рівнів селекції  будемо здійснювати на базі інформаційно-екстремального алгоритму навчання.      

Спочатку розглянемо алгоритм оптимізації рівнів селекції координат двійкової реалізації найбільш бажаного для ОПР першого класу , оскільки для інших класів система контрольних допусків на ознаки розпізнавання  залишається незмінною.

Нехай дано  алфавіт класів розпізнавання , навчальна матриця типу “об’єкт-властивість”  , де N, n – кількість ознак розпізнавання та реалізацій образу відповідно. Задано  структурований вектор параметрів функціонування системи, що навчається розпізнавати реалізації класу : ,  який складається з еталонної реалізації   класу ,  геометричного параметра  – кодової відстані гіперповерхні контейнера  класу  від  вершини еталонної реалізації . Задано допустимі області значень відповідних параметрів: , де  – бінарний простір ознак потужності N; , де  – еталонна реалізація сусіднього (найближчого до ) класу ,  параметра контрольного поля допусків , де   – нормоване (експлуатаційне) поле допусків на ознаки розпізнавання і рівень селекції  координат еталонної реалізації , .

Треба на етапі навчання за апріорно класифікованими реалізаціями нечітких образів побудувати оптимальне в інформаційному розумінні чітке розбиття  дискретного простору ознак  на  М класів розпізнавання  шляхом ітераційної оптимізації координат вектора параметрів функціонування  за умови, що значення усередненого за алфавітом   інформаційного КФЕ навчання ІС набуває глобального максимуму в робочій (допустимій) області визначення його функції.

Діаграма відображень множин, що застосовуються при оптимізації рівнів селекції координат еталонних векторів у процесі навчання ІС, має вигляд

                                                                 (2.10.1)

У діаграмі (2.10.1) оператори контура

  (2.10.2)

оптимізують рівні селекції координат двійкових еталонних векторів-реалізацій образів.

Оптимальний  рівень селекції   координат еталонного вектора  визначається у результаті реалізації багатоциклічної ітераційної процедури

                       ,                    (2.10.3)

де   – область допустимих значень параметра ;           – область допустимих значень параметра поля допусків ; – область допустимих значень ознак розпізнавання;  – область допустимих значень параметра .

Оптимальні рівні селекції координат еталонних векторів інших класів визначаються за процедурою максимізації інформаційного КФЕ навчання ІС розпізнавати реалізації класу :

                           .                  (2.10.4)     (3.3.3)

Таким чином, процедура (2.10.4) на відміну від процедури (2.10.3) не реалізує алгоритм оптимізації контрольних допусків на ознаки розпізнавання, оскільки вони визначаються тільки для пріоритетного для ОПР класу  . При цьому внутрішні цикли алгоритмів (2.10.3) і (2.10.4) реалізуються послідовно операторами, які утворюють базовий контур (2.8.2). Для алгоритму (3.3.2) наступний цикл реалізується послідовністю операторів контуру (2.9.4) і зовнішній цикл - послідовністю операторів контуру оптимізації рівнів селекції (2.10.5).

Розглянемо детальніше схему алгоритму послідовної оптимізації рівнів селекції:

1. Обнуляється лічильник ознак розпізнавання: і:=0.

2. і:=і+1.

3. Встановлюємо значення для верхнього ?v та нижнього ?n  рівнів селекції відповідно.

4. Встановлюємо крок зміни рівня селекції  ?с.

5. Обнуляється лічильник кроків оптимізації рівня селекції: z:=0.

6.

7. Встановлюємо значення поточного рівня селекції:  ?z:= ?n + ?c.

8. Визначається, наприклад, за ентропійною мірою Шеннона (2.7.4) або критерієм Кульбака (2.7.6). глобальний максимум КФЕ . Якщо маємо декілька однакових значень , то вибираємо значення з найменшим усередненим коефіцієнтом нечіткої компактності реалізацій образу:

                      ,                    (2.10.5)

де  – найближчий еталонний вектор до класу .

Параметри функціонування, які відповідають глобальному максимуму критерію   при  мінімальному  ,  вважаються оптимальними.

9. Якщо ?z < ?v, то виконується крок 6, інакше –10.

10. Якщо , де  N – кількості ознак розпізнавання, то виконується крок 2, інакше – «Зупин».

Як приклад застосування вищенаведеного алгоритму розглянемо оптимізацію кроку квантування за часом вхідних реалізацій у задачі компараторного розпізнавання образів, яка полягає у визначенні належності образу, що розпізнається, до деякого базового (еталонного) образу. Для побудови в процесі навчання системи оптимального контейнера базового класу   у цьому випадку необхідно використовувати реалізації найближчого до нього класу , який має  мінімальну міжцентрову відстань   серед інших класів. Як такі класи розглянемо два зображення, одержані у процесі автофокусування растрового електронного мікроскопа виробництва ВАТ “Selmi” (м. Суми, Україна) за зображенням зразка, що досліджувався. На рис. 2.16а наведено початкове розфокусоване зображення  об’єкта "Ґратка", яке прийнято за базове, а на рис. 2.16б – зображення  того самого об’єкта на наступному кроці самонастроювання мікроскопа після збільшення значення струму фокусуючої лінзи на  10 mA.

Для формування навчальної матриці було вибрано рецепторне поле розміром 310х100 пікселів, тобто , а . За реалізацію  зображення  використовувалася крива розподілу яскравості при скануванні j-го рядка рецепторного поля.

Оптимізація рівнів селекції координат еталонного вектора  здійснювалася одночасно для всіх ознак розпізнавання за структурованим ітераційним алгоритмом (2.10.3) . Як  КФЕ навчання системи використовувався ентропійний критерій (2.7.4).

                   а)

                  б)

Рисунок 2.16 – Зображення об’єкта "Ґратка": а) початкове розфокусоване зображення (клас ) ; б) зображення, одержане на наступному кроці настроювання

мікроскопа  (клас )

У табл. 2.3 наведено одержані при оптимізації контейнера класу  значення нормованого ентропійного критерію  ,  першої достовірності  , помилки другого роду  b, параметрів навчання  r1,    і міжцентрової кодової відстані  .  Аналіз табл. 2.3 показує, що оптимальний рівень селекції координат еталонного  вектора класу   дорівнює  при максимальному значенні нормованого ентропійного критерію . Зрозуміло, що для класу   цей рівень селекції так само є оптимальним.

Таблиця 2.3–Результати оптимізації контейнера  класу

E1

   D1

?

d1

d

dc

0,40

0,67

0,80

0,00

39

12

55

0,42

0,71

0,84

0,00

33

14

4

0,44

0,71

0,84

0,00

33

14

38

0,46

0,71

0,84

0,00

31

14

38

0,48

0,70

0,83

0,00

30

14

43

0,50

0,75

1,00

0,12

38

12

45

0,52

0,79

1,00

0,09

37

12

48

0,54

0,81

1,00

0,08

35

12

48

0,56

0,81

1,00

0,08

35

12

51

0,58

0,76

0,99

0,08

33

12

53

0,60

0,79

1,00

0,09

33

12

51

Як видно з табл. 2.3, КФЕ  має  два максимальні значення (при  і  ). Тому за оптимальний рівень селекції згідно з максимально-дистанційним принципом прийнято  , оскільки при цьому рівні міжкласова  відсань  є більшою, а відповідно відносний коефіцієнт нечіткої компактності (2.10.5) є  меншим. Крім того, варто зазначити, що у даному прикладі значення рівня селекції , яке на практиці використовується за замовчуванням в процесі бінеаризації даних, не є оптимальним в інформаційному розумінні.

Таким чином, алгоритм оптимізації рівнів селекції координат двійкових еталонних векторів-реалізацій образу, як і інших параметрів навчання інтелектуальної ІС, у рамках ІЕІ-технології полягає у наближенні глобального максимуму інформаційного критерію оптимізації, обчисленого в робочій області визначення його функції, до найбільшого граничного значення.



загрузка...