У загальному випадку адаптація математичного опису на вході класифікатора за ІЕІ-технологією з метою побудови безпомилкових за навчальною матрицею вирішальних правил полягає в реалізації багатоциклічної ітераційної процедури оптимізації за інформаційним КФЕ просторово-часових параметрів функціонування, які впливають на функціональну ефективність ІС, що навчається. Серед таких параметрів важливу роль відіграє рівень селекції (квантування за рівнем) координат двійкових еталонних векторів-реалізацій, образів, які визначають геометричні центри контейнерів класів розпізнавання.
Визначення 2.10.1. Рівнем селекції координат еталонного двійкового вектора називається рівень квантування дискрет полігона емпіричних частот потрапляння значень ознак розпізнавання у свої поля контрольних допусків.
Полігон будується для кожного класу так: по осі абсцис відкладаються ранги ознак розпізнавання, які відповідають номерам ознак у векторі-кортежі , а по осі ординат – відносні частоти wm,i =ni /n, де ni – кількість випробувань, при яких значення і-ї ознаки знаходиться в своєму полі контрольних допусків. За замовчуванням на практиці приймається рівень селекції rm= 0,5. Якщо у процесі навчання знайдено оптимальне значення <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.
Оптимізація рівнів селекції у рамках ІЕІ-технології дозволяє розв’язувати такі важливі для підвищення асимптотичної достовірності класифікатора задачі:
центрування контейнерів класів розпізнавання, тобто наближення геометричних центрів контейнерів класів розпізнавання до їх емпіричних центрів розсіювання реалізацій образу;
максимізація середньої міжкласової кодової відстані для заданого алфавіту у відповідності до максимально-дистанційного принципу теорії розпізнавання образів.
Параметр пов’язаний з інформативністю ознак розпізнавання. Наприклад, якщо у процесі навчання знайдено оптимальне значення <0,5, то це свідчить про виявлення принаймні однієї інформативної ознаки, латентність якої полягала саме в її малій частоті появи. Якщо знайдено >0,5, то це свідчить про негативний вплив на прийняття рішень принаймні однієї “заважаючої” ознаки.
Оптимізацію рівнів селекції координат еталонних векторів доцільно здійснювати за паралельно-послідовним алгоритмом, що дозволяє за алгоритмом паралельної оптимізації визначити стартову квазіоптимальну систему рівнів селекції, а за послідовним – оптимальні рівні селекції для всіх координат еталонних векторів-реалізацій образу. При цьому за умови обґрунтування у загальному випадку нечіткої гіпотези компактності реалізацій образу оптимізацію рівнів селекції будемо здійснювати на базі інформаційно-екстремального алгоритму навчання.
Спочатку розглянемо алгоритм оптимізації рівнів селекції координат двійкової реалізації найбільш бажаного для ОПР першого класу , оскільки для інших класів система контрольних допусків на ознаки розпізнавання залишається незмінною.
Нехай дано алфавіт класів розпізнавання , навчальна матриця типу “об’єкт-властивість” , де N, n – кількість ознак розпізнавання та реалізацій образу відповідно. Задано структурований вектор параметрів функціонування системи, що навчається розпізнавати реалізації класу : , який складається з еталонної реалізації класу , геометричного параметра – кодової відстані гіперповерхні контейнера класу від вершини еталонної реалізації . Задано допустимі області значень відповідних параметрів: , де – бінарний простір ознак потужності N; , де – еталонна реалізація сусіднього (найближчого до ) класу , параметра контрольного поля допусків , де – нормоване (експлуатаційне) поле допусків на ознаки розпізнавання і рівень селекції координат еталонної реалізації , .
Треба на етапі навчання за апріорно класифікованими реалізаціями нечітких образів побудувати оптимальне в інформаційному розумінні чітке розбиття дискретного простору ознак на М класів розпізнавання шляхом ітераційної оптимізації координат вектора параметрів функціонування за умови, що значення усередненого за алфавітом інформаційного КФЕ навчання ІС набуває глобального максимуму в робочій (допустимій) області визначення його функції.
Діаграма відображень множин, що застосовуються при оптимізації рівнів селекції координат еталонних векторів у процесі навчання ІС, має вигляд
(2.10.1)
У діаграмі (2.10.1) оператори контура
(2.10.2)
оптимізують рівні селекції координат двійкових еталонних векторів-реалізацій образів.
Оптимальний рівень селекції координат еталонного вектора визначається у результаті реалізації багатоциклічної ітераційної процедури
, (2.10.3)
де – область допустимих значень параметра ; – область допустимих значень параметра поля допусків ; – область допустимих значень ознак розпізнавання; – область допустимих значень параметра .
Оптимальні рівні селекції координат еталонних векторів інших класів визначаються за процедурою максимізації інформаційного КФЕ навчання ІС розпізнавати реалізації класу :
. (2.10.4) (3.3.3)
Таким чином, процедура (2.10.4) на відміну від процедури (2.10.3) не реалізує алгоритм оптимізації контрольних допусків на ознаки розпізнавання, оскільки вони визначаються тільки для пріоритетного для ОПР класу . При цьому внутрішні цикли алгоритмів (2.10.3) і (2.10.4) реалізуються послідовно операторами, які утворюють базовий контур (2.8.2). Для алгоритму (3.3.2) наступний цикл реалізується послідовністю операторів контуру (2.9.4) і зовнішній цикл-послідовністю операторів контуру оптимізації рівнів селекції (2.10.5).
3. Встановлюємо значення для верхнього ?v та нижнього ?n рівнів селекції відповідно.
4. Встановлюємо крок зміни рівня селекції ?с.
5. Обнуляється лічильник кроків оптимізації рівня селекції: z:=0.
6.
7. Встановлюємо значення поточного рівня селекції: ?z:= ?n + ?c.
8. Визначається, наприклад, за ентропійною мірою Шеннона (2.7.4) або критерієм Кульбака (2.7.6). глобальний максимум КФЕ . Якщо маємо декілька однакових значень , то вибираємо значення з найменшим усередненим коефіцієнтом нечіткої компактності реалізацій образу:
, (2.10.5)
де – найближчий еталонний вектор до класу .
Параметри функціонування, які відповідають глобальному максимуму критерію при мінімальному , вважаються оптимальними.
9. Якщо ?z < ?v, то виконується крок 6, інакше –10.
10. Якщо , де N – кількості ознак розпізнавання, то виконується крок 2, інакше – «Зупин».
Як приклад застосування вищенаведеного алгоритму розглянемо оптимізацію кроку квантування за часом вхідних реалізацій у задачі компараторного розпізнавання образів, яка полягає у визначенні належності образу, що розпізнається, до деякого базового (еталонного) образу. Для побудови в процесі навчання системи оптимального контейнера базового класу у цьому випадку необхідно використовувати реалізації найближчого до нього класу , який має мінімальну міжцентрову відстань серед інших класів. Як такі класи розглянемо два зображення, одержані у процесі автофокусування растрового електронного мікроскопа виробництва ВАТ “Selmi” (м. Суми, Україна) за зображенням зразка, що досліджувався. На рис. 2.16а наведено початкове розфокусоване зображення об’єкта "Ґратка", яке прийнято за базове, а на рис. 2.16б – зображення того самого об’єкта на наступному кроці самонастроювання мікроскопа після збільшення значення струму фокусуючої лінзи на 10 mA.
Для формування навчальної матриці було вибрано рецепторне поле розміром 310х100 пікселів, тобто , а . За реалізацію зображення використовувалася крива розподілу яскравості при скануванні j-го рядка рецепторного поля.
Оптимізація рівнів селекції координат еталонного вектора здійснювалася одночасно для всіх ознак розпізнавання за структурованим ітераційним алгоритмом (2.10.3) . Як КФЕ навчання системи використовувався ентропійний критерій (2.7.4).
а)
б)
Рисунок 2.16 – Зображення об’єкта "Ґратка": а) початкове розфокусоване зображення (клас ) ; б) зображення, одержане на наступному кроці настроювання
мікроскопа (клас )
У табл. 2.3 наведено одержані при оптимізації контейнера класу значення нормованого ентропійного критерію , першої достовірності , помилки другого роду b, параметрів навчання r1, і міжцентрової кодової відстані . Аналіз табл. 2.3 показує, що оптимальний рівень селекції координат еталонного вектора класу дорівнює при максимальному значенні нормованого ентропійного критерію . Зрозуміло, що для класу цей рівень селекції так само є оптимальним.
Таблиця 2.3–Результати оптимізації контейнера класу
E1
D1
?
d1
d
dc
0,40
0,67
0,80
0,00
39
12
55
0,42
0,71
0,84
0,00
33
14
4
0,44
0,71
0,84
0,00
33
14
38
0,46
0,71
0,84
0,00
31
14
38
0,48
0,70
0,83
0,00
30
14
43
0,50
0,75
1,00
0,12
38
12
45
0,52
0,79
1,00
0,09
37
12
48
0,54
0,81
1,00
0,08
35
12
48
0,56
0,81
1,00
0,08
35
12
51
0,58
0,76
0,99
0,08
33
12
53
0,60
0,79
1,00
0,09
33
12
51
Як видно з табл. 2.3, КФЕ має два максимальні значення (при і ). Тому за оптимальний рівень селекції згідно з максимально-дистанційним принципом прийнято , оскільки при цьому рівні міжкласова відсань є більшою, а відповідно відносний коефіцієнт нечіткої компактності (2.10.5) є меншим. Крім того, варто зазначити, що у даному прикладі значення рівня селекції , яке на практиці використовується за замовчуванням в процесі бінеаризації даних, не є оптимальним в інформаційному розумінні.
Таким чином, алгоритм оптимізації рівнів селекції координат двійкових еталонних векторів-реалізацій образу, як і інших параметрів навчання інтелектуальної ІС, у рамках ІЕІ-технології полягає у наближенні глобального максимуму інформаційного критерію оптимізації, обчисленого в робочій області визначення його функції, до найбільшого граничного значення.