2.8 Базовий інформаційно-екстремальний алгоритм навчання ІС
У багатоциклічній структурованій ітераційній процедурі оптимізації просторово-часових параметрів функціонування ІС базовий інформаційно-екстремальний алгоритм реалізується у внутрішньому циклі алгоритму навчання, що й обумовило його назву.Призначенням базового алгоритму навчання є:
оптимізація геометричних параметрів контейнерів класів розпізнавання;
обчислення інформаційного КФЕ навчання системи;
пошук глобального максимуму КФЕ у робочій (допустимій) області визначення його функції.
Розглянемо категорійну модель навчання ІС за базовим алгоритмом у вигляді діаграми відображення множин. При обґрунтуванні гіпотези нечіткої компактності має місце нечітке розбиття ?, яке в рамках ІЕІ-технології відповідає умовам (2.2.1) і (2.2.3). Введемо оператор нечіткої факторизації простору ознак: : Y® і оператор класифікації y: ®I|l|, який перевіряє основну статистичну гіпотезу про належність реалізацій {|j=} нечіткому класу . Тут l-кількість статистичних гіпотез. Оператор g: I| l |®?| q | шляхом оцінки статистичних гіпотез формує множину точнісних характеристик ?| q |, де q=l2 – кількість точнісних характеристик. Оператор ?|q|®E обчислює множину значень інформаційного КФЕ, який є функціоналом точнісних характеристик. Контур оптимізації геометричних параметрів нечіткого розбиття шляхом пошуку максимуму КФЕ навчання розпізнаванню реалізацій класу замикається оператором r: E®.
Структурна діаграма відображень множин у процесі навчання за базовим інформаційно-екстремальним алгоритмом має вигляд
(2.8.1)
У діаграмі (2.8.1) контур операторів
(2.8.2)
оптимізує геометричні параметри розбиття .
Оператор U: E®GTZ регламентує процес навчання і дозволяє оптимізувати параметри його плану, які визначають, наприклад, обсяг і структуру випробувань, черговість розгляду класів розпізнавання та інше.
Вхідною інформацією для навчання за базовим алгоритмом є дійсний в загальному випадку масив реалізацій образу ; система полів контрольних допусків на ознаки розпізнавання і рівні селекції координат еталонних векторів-реалізацій, які за замовчуванням дорівнюють 0,5 для всіх класів розпізнавання.
Розглянемо етапи реалізації алгоритму:
1. Формування бінарної навчальної матриці , яке здійснюється за правилом (2.5.3).
2. Формування масиву еталонних двійкових векторів-реалізацій , елементи яких визначаються за правилом
(2.8.3)
де rm-рівень селекції координат вектора .
3. Розбиття множини еталонних векторів на пари найближчих?сусідів?: =, де xl-еталонний вектор сусіднього класу , за такою схемою алгоритму:
а) структурується множина еталонних векторів, починаючи з вектора x1 базового класу , який характеризує найбільшу функціональну ефективність ІС;
б) будується матриця кодових відстаней між еталонними векторами розмірності M?M;
в) для кожного рядка матриці кодових відстаней знаходиться мінімальний елемент, який належить стовпчику вектора, найближчого до вектора, що визначає рядок. За наявності декількох однакових мінімальних елементів вибирається з них будь-який, оскільки вони є рівноправними;
г) формується структурована множина елементів попарного розбиття , яка задає план навчання.
4. Оптимізація кодової відстані dm відбувається за рекурентною процедурою (2.2.3). При цьому береться .
5. Процедура закінчується при знаходженні максимуму КФЕ в робочій області його визначення: де -множина радіусів концентрованих гіперсфер, центр яких визначається вершиною еталонного вектора . При цьому множина є так само множиною кроків навчання ІС.
Таким чином, базовий алгоритм навчання є ітераційною процедурою пошуку глобального максимуму інформаційного КФЕ в робочій області визначення його функції:
. (2.8.4)
Параметри навчання ІС за базовим алгоритмом – оптимальні кодові відстані і оптимальні еталонні вектори-реалізації для заданого алфавіту є обов’язковими вхідними даними для функціонування ІС в режимі екзамену, тобто безпосереднього прийняття рішень.
Таким чином, основною функцією базового алгоритму навчання у рамках ІЕІ-технології є обчислення на кожному кроці навчання інформаційного КФЕ і організація пошуку його глобального максимуму в робочій області визначення функції критерію з метою визначення оптимальних геометричних параметрів розбиття простору ознак на класи розпізнавання.