Методи багатовимірного градуювання
Надалі розвиток методів психосемантики йшов по лінії розробки зручних пакетів прикладних програм, заснованих на методах багатовимірного градуювання, аналізу чинника, а також спеціалізованих методів (статистичного) опрацювання репертуарних решіток. Прикладами пакетів такого типу є системи KELLY [11], MADONNA [12], MEDIS [13]. З іншого боку, специфіка ряду конкретних додатків, в першу чергу – в інженерії знань, вимагала також розвитку інших (не чисельних) методів обробки психосемантичних даних, що використовують, в тій або іншій формі, парадигму логічного виводу на знаннях. Яскравим прикладом цього напряму є система AQUINAS [14]. Проте аналіз практичного застосування систем обох типів до завдань інженерії знань приводить до висновку про недосконалість наявних методик і необхідність їх розвитку відповідно до сучасних вимог інженерії знань. Найбільші перспективи в цій області, мабуть, у методів багатовимірного градуювання.
Сьогодні багатовимірне градуювання – це математичний інструментарій, призначений для обробки даних про попарну схожість, зв’язки або відношення між аналізованими об’єктами з метою представлення цих об’єктів у вигляді точок деякого координатного простору. Багатовимірне градуювання є одним з розділів прикладної статистики, наукової дисципліни, що розробляє і систематизує поняття, прийоми, математичні методи і моделі, призначені для збору, стандартного запису, систематизації і обробки статистичних даних з метою їх лаконічного представлення, інтерпретації і отримання наукових і практичних висновків. Традиційно багатовимірне градуювання використовується для вирішення трьох типів завдань:
§ пошук і інтерпретація латентних (тобто прихованих, безпосередньо не спостережуваних) змінних, що пояснюють задану структуру попарних відстаней (зв’язків, близькостей);
§ верифікація геометричної конфігурації системи аналізованих об’єктів в координатному просторі латентних змінних;
§ стиснення початкового масиву даних з мінімальними втратами в їх інформативності.
Незалежно від завдання багатовимірне градуювання завжди використовується як інструмент наочного представлення (візуалізації) початкових даних. Багатовимірне градуювання широко застосовується в дослідженнях щодо антропології, педагогіки, психології, економіки, соціології [15].
В основі даного підходу лежить інтерактивна процедура суб’єктивного градуювання, коли випробовуваному (тобто експертові) пропонується оцінити схожість між різними елементами за допомогою деякої градуйованої шкали (наприклад, від 0 до 9, або від -2 до +2). Після такої процедури аналітик розташовує чисельно представленими стандартизованими даними, що піддаються обробці існуючими пакетами прикладних програм, що реалізовують різні алгоритми формування концептів вищого рівня абстракції і що будують геометричну інтерпретацію семантичного простору в евклідової системі координат.
Основний тип даних в багатовимірному градуюванні – заходи близькості між двома об’єктами (i, j) – dij. Якщо міра близькості така, що найбільші значення dij відповідають парам найбільш схожих об’єктів, то dij – міра подібності, якщо, навпаки, найменше схожим, то dij – міра відмінності.
Багатовимірне градуювання використовує дистанційну модель відмінності, використовуючи поняття відстані в геометрії як аналогію схожості і відмінності понять. Для того, щоб функція d, визначена на парах об’єктів (а, b), була евклідовою відстанню, вона повинна задовольняти наступні чотири аксіоми:
Тоді, згідно звичайній формулі евклідова відстань, міра відмінності двох об’єктів i та j із значеннями ознаки k у об’єктів i та j відповідно xik та xjk:
Дистанційна модель була багато разів перевірена в соціології і психології [16], що дає можливість оцінити її придатність для використання.
У більшості робіт по багатовимірному градуюванню використовується матрична алгебра. Геометрична інтерпретація дозволяє представити абстрактні поняття матричної алгебри в конкретній графічній формі. Для полегшення інтерпретації рішення задачі багатовимірного градуювання до попередньо оціненої матриці координат стимулів X застосовується обертання.
Серед безлічі алгоритмів багатовимірного градуювання широко використовуються різні модифікації метричних методів Торгерсона [17], а також неметричні моделі, наприклад Крускала [18].