Інформаційні технології як глобальний засіб побудови інформаційної економіки
Інформаційне сховище - це база даних, яка спеціальним образом адмініструється, уміст якої має наступні властивості:
предметна орієнтація,
інтегрованість даних,
інваріантість у часі,
стабільність інформації,
мінімізація надмірності інформації.
. Предметна орієнтація. На відміну від БД у традиційних OLTP-системах, де дані підібрані відповідно до конкретних додатків, інформація в DW орієнтована на задачі підтримки прийняття рішень, для яких вимагаються "історичні" дані.
. Інтегрованість даних. Дані в інформаційне сховище надходять з різних джерел, де вони можуть мати різні імена, атрибути, одиниці виміру та способи кодування. Після завантаження в DW дані очищують від непотрібної інформації та приводять до єдиного формату.
. Інваріантість у часі. Важливою відмінністю DW від OLTP-систем є те, що дані в них зберігають свою істинність у будь-який момент процесу читання.
. Стабільність інформації. У DW-системах, як випливає з вимоги часової інваріантості, один раз завантажені дані теоретично ніколи не змінюються.
. Мінімізація надмірності інформації. Надмірність мінімальна (близько 1%!), що пояснюється кількома причинами, зокрема: 1) у DW зберігається деяка підсумкова інформація, що у БД OLTP-систем взагалі відсутня; 2) під час завантаження в DW записи сортуються, очищаються від непотрібної інформації та приводяться до єдиного формату.
Після такої обробки це вже зовсім інші дані.
Проблеми інтеграції даних
Перелічимо деякі проблеми реалізації сховища даних [Л. 11]:
неоднорідність програмного середовища,
розподілений характер організації,
підвищені вимоги до безпеки даних,
необхідність наявності багаторівневих довідників метаданих,
потреба в ефективному збереженні й обробці дуже великих обсягів інформації.
Інтелектуальні методи витягу інформації
Інтелектуальний інформаційний пошук - технологія роботи з даними, що з’явилася на ідеях сховищ даних, - реалізує новий клас інструментів доступу до даних і їхнього аналізу, можливості яких по витягу важкодоступної інформації, виявленню тенденцій і розпізнаванню закономірностей у корпоративних БД не мають аналогів.
Інтелектуальні методи витягу інформації з масивів даних (data mining) дадуть відповіді на такі питання про ваш бізнес, що раніш не приходили в голову. Віддача від інтелектуального аналізу залежить від правильного вибору інструментальних засобів і ефективного їхнього використання. Ці методи можуть стати надійним фундаментом при виробленні ділової стратегії організації - при аналізі ризику кредитування, виявленні зловживань і шахрайства, плануванні закупівель для підприємств роздрібної торгівлі та впровадженні нових телекомунікаційних продуктів і послуг.
Багатомірний аналіз даних, часто називаний оперативною аналітичною обробкою (OLAP - on-line analytical processing), дозволяє задавати складні питання, наприклад порівняти підсумки продажів із плановими показниками за останні два роки по кварталах і по регіонах. Результати являють собою чи деякі вибірки даних, чи сумарні (агреговані) показники.
До задач аналізу даних відноситься вироблення рекомендацій на майбутнє, прийняття керівництвом рішень і ін. Найчастіше від якості інформації в таких системах залежить фінансове положення підприємства.
Користувачі - аналітики працюють з інформаційним сховищем, використовуючи регламентовані та нерегламентовані запити. Перші реалізовані програмними продуктами OLTP - On-Line Transaction Processing, другі - OLAP - On-Line Analytical Processing.
Видобуток даних - це нова епоха розвитку систем прийняття рішень, що є одним з найважливіших додатків технології клієнт-сервер. Системи типу клієнт-сервер і інформаційні архіви відкрили для користувачів доступ до інформації.
Дослідження даних (data mining): метод пошуку інформації в даних, що припускають використання статистичних, оптимізаційних і інших математичних алгоритмів, що дозволяють знаходити взаємозалежності даних (кореляцію, класифікацію й т.д.) і синтезувати дедуктивну інформацію.
Система підтримки прийняття рішень (СППР, decision support system, DSS): система, що забезпечує на базі наявних даних одержання середнім керуючим ланкою інформації, необхідної для тактичного планування та діяльності. Спирається в значній мірі на аналіз даних у БД (по сучасних представленнях - у складі даних (DWH)) візуальними засобами (графіки) і середньої складності статистичними чи іншими математичними методами. Системи підтримки прийняття рішень з'явилися давно, однак одержали новий імпульс до розвитку з виникненням сховищ даних.