Інструментальні засоби архівації і очистки інформаційних сховищ
Архівації двох головних баз даних — інформаційних сховищ і каталогів — приділяється велика увага як основним елементам надійного збереження інформації та забезпечення відмовостійкості системи.
Існують різні типи архівації та відновлення даних з архіву, виконання яких залежить від програмних продуктів, що налагоджені на виконання тих чи інших типів архівації. Наприклад, програма резервного копіювання NT Backup може виконувати архівацію п’яти типів, які ми розглянемо нижче.
1. Звичайна архівація (Normal). У разі вибору цього типу архівуються всі вибрані файли незалежно від стану їхніх архівних бітів. Архівні біти всіх заархівованих файлів скидаються.
2. Копіювальна архівація (Copy). Архівуються всі вибрані файли незалежно від стану архівних бітів. Архівні біти всіх заархівованих файлів залишаються в попередньому стані.
3. Додаткова архівація (Incremental). Архівуються всі файли з встановленим бітом архівації. Як і за звичайної архівації, архівні біти всіх заархівованих файлів скидаються.
4. Диференціальна (Differential). У цьому разі архівуються всі файли з установленим бітом архівації. Архівні біти всіх заархівованих файлів залишаються в попередньому стані.
5. Кожноденна архівація (Daily). Архівуються всі файли, що зазнали зміну в день архівації. Архівні біти всіх заархівованих файлів залишаються в попередньому стані.
Загальна стратегія архівації полягає в тому, що необхідно щодня проводити звичайну архівацію і додаткову або диференціальну. Оскільки в разі диференціальної архівації стан архівного біта не змінюється, у кожну диференціальну архівацію включаються всі нові файли, а також файли, що змінилися з останньої звичайної архівації. Щоб поновити стан сервера в разі диференційованої архівації, необхідно відновити лише останній звичайний і останній диференціальний архіви. Тому більшість адміністраторів БД віддають перевагу диференціальній архівації, а не додатковій.
Якщо замість диференціальної архівації використовується додаткова, то для поновлення сервера необхідно буде відновити останній звичайний архів, а потім послідовно відновити всі додаткові архіви з часу останньої звичайної архівації. Це не лише додає роботи, але й підвищує ймовірність помилок навіть у разі незначного порушення послідовності додаткових архівів.
Незважаючи на те, що диференціальні архіви займають більше місця на магнітному носії (наприклад, магнітній стрічці), оскільки вони щодня зберігають великий обсяг інформації, витрати на носій значно менші порівняно з витратами часу на поновлення сервера в разі додаткової архівації, не кажучи вже про можливі помилки, викликані додатковою архівацією.
Архівні магнітні носії зберігають у вогнестійких сейфах або за межами обчислювального центру. Крім того, необхідно також розробити план архівації компонентів сервера БД.
Сучасні сервери баз даних автоматично підтримують копію свого каталогу на кожному сервері вузла. Відповідний процес називається реплікацією каталогів
(directory replication). Розглянемо цей процес на прикладі Exchange Server.
У процесі копіювання каталогу сервери Exchange вузла звертаються один до одного й переконуються в актуальності їх каталогів. Якщо сервер визначає, що його копія каталогу не синхронізована з іншими, він оновлює її за допомогою одного або кількох серверів вузла. Тому під час відновлення сервера не на стільки важливо, чи містить архів найсвіжішу копію каталогу. Після того, як відновлення буде завершене, інші сервери вузла швидко поновлять відновлений каталог у процесі реплікації.
Практика роботи зі сховищами даних показує, що звичайна архівація каталогів на всіх серверах здійснюється раз на тиждень у вихідні дні, а диференціальна архівація каталогу на всіх серверах здійснюється щодня в робочі дні тижня. У річному архіві зберігають магнітний носій, як правило останнього тижня місяця.
Зауважимо, що в серверах БД для підвищення мовостійкості системи використовуються журнали транзакцій. Усі зміни в каталозі сервера, а також в особистих і загальних інформаційних сховищах попередньо записуються у файли, які називаються журналами транзакцій
(transaction log files). Для каталогу та інформаційного сховища використовуються різні набори журналів транзакцій.