Створення логічної моделі даних

1. Концепт моделювання даних

Моделювання даних — процес, що використовується для визначення й аналізу вимог до даних, необхідних для підтримки бізнес-процесів у межах відповідної інформаційної системи. Таким чином, процес моделювання даних залучає професійних моделістів даних, які тісно працюють із зацікавленими сторонами бізнесу, а також із потенційними користувачами інформаційної системи.

Загальний процес моделювання даних поданий на діаграмі нижче.

datamodel concept flow

Схема ілюструє спосіб, у який моделі даних розробляються та використовуються сьогодні.

2. Аналіз моделі даних "AS IS"

У цьому підрозділі описані принципи та підходи до опису моделі даних у стані AS IS та узгодження останньої між аналітиками та розробниками даних.

Проєктування та побудова моделі даних відбувається у декілька основних ітерацій, описаних нижче, а саме:

  • аналіз вихідних даних;

  • аналіз та побудова логічної моделі;

  • аналіз та побудова фізичної моделі;

  • вивід до промислового середовища.

Описувані ітерації представлені також схематично, на діаграмі.

datamodel flow 2

2.1. Аналіз вихідних даних

Перший крок до побудови моделі даних — це аналіз вихідних даних на предмет виявлення наступних критеріїв:

  • джерела даних (регламентаційні документи, ГОСТи, стандарти, інші реєстри тощо);

  • обмеження, що накладаються на дані (валідація, правила розрахунку і т.п.);

  • невідповідність і пропуски даних (помилки, пов’язані з ручним введенням; неактуальні дані та інше);

    • провести коригування вихідних значень (власниками даних).

В результаті аналізу даних, у аналітика має з’явитися уявлення про предметну область, однотипні об’єкти (далі - сутність) та взаємозв’язок між цими об’єктами.

2.2. Аналіз та побудова логічної моделі

Логічна модель даних описує поняття предметної області, їх взаємозв’язок, а також обмеження по даних, що накладаються предметною областю. Аналітик проєкту створює такі моделі для того, щоб визначити елементи й функціональність системи, які необхідно реалізувати.

Побудова логічної моделі - ітераційний процес, який включає в себе наступні кроки:

  • Ілюстрація сутностей

  • Визначення атрибутів (типів даних, які належать даній сутності)

  • Визначення зв’язків між сутностями.

Правила та обмеження відносин між сутностями описуються за допомогою властивостей (типів) зв’язків. Наприклад, "один-до-одного" (англ. — "one-to-one"), "один-до-багатьох" (англ. — "one-to-many", "багато-до-багатьох" (англ. — "many-to-many") та позначаються відповідним чином у ER-моделі (моделі "сутність-зв’язок").

2.3. Аналіз та побудова фізичної моделі

Фізична модель даних залежить від конкретної системи керування базами даних (СКБД). Фізична модель містить інформацію про всі об’єкти бази даних (далі - БД). Оскільки стандартів для об’єктів бази даних не існує (наприклад, немає стандарту для типів даних), фізична модель залежить від конкретної реалізації СКБД. Отже, тій самій логічній моделі можуть відповідати декілька різних фізичних моделей.

Якщо логічна модель не задає значення, який саме тип даних повинен мати атрибут, то для фізичної моделі важливо описати всю інформацію про конкретні фізичні об’єкти — таблиці, колонки, зв’язки між сутностями, індекси, процедури, функції тощо.

Увага! У випадку, якщо планується завантаження вихідних даних, на стику етапів валідації логічної та побудови фізичної моделі, необхідно опрацювати формати файлів завантаження, а також їх коректне заповнення.

2.4. Вивід до промислового середовища

Вивід до промислового середовища складається із наступних етапів:

  • Розгортання (deployment) - інженерна частина. Виконання усіх Jenkins job з метою розгортання спроєктованої моделі.

  • Фінальна частина усіх робіт.

3. Проєктування нової моделі даних "TO BE"

Дані (data) - представлення інформації у формалізованому вигляді, придатному для передачі, зв’язку, або обробки. Простими словами: інформація, організована за певними правилами.

На цьому етапі необхідно опрацювати якомога краще даталогічну модель "To Be" бази даних реєстру.

Даталогічний рівень (також — просто «логічний») моделювання деталізує інфологічну модель (концептуальну), перетворюючи її в логічну схему, на якій раніше виявлені сутності, атрибути та зв’язки оформлюються згідно з правилами моделювання для обраного виду бази даних (можливо навіть з урахуванням конкретної СУБД).

Загальним критерієм успішності правильного опрацювання даталогічної моделі служитиме адекватність предметної області, яка виражається в тому, що реєстр повинен дозволяти виконувати всі необхідні операції, які об’єктивно потрібні в реальному житті в контексті тієї роботи, для якої призначений реєстр.