Управление на данни

©Христо Тужаров, Стефан Калчев, 2013    

Методики за моделиране на данни

 

[Home] [Съдържание]

Моделиране на данни

Подходи в основата на моделиране на данни

Място и роля на моделирането на данни

Модел на данни

Видове модели на данни

Концепции в моделирането на данни

Методики за моделиране на данни

Примери на конвенции за синтаксис   

 

Независимо от използваните методики, моделирането на данни има една цел и тя е да опише структурата на данните, по начин, който е подходящ за съхранението им в бази данни.

 

По тази причина, всички използвани системи за нотация, фундаментално са взаимно заменяеми. Основните различия между тях са естетически, въпреки, че някои от тях показват повече възможности, а други нямат символи за представяне на всички ситуации.

 

Тези твърдения са валидни, както за нотациите за обектно моделиране, така и за E/R нотациите.

 

В действителност има три нива на конвенция които трябва да бъдат дефинирани в областта на моделирането на данни.

  • Синтактични - касаят използваните символи. Тези съглашения са описани в примерите на конвенции за синтаксис.

  • Позиционни - определят организацията на диаграмите на модела. Те диктуват как да са разположени същностите.

  • Семантични - определят как да бъде предаден смисъла на модела.  Те описват стандартните начини за представяне на обичайните бизнес ситуации.

Конвенции в моделирането на данни

 

Синтактични конвенции

При оценяването на синтактични конвенции, е важно да се изхожда от факта , че моделите на данни имат две аудитории:

  • Потребители – използват моделите за да проверят доколко анализаторите разбират тяхната среда и изисквания. За тях моделът трябва да  е ясен и лесен за четене.

  • Дизайнери – използват бизнес правилата , произхождащи от моделите на данни, като основа за проектиране на информационни системи. За тях моделът трябва да е пълен и строг.

Най-общо оценката за една синтактична конвенция се основава на пълнотата и четливостта и. Четливостта е свързана с използване на добър графичен дизайн..

 

      Техническата пълнота се характеризира с :

  • Субекти и атрибути;

  • Взаимоотношения;

  • Уникални идентификатори;

  • Подтипове и супер-типове;

  • Ограничения между взаимоотношения.

      Общите принципи на добър графичен дизайн са:

  • Всеки символ трябва да има само едно значение, което се прилага при използването му;

  • Всяко понятие трябва да бъде представено само от един символ;

  • Схемата не трябва да е затрупана с повече символи, отколкото са абсолютно необходими;

  • Графиката в схемата трябва да бъде интуитивно изразителна за включените в нея понятия . 

Позиционни конвенции

Типизирането на същностите и подходящото им  разполагането в графичната схема е от  съществено значение за използваемостта и ефективността на даден модел на данни.

 

Днес съществуват голямо количество модели на данните, които по различен начин представят обектите от реалния свят:

  • Модел "същност - връзка" в различни нотации (нотация на Чен, нотация на Мартин, нотация IDEF1X, нотация на Баркер, нотация на езика за моделиране UML)

  • Расширен модел "същност-връзка" (Enhanced Entity-Relationship — EER),

  • Модел "обект-роля", 

  • Обектно- ориентиран модел на данни,

  • Модел "обект-качество",

  • Модел „обект – събитие” и т.н.

Теоретически упоменатите и неупоменати по-горе модели са  равнопоставени, в смисъл, че всеки от тях представя данните от една предметна област. Отличията са в това доколко удобно един или друг модел се използва от разработчиците при работа с реални задачи.

 

Най–общо различните модели използват следния набор от същности, които обозначават и разполагат в диаграмата по различен начин: 

  • Реален обект –  абстракция на физически съществуващи предмети (клиент, доставчик, услуга).

  •  Роля – абстракция на предназначение на човек, част от оборудване или организация (студент, касиер, управител) .

  •  Събитие (процес) – абстракция на някакво действие (продажба, изпит, доставка).

  •  Взаимодействие – обекти, създавани от отношения между други обекти (продадена стока, комуникация с клиента).

  •  Спецификация – използват се за представяне на списъци от характеристики (цвят на кола, оценки от изпит).

Семантични конвенции

Днес почти всички използвани на практика модели за данни са семантични. Началото им бележи д-р Чен с неговия модел „същност – връзка”

 

Главно предимство на семантичните модели се явява обезпечаване на възможността за изобразяване семантиката на данните. С тяхна помощ се определят важни за предметната област типови обекти (същности), техните свойства (атрибути) и отношения един с друг (връзки).

 

Код определя целта на семантичното моделиране на данните така: "В действителност, задачата за поддържане смисъла на данните е безкрайна. ..... Целта на семантичното моделиране е изключително важна, тъй като даже незначителен успех може да допринесе за разбиране и порядък в областта на проектирането на бази данни”.

 

През годините (виж таблицата по-долу) семантични модели се развиват в двете направления, оформени през 70-те години от Код и Чен. Всеки нов модел води до:

  • По добро отразяване смисъла на данните в модела;

  • По-голяма простота за изучаване и пригодност на модела за използване в Case средствата;

  • По-голям реализъм и детайлност при прехвърляне нещата от реалният в компютърния свят.

              Модели на данни
 

Диаграми "същност-връзка" (ERD)

CHEF, Martin, Bachman, IDEFXIX, Shlaer & Mellor,

Merise, IEM

Диаграми модели на данни (DMD)

Martin, Bachman

Диаграми структури данни (DSD)

Jackson

Диаграми логически структури данни (LDS)

SSADM

Диаграми UML

OOA&D

 

Източник: http://www.intuit.ru/department/database/rdbdev/2/6.html

 

Задача на съвременните модели на данни е да отразят в пълнота данните от съответна предметна област. При реализация на концепцията за архитектурен подход се създават няколко модела, които отразяват една предметна област. Възникват значително количество артефакти, свързани с отразяване на едни и същи действия, но на различни нива на архитектурата или на различни нива на декомпозиция на модела. За постигане на семантична еднозначност се налага използване на техники от рода на  терминологичен речник на данните, градивни блокчета от данни и т.н.