2.2. Системный анализ предметной области и связей между описываемыми объектами
Информационная система по археологическим памятникам предназначена для оптимизации управленческих и научных решений, касающихся этих памятников, и даже автоматизации выработки таких решений при определенном ее развитии, следовательно, она должна оперировать информацией о собственно памятниках и о процессах, происходящих с ними либо могущих влиять на них. Для этого информационная система должна моделировать реальную (назовем ее, например "Памятник+"), образованную, по крайней мере, шестью подсистемами:
1) "памятник как физический объект" материального мира;
2) "находки" – набор физических тел, первоначально находившихся на территории памятника, а далее перемещенных в частные коллекции, музеи и другие организации;
3) "физические лица" – люди, чья деятельность в той или иной степени касается памятника;
4) "организации" – организации, имеющие и не имеющие юридический статус, выполняющие работы на территории памятника либо принимающие решения относительно памятника;
5) "литература" – печатные и рукописные материалы, описывающие памятник;
6) "документы" – группа материалов, представляющая решения различных организаций по памятнику.
Если охарактеризовать каждую из указанных подсистем множеством атрибутов, то в терминах общей теории систем [Месарович М., Такахара Я., 1978] система "Памятник+" будет включать все компоненты декартового произведения множеств атрибутов указанных подсистем и для описания системы необходимо описать свойства этих компонентов и связи между ними. Не останавливаясь подробно на словесном описании объектов предметной области (этому посвящено, как отмечалось в главе 1, достаточно много работ), перейдем к построению инфологической модели.
2.3. Построение информационно-логической модели
базы данных
Уровень развития структуры каждой из названных выше подсистем может углубляться практически неограниченно. Если ограничиться статической моделью данных, то при формировании инфологической модели каждой из этих подсистем может быть поставлена в соответствие сущность обычного типа либо супертипа и данная система будет представлять систему информационного плана. Если принять для руководства объектно-ориентированный подход, то с каждой из подсистем может быть сопоставлен класс либо суперкласс объектов. Добавление к набору атрибутов, описывающих состояние подсистемы, набора методов, описывающих ее поведение (что, по-видимому, является наиболее важным качеством объектно-ориентированного подхода) [Кузнецов C., 2002], превращает информационную систему в управляюще-информа-ционную. Естественно, в разбиении системы "Памятник+", как и в любой классификации, есть элементы произвола, но, в конечном счете, любое разбиение будет включать примерно те же классы объектов. Относительно же числа подсистем, как мы считаем, в данном случае имеет место, с одной стороны, сочетание полноты логического охвата предметной области, с другой стороны, разумное ограничение числа основных классов объектов, согласующееся с рациональными нормами численности, для иерархии "человеческих" систем управления (руководитель на каждом уровне служебной иерархии находится в постоянном повседневном контакте не более чем с семью подчиненными). База данных должна быть разумно ограничена по структуре и не претендовать на универсальность. Конечность структуры и степени детализации определяется, наряду с требованиями потенциальных потребителей, тем объемом информации, в пределах которого коллектив разработчиков сможет придерживаться единой понятийной базы и достичь договоренности о разделении труда, а также возможностью поддержания и обновления базы в течение длительного периода времени. Если создатели БД считают, что результаты их труда должны быть полезны и для других, то от обычного в начале любой работы убеждения, что «это всем необходимо», надо отойти, определить, кто же эти «все», и строить базу данных в соответствии с потенциальными возможностями и интересами потребителей, иначе «детища впоследствии оказываются никем не востребованными, кроме как их создателями» [Дмитриева В.А.,. Святец Ю.А., 1997].
Изложенная выше схема системы "Памятник+" – основа для инфологической модели, которая, по сути, является звеном, соединяющим заказчика-пользователя системы управления и программиста-разработчика. Ограничение сложности на данном этапе обеспечивает прозрачность структуры базы данных для восприятия непрограммистом. Кроме того, как будет показано далее, с предложенной схемой хорошо согласуются европейский стандарт CIDOC, стандарты описания, предлагаемые ассоциацией АДИТ, а также структура системы BASE-INFO, разрабатываемой в ИА РАН, и существующий ныне паспорт памятника.
В рамках настоящей работы мы ограничимся трансформацией предложенной схемы в инфологическую модель для стационарного состояния системы (информационная система), пользуясь семантической моделью данных "сущность-связь". Относя указанные выше шесть подсистем к сущностям обычного типа и супертипа, рассмотрим их атрибуты.
"Памятник" – сущность супертипа. Для описания используем часть атрибутов, предлагаемых стандартом CIDOC для ядра стандарта описания памятника археологии. Отметим попутно, что предлагаемая в CIDOC организация ссылок на принадлежность объекта к более широкому комплексу (родительскому) позволяет использовать одно и то же отношение для родительского класса и для потомков (подтипов), возможно, с неопределенным значением ряда атрибутов. Такой подход представляется нам более удобным, чем использование собственных отношений и дополнительных связей для каждого подтипа. Любой кортеж, вне зависимости от того, описывает он основной памятник или подтип, имеет уникальный номер, что позволяет описать любой уровень иерархии структуры памятника системой из двух атрибутов: уникального ключа и ссылочного номера, в качестве которого выступает значение уникального номера родительского комплекса.
Мы не используем предлагаемые в CIDOC перекрестные ссылки на коллекции, археологические события, документацию и исследователей, поскольку такие ссылки предназначены для разрешения отношений “многие ко многим” и их необходимое количество не может быть заранее известно, в силу природы описываемых связей. Принудительное же ограничение числа атрибутов приведет к потере информации либо значения будут носить не атомарный характер. Разрешение отношения “многие ко многим” будет проводиться позднее. Мы также считаем, что для пространственной привязки объекта достаточно указать административный район (для общей локализации) и точные координаты (для конкретного местоопределения). Связь же положения объекта с теми или иными именованными территориальными единицами или отнесение к тому или иному природному бассейну должны происходить при стыковке с информационной системой по административно-территориальному устройству (либо готовый блок, взятый из внешних источников, должен добавляться в базу данных). Из CIDOC также заимствованы атрибуты, определяющие статус охраны памятника.
Сущность "физические лица" содержит данные об исследователях, административном и научном руководстве, лицах, охраняющих и эксплуатирующих памятник. В полях, используемых для формализованных запросов, содержится лишь информация о состоянии на дату последнего изменения. Неформализованное резюме хранится в поле свободного текста. Разрешение связей типа “многие ко многим”, как и для памятника, производится на этапе построения даталогической модели.
Для описания сущности "находка", которая является супертипом и может состоять как из отдельного физического объекта, так и из набора объектов (клад, комплекс предметов), мы предлагаем, как и для "памятника", использовать единственное отношение с определением ссылок на родительский класс внутри отношения.
Сущность "организация" тоже относится к супертипу и определяет основные учреждения, имеющие отношение к охране, изучению и эксплуатации памятника либо каким-либо образом его использующие. Учет организаций, обладающих номинальными правами собственности на памятник либо на землю, но непосредственно не совершающих каких-либо действий, является вопросом земельного кадастра, и соответствующая информация при необходимости должна заимствоваться оттуда, а не включаться в базу данных по памятникам непосредственно, во избежание ненужного дублирования кадастра. Скорее наоборот, информация из БД по памятникам должна дополнять кадастр. Для описания структуры организации также предлагается одно отношение с возможностью внутреннего описания иерархии в пределах одной организации или межведомственных связей ведомственной структуры.
Подсистема "литература" носит вспомогательный характер. Очевидно, что для детального описания сущности этого типа нужна специализированная библиографическая база данных. В рамках же информационной системы по археологическим памятникам здесь могут быть собраны лишь основные труды, отчеты и какая-то фрагментарная информация, попавшая в поле зрения наполнителей базы. Можно отметить несколько видов материалов, относящихся к типу "литература". Это печатные издания, рукописные отчеты, архивные документы, картографические материалы. Каждый из этих видов имеет свои особенности при подготовке ссылок. В связи с этим, а также с предполагаемой ограниченностью документации, в подсистеме "литература" для описания источников мы используем ограниченное число полей и основную информацию сводим в свободном текстовом поле. Это, конечно, затрудняет поиск по формальным признакам, но делает более доступным смысловое содержание полей.
Подсистема "документы" имеет целью отслеживание событий, происходящих на памятнике, с памятником и вокруг него. Поскольку каждый этап исследований и другой деятельности должен, по крайней мере теоретически, находить свое документальное обоснование, то прослеживание цепи документов по памятнику должно давать картину его современной истории.
Большинство отношений между сущностями носит характер "многие ко многим". Механизм преобразования в реляционную модель данных хорошо разработан и может быть автоматизирован с использованием программных CASE (Computed Aided Software Engineering)-инструментов. Схема описанной инфологи-ческой модели представлена на рис. 2.1.
Рис. 2.1. Схема инфологической модели базы данных
|