Тезаурусы в задачах информационного поиска


Скачать 6.4 Mb.
Название Тезаурусы в задачах информационного поиска
страница 4/45
Тип Задача
rykovodstvo.ru > Руководство эксплуатация > Задача
1   2   3   4   5   6   7   8   9   ...   45

1.1.1. Дескрипторы информационно-поискового тезауруса


Дескрипторы тезауруса должны соответствовать выбранной предметной области тезауруса. Каждый дескриптор, внесенный в тезаурус, должен представлять отдельное понятие данной области. Дескриптор может быть однословным или многословным. Поскольку часто достаточно трудно понять, представляет ли отдельное понятие многословное словосочетание, многие тезаурусы и руководства уделяют особое внимание основным принципам включения в тезаурус в качестве дескрипторов многословных терминов.

Набор дескрипторов тезауруса должен удовлетворять следующим требованиям:

  • посредством выделенных дескрипторов должно быть возможно описать темы абсолютного большинства текстов предметной области;

  • для уменьшения субъективности индексирования множество дескрипторов не должно включать совокупности близких дескрипторов, формируются классы условной эквивалентности, когда совокупности близких, но различных понятий сводятся к одному дескриптору (LIV, 1994);

  • дескриптор должен быть сформулирован однозначно, его подразумеваемое в рамках тезауруса значение должно быть понятно пользователю. Если однозначный и ясный дескриптор подобрать не удается, термин, взятый в качестве дескриптора, снабжается релятором (краткой пометой) или комментарием.

Стандарт z39.19 рекомендует использовать реляторы для имен дескрипторов даже в тех случаях, когда дескриптор звучит однозначно внутри заданной предметной области, но имеет другие значения в общеупотребительном языке или других значимых областях. «Это облегчает поиск по нескольким базам данных и сопоставление дескрипторов различных предметных областей». Например, предлагается вводить дескриптор Shells(structures) для инженерной предметной области, поскольку слово shell имеет много значений в английском языке.

Комментарий к дескриптору может серьезно направлять, ограничивать индексатора по использованию того или иного дескриптора для описания текстов.

Так, в тезаурусе LIV (LIV, 1994), который используется для индексирования документов в Исследовательской Службе Конгресса США, имеется дескриптор BUILDING CONSTRUCTION (СТРОИТЕЛЬСТВО), который снабжен следующим комментарием:

Используется для публикаций о процессе строительства. Для публикаций по строительному бизнесу, описывающих финансы, планирование, управление, используется дескриптор Construction industries. Публикации о типах производимых работ индексируются дескриптором Construction workers.

При наличии нескольких кандидатов на роль дескриптора факторами, влияющими на выбор дескриптора, могут быть (ГОСТ 7.25; Герд, с.159-160, 2005):

  • соответствие стандартам и рекомендациям по научно-технической терминологии, - в стандарте Z39.19 такое соответствие называется “literary warrant” – литературный мандат,

  • краткость и понятность (ГОСТ 7.25),

  • соображения частотности (Герд, 2005; ГОСТ 7.25; Z39.19) – частотность в текстах и запросах позволяет приблизить язык тезауруса к языку пользователей и документов (Z39.19)

  • выбор наиболее стилистически нейтрального термина. Например, стандарт Z39.19 рекомендует в качестве дескриптора предпочесть термин developing nations (развивающиеся страны), а не underdeveloped countries (недоразвитые страны). Следует избегать в качестве дескрипторов неологизмов, жаргонных и сленговых выражений.

  • Герд А.С. (Герд, 2005) указывает, что при выборе дескрипторов важно учитывать лексическую структуру иерархически подчиненных дескрипторов (из двух или большего числа синонимов дескриптором считался тот термин, лексическая структура которого повторяется в подчиненных ему терминах). Например, из двух терминов возникновение дислокации и зарождение дислокации в качестве дескриптора выбирается второй, так как подчиненные термины гетерогенное зарождение дислокации, гомогенное зарождение дислокации, дублируют лексему зарождение.

Задача выделения дескрипторов из набора близких по значению терминов тесно связана с широкой проблемой стандартизации и унификации терминологии. В идеале тезаурусу должны предшествовать целостное лингвистическое описание языка науки, данной отрасли знания, работа по стандартизации соответствующей терминологии. Однако связь должна быть и обратной: слова и словосочетания, выделенные в качестве дескрипторов в лучших тезаурусах, следует рекомендовать и в качестве стандартных терминов для тех или иных понятий (Герд, 2005).
1   2   3   4   5   6   7   8   9   ...   45

Похожие:

Тезаурусы в задачах информационного поиска icon Тезаурусы в задачах информационного поиска
Правила индексирования документов дескрипторами информационно-поискового тезауруса 39
Тезаурусы в задачах информационного поиска icon Тезисы представленные на
Внимание! Для поиска своей фамилии или ключевого слова в тексте нажмите Ctrl+F и введите искомое слово в окно поиска!!
Тезаурусы в задачах информационного поиска icon Инструкция по заполнению документов на регистрацию информационного ресурса
Настоящая инструкция определяет порядок заполнения и представления документов для регистрации информационного ресурса в Реестре государственных...
Тезаурусы в задачах информационного поиска icon Лекция №11
В этом разделе будет приведен обзор одних из первых систем поиска информации, насчитывающих к настоящему моменту времени многолетнюю...
Тезаурусы в задачах информационного поиска icon Конспект лекций по дисциплине «Информационные системы и технологии в науке и образовании»
Введение. Содержание дисциплины и порядок ее изучения. Фактографический поиск. Математические модели фактографического поиска. Информационная...
Тезаурусы в задачах информационного поиска icon Инструкция по сверке Планов финансово-хозяйственной деятельности
В параметрах поиска в строке Наименование учреждения вводим инн, либо название учреждения. Нажать кнопку Найти. Внизу экрана загрузится...
Тезаурусы в задачах информационного поиска icon Алгоритмы поиска. Линейный поиск. Двоичный поиск
Также, линейный поиск часто используется в виде линейных алгоритмов поиска максимума/минимума
Тезаурусы в задачах информационного поиска icon Рабочая инструкция по настройке представлений в hp sm
Удалены не используемые номера рисунков. Добавлено описание создания представления из Поиска и описание требований для удаления Представления....
Тезаурусы в задачах информационного поиска icon Задачах на 2014 год Итоги работы Отдела социальной защиты населения г. Рошаль
Отдела социальной защиты населения г. Рошаль Министерства социальной защиты населения Московской области и подведомственных учреждений...
Тезаурусы в задачах информационного поиска icon Общая характеристика информационного ресурса
Целью оказания услуг является формирование и сопровождение картографического информационного ресурса «Шельфовые проекты» (далее ир...
Тезаурусы в задачах информационного поиска icon Отчёт о результатах деятельности отдела загс администрации Лужского...
Во исполнение поручения главы администрации Лужского муниципального района Малащенко Олега Михайловича предоставляем отчет о результатах...
Тезаурусы в задачах информационного поиска icon Инструкция по поиску и спасанию в зоне авиационно-космического поиска...
Организация поисково-спасательного обеспечения полетов в Южной зоне авиационно-космического поиска и спасания (акпс)
Тезаурусы в задачах информационного поиска icon Универсальный телевизионный пульт дистанционного управления
«умного» поиска и сохранения канала, что избавляет вас от необходимости поиска и сохранения каналов вручную. Своевременная замена...
Тезаурусы в задачах информационного поиска icon Инструкция по работе с программным комплексом единого информационного ресурса
При входе в программный комплекс единого информационного ресурса (далее – пк еир) пользователю необходимо пройти авторизацию в меню,...
Тезаурусы в задачах информационного поиска icon Регламент информационного взаимодействия
Настоящий Регламент информационного взаимодействия (далее Регламент) разработан в целях реализации требований следующих документов:...
Тезаурусы в задачах информационного поиска icon Приказ от 3 июня 2014 г. N 148 об утверждении требований к подготовке...
Федеральных авиационных правил поиска и спасания в Российской Федерации, утвержденных постановлением Правительства Российской Федерации...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск