Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки)


Скачать 282.38 Kb.
Название Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки)
страница 1/3
Тип Реферат
rykovodstvo.ru > Руководство эксплуатация > Реферат
  1   2   3


СТАНДАРТ СТ.36
Версия 1.2
РЕКОМЕНДАЦИИ ПО ОБРАБОТКЕ ПАТЕНТНОЙ ИНФОРМАЦИИ С ИСПОЛЬЗОВАНИЕМ XML

(РАСШИРЯЕМОГО ЯЗЫКА РАЗМЕТКИ)
Изменения одобрены рабочей группой SDWG ST.36 23 ноября 2007 г.


СОДЕРЖАНИЕ

ВВЕДЕНИЕ……………………………………………………………………………………………..2

ОПРЕДЕЛЕНИЯ………………………………………………………………………………………..3

ОБЛАСТЬ ДЕЙСТВИЯ СТАНДАРТА………………………………………………………………..3

ТРЕБОВАНИЯ СТАНДАРТА………………………………………………………………………….4

Основные………………………………………………………………………………………..4

Символы………………………………………………………………………………………….6

Присвоение имен международным общим элементам………………………………….6

Присвоение имен ведомственным элементам…………………………………………….7

Атрибуты………………………………………………………………………………………….7

Добавление, отмена или изменение элементов…………………………………………..8

Правила для элементов и атрибутов………………………………………………………..8

Правила для DTD……………………………………………………………………………….9

Правила для записи документа…………………………………………………………….12

Внешние объекты……………………………………………………………………………..14

TIFF………………………………………………………………………………………14

JPEG…………………………………………………………………………………….14

Стандарт ВОИС CT.33………………………………………………………………..15

Стандарт ВОИС CT.35………………………………………………………………..15

PDF………………………………………………………………………………………15

МЕГА СОДЕРЖАНИЕ………………………………………………………………...15

Стандартные DTD……………………………………………………………………………..16

Модельные DTD для патентных публикаций……………………………………………..16

ССЫЛКИ………………………………………………………………………………………………..16

ПРИЛОЖЕНИЕ A: Модельные DTD (xx-patent-document.dtd)

ПРИЛОЖЕНИЕ B: Пример записи документа XML

ПРИЛОЖЕНИЕ С: Международные общие элементы (ICEs) Руководство по информации и документации в области промышленной собственности

СТАНДАРТ CT.36

Версия 1.2

РЕКОМЕНДАЦИИ ПО ОБРАБОТКЕ ПАТЕНТНОЙ ИНФОРМАЦИИ С ИСПОЛЬЗОВАНИЕМ XML

(РАСШИРЯЕМОГО ЯЗЫКА РАЗМЕТКИ)

Изменения одобрены рабочей группой SDWG ST.36 23 ноября 2007 г.
ВВЕДЕНИЕ
1. Данный Стандарт рекомендует средства XML (eXtensible Markup Language, расширяемого языка разметки), используемые для подачи, обработки, публикации и обмена всеми видами патентной информации. Он основан в большей части на Административных инструкциях к Договору о патентной кооперации (PCT), части 7, Приложении F, Приложении I (Patent Cooperation Treaty, Administrative Instructions, Part 7, Annex F, Appendix I) (далее – Приложение F). Термин «ресурсы XML» относится к любым компонентам, используемым для создания и реализации XML. Хотя ресурсы XML обычно включают таблицы стилей, схемы W3C и другие объекты, данный Стандарт в настоящее время включает только определения типа документа (DTD), модели содержания, элементы и небольшое число символов. Более подробно информацию о W3C (World Wide Web Consortium, Консорциум всемирной компьютерной сети) см. на http://www.w3c.org/.
2. Данный Стандарт относится к применению расширяемого языка разметки (XML) 1.1.
См. http://www.w3.org/TR/2004/REC-xml11-20040204/:
Расширяемый язык разметки (XML) является сокращенным вариантом SGML (т.е., стандартного обобщенного языка разметки) и полностью описан в данном документе. Его задача - возможность использования, получения и обработки общего SGML в Интернете тем же способом, каким в настоящее время это происходит с HTML. XML был разработан для облегчения реализации и для взаимодействия сетей как с SGML, так и с HTML.”
3. В соответствии с данным Стандартом, включенная в запись документа XML разметка является примером представления содержания документа с использованием XML, при помощи которого “документы составляются из единиц памяти, называемых объектами, содержащих как проанализированные, так и не проанализированные данные. Проанализированные данные состоят из знаков, некоторые из которых образуют данные, а некоторые - разметку. Разметка кодирует описание формата хранения документа и логическую структуру. XML предоставляет механизм наложения ограничений на формат хранения и логическую структуру” (W3C).
4. XML не может быть использован сам по себе в качестве основы для обработки патентных документов – “Данные технические условия не накладывают ограничения на семантику, использование, или (не считая синтаксиса) названия типов элементов и атрибутов…” (W3C).
5. Таким образом, данный Стандарт определяет элементы и их родовые идентификаторы, или «тэги», и атрибуты для разметки патентных документов. То есть, данный Стандарт описывает в некоторой степени семантику (значения), использование и наименования элементов и атрибутов, входящих в состав различных типов рассматриваемых документов.
«[Определение: Каждый документ XML включает один или более элементов, границы которых определены либо начинающими и заканчивающими тэгами, либо для незанятых элементов - тэгами незанятых элементов. Каждый элемент относится к типу, определяемому его именем, иногда называемым «родовым идентификатором» (GI), и может иметь набор описаний атрибутов.] Каждое описание атрибута имеет имя и значение” (W3C)
Примечание: Подробное описание и определения см. спецификацию XML на http://www.w3.org/TR/2004/REC-xml11-20040204/.

6. Целью введения данного Стандарта является описание логических, независимых от системы структур для обработки патентных документов, как для текста, так и для изображений. Это значит, что данный Стандарт может быть использован вместо Стандартов ВОИС CT.30, CT.32, CT.33 и CT.35, касающихся подачи, обработки, публикации и обмена библиографическими данными, рефератами или полными текстами любых типов патентных документов. Стандарт описывает ресурсы XML для следующих данных:

(a)

Полный или частичный текст патентных документов, включая библиографические данные, записанные как закодированные символами данные.
(b)

Страницы документов целиком, представленные как одно изображение (изображение страницы), вне зависимости от их содержания (библиографические данные, текст или изображения).
(c)

Данные в рамках полнотекстовых документов, которые не могут быть записаны как закодированные символами данные, такие как рисунки, химические формулы и особенно сложные таблицы (так называемые встроенные изображения).
7. Согласно данному Стандарту записи XML должны быть правильно построенными XML-документами и должны соответствовать одному из Описаний Типа Документа (DTD), содержащемуся в приложении F, или ведомственному DTD, которое, в свою очередь, соответствует данному Стандарту. DTD, соответствующее данному Стандарту, должно быть построено из элементов в соответствии с рекомендациями данного Стандарта. DTD, содержащиеся в Приложении F, опубликованы на http://www.wipo.int/pct-safe/epct/xml_canon.htm, где DTD будут обновляться по мере принятия нового варианта. Как только обновленное DTD публикуется на веб-сайте, оно становится доступно для официального использования.

ОПРЕДЕЛЕНИЯ
8. Для целей данного Стандарта даются следующие определения:
А) Выражение «патентный документ» включает патенты на изобретения, патенты на растения, патенты на промышленные образцы, свидетельства о полезности, полезные модели, дополнительные документы к ним, опубликованные заявки и описания, а также документы, относящиеся к ведению дел по заявкам и выданным охранным документам, включая действия после выдачи патента, по поддержанию прав собственности и всю переписку между ведомством и заявителем, а также ведомств между собой.
Б) Разметка определяется как текст, добавляемый к содержанию документа и описывающий структуру и другие атрибуты документа способом, не являющимся способом системной спецификации, независимо от какой-либо обработки, которой он может быть подвергнут.
В) Остальные определения см. описание XML: http://www.w3c.org/TR/2004/REC-xml11-20040204/

ОБЛАСТЬ ДЕЙСТВИЯ СТАНДАРТА
9. Несмотря на то, что DTD, описанные в Приложении F, были разработаны для использования в соответствии с Договором о Патентной Кооперации, данный Стандарт рекомендует использовать их всеми патентными ведомствами для электронной подачи заявок. Образец DTD, отраженный в Приложении А к данному Стандарту, предназначен служить руководством по использованию международных общих элементов (ICE) для публикации патентных документов. По мере развития Стандарта в список, приведенный ниже, могут быть добавлены другие DTD.


10. Некоторые DTD, включенные в Приложение F, перечислены ниже вместе с соответствующей стадией делопроизводства по заявке в качестве иллюстрации их предполагаемого использования. Таблица является только руководством к возможному использованию этих DTD в процессе патентного делопроизводства; разные ведомства могут иметь разные нужды.
ТРЕБОВАНИЯ СТАНДАРТА
Основные
11. Международные Общие Элементы (ICE) являются основой данного Стандарта. ICE строятся на базе Приложения F, Стандарта ВОИС CT.32 и других источников. См.: http://www.wipo.int/standards/en/xml_material/st36/index.html.
12. ICE должны использоваться так, как определено в данном Стандарте, то есть они должны иметь такие название, содержание, атрибуты и значение, которые указаны в списке ICE. Поскольку данный Стандарт и Приложение F, возможно, не включают все элементы, необходимые для всех патентных ведомств, в таких случаях разрешается использовать специфические для ведомств DTD, как описано ниже.
13. Специфическая для ведомства информация может быть обработана следующим образом.
А) Выделена ссылкой в отдельное DTD, например, из DTD request элементом office-specific-data (рекомендуется).


Б) Включена напрямую в элемент office-specific-data, в этом случае элемент может быть изменен из незаполненного таким образом, чтобы включать #PCDATA или другие необходимые модели содержания; и добавкой префикса двухбуквенного кода страны в office-specific-data, например: wo-office-specific-data. Модель содержания office-specific-data не должна быть изменена без добавления префикса ведомства.
С) Использованием согласования пространства (присваиваемых) имен. Пространства имен XML предусматривают простой способ уточнения имен элемента и атрибута, используемых в документах XML, путем объединения их с пространством имен, определяемым ссылками URL (унифицированный указатель ресурса) (см.: http://www.w3.org/TR/REC-xml-names/).
Д) Смешиванием специфических для ведомства элементов с международными общими элементами. Например, в фрагменте DTD для публикации, приведенном ниже, специфические для ведомства элементы добавлены в модель содержания элемента related-documents. Подробнее см. Соглашения DTD, приведенные ниже.

14. На более высоком уровне эти данные могут быть включены в отдельные документы, упоминаемые в DTD package-data посредством элемента other-documents. DTD или тэги, упоминаемые в office-specific-data или other-documents, находятся полностью под контролем соответствующего ведомства.
15. Имена ведомственных DTD и/или элементов должны начинаться с двухбуквенного кода страны соответствующего ведомства по CT.3, за которым идет разделитель (дефис или двоеточие) и имя объекта. Любые другие имена будут пониматься как международные (родовые) DTD или элементы. Следовательно, рекомендуется ограничить использование имен, начинающихся с двухбуквенного слова, только теми, которые представляют действующий код страны. Например, request переходит в ep-request для использования в ЕПВ в качестве имени файла DTD или корневого элемента.
16. Для обеспечения взаимодействия между патентными ведомствами в области подачи заявок необходимо использовать следующие DTD, как указано в Приложении F, а не ведомственные альтернативы: application-body, table-external, pdoc-certificate, package-header, package-data и xmit-receipt.
17. При включении ведомственных элементов и/или ссылок на ведомственные DTD выпускающий орган должен предоставить другим ведомствам и пользователям уведомление, содержащее информацию о содержании и значении этих элементов и/или DTD. Такое уведомление должно быть размещено на доступном сайте ведомства или на сайте ВОИС. Уведомление должно включать DTD и полное описание каждого элемента.

Символы
18. Несмотря на то, что XML допускает разные кодировки символов, данный Стандарт рекомендует исключительно Юникод. Может быть полезным добавление объектов символов для символов, не включенных в Юникод, как указано на wipo.ent (расположено на http://www.wipo.int/pct-safe/epct/xml_canon.htm). В этот файле объекта перечислены общие имена объектов, которые могут быть использованы на месте точек кода из кодировок, как указано на wipo.ent. Использование этих объектов требует создания глифов для представления, которые еще не существуют. См. http://www.w3.org/XML/Core/2002/10/charents-20021023 для получения дальнейшей информации об объектах символов.
19. Записи документов должны включать описание XML в качестве первой строки файла.


20. В данном Стандарте рекомендуется только UTF-8. Тем не менее, в случае идеографического шрифта Юникод в UTF-8 может создавать исключительно большие файлы, т.к. это кодирование может использовать до четырех байтов на символ. В таких случаях национальные ведомства могут выбрать кодирование, которое приведет к файлам управляемых размеров. Ведомства, решившие поступить таким образом, должны быть готовы проводить консультации со своими партнерами по обмену и дать соответствующее публичное извещение.
21. Символы, которые разрешено помещать в документ XML, указаны в XML 1.1 W3C Recommendation; они рекомендуются и данным Стандартом за следующим исключением. Символы, использующиеся в именах элемента или атрибута, описанных в данном Стандарте, ограничены следующим набором:
{abcdefghigklmnopqrstuvwxyz1234567890-}.
22. Ведомствам настоятельно рекомендуется создавать записи документов для публикации и обмена, «нормализованные» в соответствии с Моделью Символов для Интернета (Character Model for the World Wide Web) (http://www.w3c.org/TR/2003/WD-charmod-20030822/). Синтаксические анализаторы, поддерживающие XML 1.1, могут быть использованы для тестирования нормализации. При этом значительно улучшается согласованность сортировки и операций построчного сравнения при условии, что опции определенных символов кодирования, доступные в Юникоде, будут использоваться в международном патентном сообществе согласованно.
Присвоение имен Международным Общим Элементам
23. Все имена элементов должны быть словами из английского языка.
24. Когда для имени элемента требуется более одного слова, слова должны разделяться дефисом (-).
25. Для имен элементов в данном Стандарте используется только латинский алфавит, ограниченный следующим набором символов: {abcdefghigklmnopqrstuvwxyz1234567890-}. Подчеркнутые символы и символы верхнего регистра не используются. Исторически сложилось, что имена элементов в элементе SDOBI Стандарта CT.32 сохраняют прописное B и другие прописные имена элементов.
26. Имена должны быть описательными, не мнемоническими или сокращенными, насколько это возможно практически. Значение имени элемента должно быть понятно каждому без обращения к какой-либо другой документации, либо при незначительном обращении. Некоторые заметные исключения включают большинство общих элементов, используемых в патентной заявке, например, «p» для параграфа, и другие, например, полученные из HTML, а также некоторые другие широко используемые элементы форматирования (например, в application-body DTD). Маловероятно, что будут необходимы какие-либо дальнейшие исключения.

27. Должны быть включены одно или два предложения, описывающие значение имени элемента и его предполагаемое содержание. Описание должно упоминать любые применяемые правила или нормы и очень кратко резюмировать их сущность. В DTD описание должно быть включено в примечание, непосредственно предшествующее элементу или атрибуту, к которому оно относится.
28. Исторически сложилось, что некоторые элементы в ICE записаны в Графе имен в CT.32 в формате Bnnn, где n – число. Такие имена элементов являются связанными элементами из
  1   2   3

Похожие:

Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon План. О важности патентных исследований и системы патентной информации...
...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Рекомендации по разметке патентных документов с использованием sgml...
Рекомендации по разметке патентных документов с использованием sgml
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Инструкция по Articulus (для периодических и непериодических изданий) Оглавление
Онлайновая программа разметки Articulus предназначена для подготовки выпусков журналов и непериодических изданий в формате xml для...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Выпускная квалификационная работа
Программа для автоматической генерации xml-формата синтаксической разметки в скате 53
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Руководство администратора Описание локализации
Поддержана возможность локализации верхнего и левого меню. Для обеспечения поддержки национального языка необходимо в папке метаданных...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Инструкция по использованию инструментов для просмотра сведений,...
...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Расчетов за услуги связи «Fastcom» версия 12 Руководство программиста....
Является наследником языков разметки sgml и html. Текущая стандарт для версии 0 принят консорциумом W3C в 2008 году
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Отчет по лабораторной работе №1 по дисциплине: «Компьютерные технологии в науке и производстве»
Целью лабораторной работы является изучение основ языка гипертекстовой разметки html
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Уфимский государственный авиационный технический университет кафедра асу методические указания
Для начала, html – язык разметки, который пока никто не отменял, поэтому его знание должно быть хорошим. Крайне желательно знание...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon О пошлинах евразийской патентной организации
Для целей настоящего Положения о пошлинах Евразийской патентной организации (далее Положение) нижеследующие понятия означают
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon О пошлинах евразийской патентной организации
Для целей настоящего Положения о пошлинах Евразийской патентной организации (далее Положение) нижеследующие понятия означают
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Патентная инструкция к евразийской патентной конвенции глава I. Общие положения
Евразийской патентной конвенции, регулируют правоотношения, связанные с подачей евразийских заявок, их рассмотрением, выдачей евразийских...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Разработка рецептур и оценка потребительских свойств концентратов...
Изучение, анализ и систематизация научно-технической литературы и патентной информации по теме исследования
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Методические рекомендации по санитарной обработке населения, обеззараживанию...
Вещества и растворы для дезактивации техники, зданий, имущества и средств индивидуальной защиты
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Инструкция по мойке кулера 2 Инструкция по санитарной обработке кулеров
Правила пользования бутилированной водой с использованием помпы 2 Рекомендуемая инструкция по санитарной обработке ручных помп при...
Рекомендации по обработке патентной информации с использованием xml (расширяемого языка разметки) icon Методическая разработка урока русского языка с использованием эор...
Автор: Поспелова Т. А., учитель русского языка и литературы лицея №17 г. Костромы

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск