Формат метаданных

Формат метаданных

Метаданные, в общем случае

  1. Метаданные это информация о данных[1].
  2. Информация об информации. Пример: Имя автора правки в тексте. Этот термин в широком смысле слова используется для любой информации о данных: именах таблиц, колонок в таблице в реляционных базах данных, номер версии в файле программы (т.е как информативная часть в бинарном файле) и т. п.
  3. Структурированные данные, представляющие собой характеристики описываемых сущностей для целей их идентификации, поиска, оценки, управления ими[2].
    • набор допустимых структурированных описаний, которые доступны в явном виде и предназначение которых помочь найти объект[3]. Термин используется в контексте поиска объектов, сущностей, ресурсов.
  4. Данные из более общей формальной системы, описывающей заданную систему данных.

Содержание

Иерархии метаданных

Структурированные в виде иерархии метаданные более правильно называть онтологией или схемой метаданных (например, XML-схема).

Различие между данными и метаданными

Обычно невозможно провести однозначное разделение на данные и метаданные в документе, поскольку:

  • Что-то может являться как данными, так и метаданными. Так, заголовок статьи можно одновременно отнести как к метаданным (как элемент метаданных — заголовок), так и к собственно данным (поскольку заголовок является частью самого текста).
  • Данные и метаданные могут меняться ролями. На стихотворение, рассматриваемое как данные, может быть написана музыка, в этом случае всё стихотворение может быть «прикреплено» к музыкальному файлу и в этом случае рассматриваться как метаданные. Таким образом, отнесение к одной или другой категории зависит от точки зрения (или, пространства имен, системы отсчета).
  • Возможно создание мета-мета-…-метаданных (см. аксиома выбора). Поскольку, в соответствии с обычным определением, метаданные являются данными, то можно создать метаданные на метаданные, метаданные на метаданные на метаданные и так далее. На первый взгляд это может показаться бесполезным, но на самом деле это является очень существенным и полезным свойством данных и метаданных.

Эти рассуждения применимы независимо от выбора определения метаданных (из приведённых выше и не только).

Использование

Метаданные используются для повышения качества поиска. Поисковые запросы, использующие метаданные могут спасти пользователя от лишней ручной работы по фильтрации. Информируя компьютер о том, какие элементы данных связаны и как эти связи учитывать, становится возможным осуществлять достаточно сложные операции по фильтрации и поиску. Например, если поисковая система «знает» о том, что «Ван Гог» является «голландским художником», то она может выдать в ответ на запрос о голландских художниках веб-страницу о Ван Гоге, даже если слова «голландский художник» не встречаются на этой странице. Такой подход, называемый представлением знаний, находится в сфере интересов Семантической паутины и искусственного интеллекта.

В частности, метаданные создаются для оптимизации алгоритмов сжатия с потерей качества. Например, если к видео прилагаются метаданные, позволяющие компьютеру разделить изображение на основную часть и фоновую, то последняя может быть сжата сильнее, что позволит достичь большего коэффициента сжатия.

Некоторые виды метаданных предназначены для обеспечения возможности различных видов представления некоторых данных. Например, если к изображению прилагаются метаданные, содержащие информацию о том, какая часть изображения наиболее важная (допустим, изображение человека), то программа для просмотра изображений на маленьком экране (таком, как на мобильном телефоне), может отобразить только эту наиболее важную часть изображения. Аналогично используются метаданные, позволяющие сделать доступными для слепых диаграммы и изображения, путём их преобразования для вывода на специальные устройства, либо чтения их описания с использованием программного обеспечения, преобразующего текст в речь.

Другие описательные метаданные могут использоваться автоматизированными рабочими потоками. Например, если некоторая «умная» программа «знает» содержимое и структуру данных, то данные могут быть автоматически преобразованы и переданы другой «умной» программе как входные данные. В результате, пользователи будут спасены от необходимости выполнения множества рутинных операций, если данные предоставлены для работы такими «немногословным» программам.

Метаданные становятся важны в World Wide Web по причине необходимости обеспечения поиска полезной информации среди огромного количества доступной. Метаданные, созданные вручную имеют большую ценность, поскольку это гарантирует осмысленность. Если веб-страница на какую-то определённую тему содержит слово или фразу, то все другие веб-страницы на эту тему могут содержать такое же слово или фразу. Метаданные также обладают разнообразием, поэтому если с какой-то темой связаны два значения, то каждое из них может быть использовано. Например, статья про Живой Журнал может быть обозначена с помощью нескольких значений: «Живой Журнал», «ЖЖ», «LiveJournal».

Метаданные используются для хранения информации о записях audio CD. Аналогично MP3 файлы хранят метаданные в формате

Классификация метаданных

Метаданные можно классифицировать по:

  • Содержанию. Метаданные могут либо описывать сам ресурс (например, название и размер файла), либо содержимое ресурса (например, «в этом видеофайле показано как парень играет в футбол»).
  • По отношению к ресурсу в целом. Метаданные могут относиться к ресурсу в целом или к его частям. Например, «Title» (название фильма) относится к фильму в целом, а «Scene description» (описание эпизода фильма) отдельное для каждого эпизода фильма.
  • По возможности логического вывода. Метаданные можно подразделить на три слоя: нижний слой — это «сырые» данные сами по себе; средний слой — метаданные, описывающие эти данные; и верхний слой — метаданные, которые позволяют делать логический вывод, используя второй слой.

Формат метаданных

Метаданными на практике обычно называют данные, представленные в соответствии с одним из форматов метаданных.

Формат метаданных — представляет собой стандарт, предназначенный для формального описания некоторой категории ресурсов (объектов, сущностей и т. п.). Такой стандарт обычно включает в себя набор полей (атрибутов, свойств, элементов метаданных), позволяющих характеризовать рассматриваемый объект. Например, формат MARC позволяет описывать книги (и не только книги), содержит поля для описания названия, автора, тематики и огромного множества других характеристик (формат MARC позволяет описать сотни характеристик).

Форматы можно классифицировать, во-первых, по охвату и подробности типов описываемых ресурсов. Во-вторых, по ширине и подробности области описания ресурсов и мощности структуры элементов метаданных. Кроме этого, можно классифицировать по предметным областям, или целям разработки и использования формата метаданных.

Форматы метаданных часто разрабатываются международными организациями или консорциумами, включающими в себя заинтересованные в появлении стандарта государственные организации и частные компании. Разработанный формат часто закрепляется как стандарт в одной или нескольких организациях, занимающихся разработкой и принятием стандартов (например W3C, ANSI и т. п.)

Классификация форматов метаданных по описываемой предметной области:

  • DCMI является одним из наиболее распространённых в интернет форматов метаданных для описания ресурсов любого типа (как электронных документов, так и реальных физических объектов). Другие форматы метаданных, предназначенные для описания архивов и электронных ресурсов GILS, EAD.
  • для описания персон и организаций FOAF
  • для описания библиографических ресурсов предназначены форматы семейства MARC для решения задач интеграции данных был разработан формат MODS.
  • для описания музейных и исторических ценностей используется формат CDWA
  • для описания издательской продукции используются PRISM и ONIX
  • для кристаллографической информации
  • для работы с изображениями со спутников VICAR
  • для описания новостей NewsXML

и т. д.

См. также

Примечания

  1. Воройский Ф.С. Информатика. Новый систематизированный словарь-справочник (Вводный курс по информатике и вычислительной технике в терминах). — 2-е изд., перераб. и доп.. — М.: Издательство Либерия, 2001. — С. 536. — ISBN 5-85129-134-6
  2. Task Force on Metadata. Summary Report. // American Library Association. — 1999. — Т. June.
  3. D. C. A. Bultermann Is It Time For a Moratorium on Metadata? // IEEE MultiMedia. — 2004. — Т. Oct-Dec.

Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать реферат

Полезное


Смотреть что такое "Формат метаданных" в других словарях:

  • формат EXIF — Стандартный формат для добавления к цифровым фотографиям метаданных: информации об используемой камере, дате, времени и условиях съемки и так далее. Поддерживается большинством популярных графических пакетов [www.computerbild.ru].… …   Справочник технического переводчика

  • Метаданные — Эта статья или раздел нуждается в переработке. Пожалуйста, улучшите статью в соответствии с правилами написания статей. Метаданные …   Википедия

  • Дублинское ядро — (англ. Dublin Core)  стандарт метаданных (формат метаданных), простой и эффективный набор для описания широчайшего диапазона сетевых ресурсов. Стандарт разделён на два уровня: простой (неквалифицированный, simple), состоящий из 15… …   Википедия

  • ID3 (метаданные) — У этого термина существуют и другие значения, см. ID3. Для улучшения этой статьи желательно?: Переработать оформление в соответствии с правилами написания статей …   Википедия

  • GeoTIFF — Расширение .tiff, .tif MIME image/tiff Тип формата геопространственные метаданные Расширен из TIFF GeoTIFF  открытый формат метаданных, позволяющий включать информацию о географической привязке в файлы TIFF. Может включать в себя вид …   Википедия

  • Extensible Metadata Platform — Adobe XMP (англ. eXtensible Metadata Platform расширяемая платформа метаданных, произносится «экс эм пи»)  это технология, созданная Adobe и позволяющая пользователю добавлять дополнительную информацию в файлы, сохраняемые в форматах… …   Википедия

  • Windows Runtime — Стиль этой статьи неэнциклопедичен или нарушает нормы русского языка. Статью следует исправить согласно стилистическим правилам Википедии. Windows Runtime, или WinRT  это новая(по состоянию на 2011 год) модель программирования от …   Википедия

  • .NET Framework — Для термина «.NET» см. другие значения. .NET Framework Тип Комп …   Википедия

  • ID3 — может означать: ID3 (метаданные) (от англ. Identify an MP3) формат метаданных, сохраняемых в файлах форматов типа MP3 (автор, название альбома, и т. д.) ID3 (алгоритм) один из алгоритмов для построения дерева принятия решений …   Википедия

  • Windows Imaging Format — Формат файла WIM Расширение .wim .swm .rwm Разработан Microsoft Тип формата Расширение имени файла Windows Imaging Format (WIM)  это файл ориентированный формат образа диска. Формат был разработан компанией Microsoft для развертывания… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»