Лаборатория данных

Метаданные

Историю о метаданных принято начинать с библиотечных каталогов — задача учёта и поиска книг становится намного проще, если переписать на карточку ее автора, название и место хранения. Со временем люди начали упорядочивать информацию обо всём на свете: от сельского хозяйства до астрономических объектов.

Главное в описании данных — это формат. Важно договориться описывать определённую информацию неизменным набором свойств, например, изображения — пикселями и глубиной цвета, а тексты — числом символов, строк и страниц. Разрабатывают такие форматы организации по стандартизации, например, NISO — Национальная Организация по Информационным Стандартам объединяет издателей и библиотеки, которые вместе разрабатывают и утверждают стандарты библиографических записей, ссылок на сайты и цифровые объекты. Формально стандарт включает в себя набор полей (атрибутов, свойств, элементов метаданных), характеризующих рассматриваемый объект.

Метаданные делятся на три типа.
  • К описательным метаданным относится информация, которая определяет объект, например название или ключевые значения. В примере с библиотекой книгу можно искать по литературному жанру.
  • Структурные метаданные описывают, как устроен объект, какие в нём составные части. В книге это может быть оглавлением.
  • К административным метаданным относится информация, необходимая для управления объектом: авторство, дата создания, право доступа — так бульварный роман не попадёт в детскую секцию.

Систематизации и описанию поддаются практически любые данные, документооборот в организации, законодательство, переписка между сотрудниками. Умение работать с метаданными облегчает трудоёмкие рутинные процессы, делает работу и жизнь проще.