Форматы файлов

Форматы файлов

Термин формат файла (или тип файла) используется для описания структуры данных, записанных в компьютерном файле.

Так как файл представляет собой просто последовательность битов (то есть нулей и единиц), компьютерные программы, сохраняющие данные в файле, должны как-то преобразовывать обрабатываемую ими информацию в последовательность битов и наоборот (в ООП эти операции называются, соответственно, «сериализацией» и «десериализацией»). Алгоритм этого преобразования, а также соглашения о том, как различные фрагменты информации после преобразования располагаются внутри файла, и составляют его «формат».

Различные форматы файлов могут различаться степенью детализации, один формат может быть «надстройкой» над другим или использовать элементы других форматов. Например, текстовый формат накладывает только самые общие ограничения на структуру данных. Формат

Содержание

Спецификации

Для многих форматов файлов существуют опубликованные спецификации, в которых подробно описана структура файлов данного формата, то, как программы должны кодировать данные для записи в этот формат и как декодировать их при чтении. Большинство таких спецификаций свободно доступны, некоторые распространяются за плату.

Иногда компании могут считать определённые форматы файлов своей коммерческой тайной и не публиковать их. Хорошо известный пример — форматы файлов пакета Microsoft Office. В некоторых случаях компания, выпустившая приложение, просто не считает нужным тратить время на написание подробной спецификации.

Если спецификация формата недоступна, то для обеспечения совместимости программы с данным форматом приходится заниматься обратной разработкой. В большинстве или во всех странах форматы файлов не защищены законами об авторских правах. Однако в некоторых странах патентами могут быть защищены алгоритмы, используемые для кодирования данных в какой-либо формат. Например, в широко распространённом формате PNG.

Определение типа файла

Для того, чтобы правильно работать с файлами, программы должны иметь возможность определять их тип. По историческим причинам, в разных операционных системах используются разные подходы для решения этой задачи.

Расширение имени файла

Некоторые операционные системы, например, CP/M, Microsoft Windows используют для определения типа файла часть его имени, т. н. «расширение имени файла». В старых операционных системах это были три символа, отделённые от имени файла точкой (в файловых системах семейства FAT имя и расширение хранились отдельно, точка добавлялась уже на уровне ОС); в более новых системах расширение может являться просто частью имени, и тогда его длина ограничена только неиспользованной длиной имени (которая может составлять, например, 255 символов). Например, HTML-файлам может соответствовать расширение «.htm» или «.html».

Пользователь может свободно изменить расширение файла. Поскольку многие оболочки пользователя используют расширение, чтобы определить программу, с помощью которой нужно открыть файл, это может сделать последний недоступным для работы или вообще «потерять», если пользователь забудет исходное расширение. Поэтому Windows Explorer по умолчанию скрывает расширения. Эта практика имеет и обратную сторону: так как расширение файла не видно, можно обмануть пользователя, заставив его думать, что, например, файл с расширением .exe — изображение с другим расширением. В то же время, опытный пользователь может использовать возможность изменить назначенный файлу тип, просто сменив расширение, чтобы открыть его в другой программе, не указывая её напрямую. Это может быть полезно, если в программе не предусмотрено открытие файлов с каким‑то расширением, а пользователь знает, что их формат подходит для обработки в данной программе.

Магические числа

Другой способ, широко используемый в «магическое число» — последовательность символов, по которой может быть опознан формат файла. Первоначально этот термин использовался для специального набора 2-байтовых идентификаторов, сохраняемых в начале файла (эта практика перекочевала и в другие ОС), однако, любая последовательность символов, характерная для данного формата, может быть использована как «магическое число».

Метаданные

Некоторые файловые системы позволяют сохранять дополнительные атрибуты для каждого файла, т. н. «метаданные». Эти метаданные можно использовать для хранения информации о типе файла. Такой подход используется в компьютерах Apple Macintosh. Метаданные поддерживаются такими современными файловыми системами как NTFS, ext3 и другими. Недостатком этого метода является плохая переносимость — при копировании файлов между файловыми системами разных типов метаданные могут быть потеряны.

MIME

Типы данных, определённые стандартом сетевых протоколах, однако в файловых системах они пока применяются редко.

См. также

Ссылки


Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Полезное


Смотреть что такое "Форматы файлов" в других словарях:

  • Форматы пакетов программ Linux — Здесь приведены ссылки на статьи о форматах файлов, используемых системами управления пакетами операционных систем на основе Linux и GNU. Основные виды форматов пакетов: Бинарные (двоичные) пакеты[1] Пакеты, включающие исходные коды программ… …   Википедия

  • Форматы PDF, PDF/X — PDF Portable Document Format предложенный компанией Adobe открытый формат файла специально для целей ведения рабочего потока в полиграфии (допечатная стадия). Такое же наименование имеют соответствующие системы спецификаций. Открытость формата… …   Краткий толковый словарь по полиграфии

  • Список форматов файлов — …   Википедия

  • Формат файлов — Термин формат файла (или тип файла) используется для описания структуры данных, записанных в компьютерном файле. Так как файл представляет собой просто последовательность битов (то есть нулей и единиц), компьютерные программы, сохраняющие данные… …   Википедия

  • Графические форматы — Графический формат  это способ записи графической информации. Графические форматы файлов предназначены для хранения изображений, таких как фотографии и рисунки. Графические форматы делятся на векторные и растровые. Содержание 1 Растровые… …   Википедия

  • Двоичный формат файлов Microsoft Excel 97—2007 — Microsoft Excel (Windows) Microsoft Excel 2007 Тип Табличный процессор Разработчик ОС Microsoft Windows …   Википедия

  • Двоичный формат файлов Microsoft Excel 97—2000 — Microsoft Excel (Windows) Microsoft Excel 2007 Тип Табличный процессор Разработчик ОС Microsoft Windows …   Википедия

  • Список аудиоформатов файлов — Форматы файлов аудио: AA Dolby Digital (AC3) AAC AIFF APE AUD DMF DTS FLAC MIDI MOD MP1 MP2 MP3 MP4 MPC Ogg Vorbis RA TTA …   Википедия

  • deb (формат файлов) — У этого термина существуют и другие значения, см. Deb. Пакет Debian (dpkg) Иконка d …   Википедия

  • Ассоциация файлов — Ассоциация или ассоциирование файлов  в программном обеспечении привязывание файла (по расширению или по каким либо другим признакам) к прикладной программе, которая обрабатывает эти файлы. При «вызове» этого файла, например, в файловом… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»