Микроядро Mach

Микроядро Mach

Mach — микроядро операционной системы, разработанное в Carnegie Mellon University в исследовательских целях для решения задач с использованием распределенных вычислений. Это одно из первых микроядер, которое до сих пор используется во множестве операционных систем.

Проект в Carnegie Mellon University разрабатывался с 1985 по 1994 год, закончился на Mach 3.0. Некоторое число разработчиков продолжило Mach исследования. Mach был разработан как замена ядру в BSD версии Unix, поэтому ни одна новая операционная система не создана вокруг него. Сегодня экспериментальные исследования Mach закончены, однако Mach и его потомки используются в нескольких коммерческих операционных системах, таких как NEXTSTEP и OPENSTEP, а также Mac OS X (включая XNU).

Mach является логическим продолжением ядра Accent, также разработанного в Carnegie Mellon University. Главный разработчик Mach, Авадис Теваниан (англ. Avadis Tevanian ), являлся бывшим главой отдела программного обеспечения в Apple до марта 2006. Другой разработчик Mach, Ричард Рашид (англ. Richard Rashid), с 1991 года работал в

Содержание

Концепция

Так как Mach был спроектирован как быстрая замена традиционному ядру Unix, мы рассмотрим в основном отличия Mach от Unix. Стало понятным, что Unix-концепция "всё — файл" больше не работает на современных системах, но такие системы, как Plan 9 от Bell Labs, всё же пытаются следовать по этому пути. Разработчики Mach заметили негибкость такого подхода, и предположили, что другой уровень виртуализации может заставить систему «работать» снова.

Одна из важнейших абстракций в Unix — это конвейеры (pipe). Что похоже на конвейеры и позволит на более общем уровне сделать доступным различные перемещения информации между программами? Такая система может существовать, используя межпроцессное взаимодействие (IPC, но они были предназначены для специальных целей и не могли обеспечить то, что создатели Mach от них ждали.

В Carnegie Mellon University начали разработку ядра Accent, используя IPC, базирующийся на разделяемой памяти. Accent был экспериментальной системой со множеством возможностей, разрабатываемых по веянию моды за всё время разработки. Дополнительно, полезность Accent для исследования была ограничена, потому что он не был Unix-совместимым, а Unix был уже стандартом де-факто во всех исследовательских ОС. Также, Accent был жёстко привязан к платформе, на которой разрабатывался, и на начало 1980-х похоже, что скоро будет много новых платформ, многие из которых очень различны.

Mach был начат как попытка создать легко-определяемый, Unix-основанный, портируемый Accent. В результате получился короткий список основных концепций:

  • «задача» — набор ресурсов которые позволяют «потокам» исполняться
  • «поток» — единица, исполняющаяся на процессоре
  • «порт» определяет защищённый конвейер для IPC между задачами
  • «сообщение» перемещается между программами через порт

Mach разработан на концепциях IPC Accent'а, но сделан системой, больше похожей на Unix, которая позволяет запускать Unix-программы с минимальными изменениями или вовсе без них. Для достижения этой цели в Mach появилась концепция «порта», представляющего конец в двухстороннем IPC. Порты были защищены и имели права , подобные правам доступа на файлы в Unix, а также использовали очень похожую на Unix модель защиты. Дополнительно Mach разрешал любой программе владеть привилегиями, которыми обычно владеет только ядро, позволяя непривилегированному уровню (user-space) обращаться к аппаратному обеспечению.

В Mach, как в Unix, ОС опять стала главным образом набором утилит. Как и Unix, в Mach есть концепция "драйвера" как посредника между собственно ядром и аппаратным обеспечением. Однако все драйверы для существующего аппаратного обеспечения должны быть включены в микроядро. Другие архитектуры, базирующиеся на слоях абстракции от оборудования или экзоядрах могут отделять драйверы из микроядра.

Главным отличием от Unix было то, что утилиты должны были работать не с файлами, а с задачами. Больше кода было перемещено из ядра в непривилегированный режим. Ядро за счёт этого стало существенно меньше, отсюда термин микроядро для обозначения ядра Mach. В отличие от традиционных систем, под Mach процесс (или «задача») может состоять из набора потоков. Mach был первой ОС, которая определила понятие поток в этом смысле. Задачи ядра были сведены к работе с оборудованием и поддержке утилит.

Существование портов и использование IPC определяет большинство различий между Mach и традиционными ядрами. В Unix для обращения к ядру используются «системные вызовы» или «сигнал». Программа использует библиотеку, чтобы разместить данные в известном месте в памяти, и затем вызывает специальное программное прерывание. Когда система впервые запускает ядро, она устанавливает обработчик этого прерывания, поэтому программа, порождающая прерывание, вызывает ядро, которое исследует пришедшую информацию и совершает действия.

В Mach для этой цели используется IPC. Программа запрашивает у ядра доступ к порту, а затем использует механизм IPC для посылки сообщений в порт. В других ядрах эти сообщения обрабатываются системными вызовами; в Mach практически все запросы обрабатываются другой программой.

Использование IPC для передачи сообщений поддерживает потоки и конкуренцию. Так как задачи состоят из множества потоков, и их код в потоках использует механизм IPC. Mach может заморозить или разморозить поток, пока сообщение обрабатывается. Это позволяет системе быть распределённой на множество процессоров, используя разделяемую память прямо в большинстве сообщений Mach, или путём добавления кода для копирования сообщения в другой процессор, если требуется. В традиционном ядре это трудно реализовать, потому что система должна быть уверена, что различные программы не пытаются писать в туже самую память на различных процессорах. В Mach это хорошо определено и легко реализуется; процесс совершающий доступ к памяти, портам делается гражданином системы.

Система IPC имеет проблемы с производительностью, для преодоления которых было разработано несколько стратегий. В частности, Mach использует единый механизм разделения памяти для физической передачи сообщений от одной программы к другой. Физически копирования сообщения будет медленным, поэтому Mach обращается к блоку управления памятью (MMU) для быстрого соотнесения данных в одной программе и в другой. Только если данные записываются они будут физически скопированы, процесс называющийся «копирование при записи» (copy-on-write; cow).

Сообщения также проверяются на целостность ядром, чтобы избежать плохих данных, которые выведут из строя одну из программ, составляющих систему. Порты были разработаны на основе файловой системы Unix. Это позволило портам использовать существующие концепции навигации по файловой системе, а также права доступа.

По сравнению с более традиционными ОС разработка такой системы становится проще. Большая часть системы может быть запущена, отлажена и создана с помощью тех же утилит, что и программы для традиционной системы. С монолитным ядром ошибка в коде требует выключения целой машины и перезагрузки, в то время как в Mach требуется только перезапуск программы. Дополнительно пользователь может указывать системе включить или выключить возможности по своему желанию. Так как ОС — это коллекция программ, разработчики могут добавлять или удалять её части, просто запуская или убивая их, как и любую другую программу.

Разработка

Mach изначально располагался, как дополнительный код, написанный к существующему 4.2BSD ядру, который позволял команде работать на системе задолго до того, как она была завершена. Работа началась с уже готовой Accent IPC/порт системы, и переместилась на другие ключевые части OS, задачи, потоки и виртуальная память. Эти части были переписаны на вызов функций в Mach; параллельно с этим велась работа над 4.3BSD.

В 1986 система была завершена и могла запускатся на DEC VAX. Несмотря на малое практичное значение, цель создать микроядро была воплощена в жизнь. Вскоре последовал выпуск версий для IBM PC/RT и Sun Microsystems 68030 рабочих станций, предоставляя портируемость системы. К 1987 в список включены Encore Multimax и Sequent Balance. Release 1 вышел в этот год, а Release 2 в следующий.

Все это время обещанное «настоящее» микроядро не было создано. Эти ранние версии Mach включали большую часть 4.3BSD ядра, системы известные как POE, в результате это ядро было фактически больше чем Unix на котором оно базировалось. Однако, цель переместить Unix слой из ядра, где оно более просто разрабатывалось и заменялось была достигнута. К сожалению, производительность оставляла желать лучшего, и был осуществлен ряд архитектурных изменений чтобы решить эту проблему.

В результате Mach 3 вышел в 1990, и произвел интенсивный интерес. Маленькая команда, которая сделала Mach, портировала его на множество платформ, включая сложные мультипроцессорные системы которые создавали серьезные проблемы для старомодных ядер. Также был вызван интерес в коммерческом рынке, где нашлись компании которые хотели бы иметь возможность менять платформы, и если бы они портировали свои ОС на Mach, то могли бы безболезненно менять платформы.

Mach получил видимое ускорение когда Open Source Foundation анонсировало что они будут создавать будущую версию OSF/1 на Mach 2.5, и были бы рады использовать Mach 3. Mach 2.5 так же был выбран для IBM Workplace OS и несколько попыток от Apple Computer создать кросс-платформенную версию Mac OS.

Некоторое время казалось что каждая ОС созданная в конце 1990ых будет базироватся на Mach.

Проблемы с производительностью

Mach изначально позиционировался как замена классическому Unix, и по этой причине содержит множество Unіховых идей. К примеру, Mach использует систему прав и безопасности, основанную на Unix'овой файловой системе. Так как ядро исполняется в привелигированом режиме (kernel-mode) и возможно, что некоторая программа пошлет команду, которая повредит систему, ядру приходится проверять каждое сообщение. Также большинство функционала было расположено в программах, исполняющихся в непривилегированном режиме (user-space), это значит, что необходим некоторый способ разрешения таким программам дополнительных действий, например работа с аппаратным обеспечением.

Некоторые возможности Mach базировались на тех же механизмах IPC. К примеру, Mach с легкостью может поддерживать многопроцессорные компьютеры. В традиционном ядре экстенсивная работа проделывается, чтобы обеспечить реентерабельность или прерываемость программ, запущенных на разных процессорах и способных вызывать функции ядра в одно и то же время. В Mach кусочки операционной системы изолированы в серверах, которые могут запускаться, так же, как и другие программы — на любом процессоре. Потому теоретически ядро Mach также должно быть реентерабельным, но на практике это не проблема, так как все, что нужно Mach — это направить запрос какой-нибудь непривилегированной программе. Mach также включал сервер, который может перенаправлять сообщения не только между программами, но и по сети. Работа в этой области была продела в конце 1980-х и начале 1990-х.

К сожалению, использование IPC для большинства задач снижает производительность. Сравнения, проведенные в 1997 году, показали, что Unix, построенный на Mach 3.0, на 50% медленнее, чем традиционный Unix.

Исследования показали, что производительность падает из-за IPC, и достичь ускорения за счет раздробления ОС на маленькие сервера не возможно. Было сделано множество попыток улучшить производительность Mach, но в середине 1990 интерес пропал. Концепция системы основанной на IPC, похоже, умерла.

Фактически, исследование природы проблем производительности выявило несколько интересных фактов: один — IPC сам по себе не является проблемой, проблема в необходимости отображения памяти для его поддержки, что добавляет небольшие временные затраты. Большинство времени (около 80%) тратится на дополнительные задачи в ядре — на обработку сообщения. В первую очередь проверку прав порта и целостность сообщения. В тестах на Intel 80486DX-50 стандартный Unix вызов занимает около 21 микросекунды, соответствующий вызов в Mach занимает 114 микросекунд. Из них 18 микросекунд относятся к аппаратному обеспечению, остальное относится к различным функциям ядра Mach.

Когда Mach впервые был использован в серьезных разработках (2.x версия), производительность была ниже, чем в традиционных ядрах примерно на 25%. Эта цена не вызывала беспокойство, потому что система хорошо портировалась и работала на множестве процессоров. Фактически, система скрыла серьезные проблемы с производительностью до выхода Mach 3, когда множество разработчиков попыталось создать системы, запускаемые в непривилегированном режиме.

Когда Mach 3 попытался переместить ОС в непривилегированный режим, потеря производительности стала заметной. Рассмотрим простой пример: задача узнаёт текущее время. Посылается сообщение ядру Mach, это вызывает переключение контекста, отображение памяти, затем ядро проверяет сообщение и права, если все хорошо, то вызывается переключение контекста на сервер, затем сервер выполняет действия и посылает сообщение назад, ядро выделяет ещё памяти, и переключает контекст дважды.

Но тут ещё есть проблема. Она заключается в системе подкачки виртуальной памяти. Традиционные монолитные ядра знают, где ядро и его модули, а где память, которую можно выгружать. В то время как Mach не имеет ни малейшего представления о том, из чего состоит система. Вместо этого он использует единое решение, добавляющее проблем с производительностью. Mach 3 дает простой менеджер памяти, который обращается к другим менеджерам, выполняющимся в непривилегированном режиме, что заставляет систему делать дорогие IPC вызовы.

Многие из этих проблем существуют в любой системе, которой необходимо работать на многопроцессорной машине, и в середине 1980ых казалось, что будущий рынок будет наполнен ими. Фактически эволюция не работает как ожидается. Мультипроцессорные машины использовались в серверных приложениях в начале 1990ых, но затем исчезли. Тем временем производительность CPU возрастала на 60% в год, умножая неэффективность кода. Плохо, что скорость доступа к памяти растет только на 7% в год, это значит, что цена обращения к памяти не уменьшилась, и вызовы IPC Mach’а, которые не сохраняются в кэше, работают очень медленно.

Несмотря на возможности Mach, такие потери производительности в реальном мире не приемлемы, поэтому большая часть сообщества разработчиков ОС посчитала, что использование IPC в качестве основы ОС изначально провально.

Возможные решения

Как мы установили выше, большинство производительности Mach 3 теряется на IPC вызовах. Однако концепция «многосерверной системы» все еще обещающая, поэтому она требует исследований. Разработчикам необходимо аккуратно изолировать код в модули, которые не делают вызовов от сервера к серверу. К примеру, большая часть кода для работы с сетью должна быть помещена в отдельный сервер. Под Unix это не так то просто, потому что система базируется на использовании файловой системы для всего от сети до безопасности.

Большинство разработчиков застряло на оригинальной концепции единого большого сервера, который предоставляет функциональность ОС. Также для простоты разработки они разрешили операционной системе работать в привилегированном и непривилегированном режиме. Это позволяет им разрабатывать в непривилегированном режиме и иметь все невозможности идеи Mach, и затем перемещать отлаженный сервер в привилегированный режим чтобы иметь лучшую производительность. Несколько операционных систем разработано подобным методом, известным как «ко-локейшн» (co-location), это используется в Lites (порт 4.4BSD Lite), MkLinux, OSF/1 и Mac OS X. В

Mach 4 пытался решить эту проблему с помощью радикального набора улучшений. В частности, он находил программный код, который обычно не записываем, и поэтому копирование при записи случается редко. Это делало возможным не сопоставлять память между процессами (map memory) для IPC, а вместо этого использовать локальные области памяти программ. Это создало концепцию «шаттлов» и увеличило производительность, но разработчикам досталась сложность с управлением состояниями. Mach 4 также включил встроенные механизмы колокейшна.

Во всех тестах IPC производительность была названа источником проблемы, ей причисляется 73% потерянных циклов.

В середине 90-х работа над микроядерными системами остановилась. Хотя рынок верил, что все новые системы будут микроядерными в 90-х, сегодня только одна широко используемая система Mac OS X использует колокейшн сервер поверх сильно модифицированной Mach 3.

Следующее поколение

Исследования показали, что проблема производительности IPC не так страшна, как считается. Напоминаем, что односторонний вызов на BSD занимает 20 микросекунд, в то время как на Mach — 114, 11 из которых — это переключение контекста, идентичного BSD. Дополнительно 18 используется менеджером памяти для отображения сообщения между непривилегированной средой исполнения и привилегированной (user-space и kernel-space). Это добавляет 31 микросекунду, что дольше традиционного вызова, но не намного.

Оставшаяся часть проблемы — это проверки прав доступа к порту сообщений. В то время, как это выглядит очень важным, фактически, это требуется только на Unix системах. К примеру, однопользовательская система, запущенная на мобильном телефоне, может не нуждаться в таких возможностях, и это тот тип систем, в которых Mach может быть использован. Однако Mach создает проблемы: когда память перемещается в ОС, другие задачи могут не нуждаться в этом. Mac OS имели единое адресное пространство, разделяемое всеми процессами, поэтому в таких системах отображение памяти — пустая трата времени.

Эти реализации положили начало второму поколению микроядер, которое уменьшает сложность системы, размещая большую часть функциональности в непривилегированном режиме исполнения. Например, ядро

«Потенциальные» ускорения L4 основаны на факте, что непривилегированные приложения часто предоставляют множество функций, которые формально поддерживаются ядром. Можно сравнить производительность MkLinux в колокейшн режиме и порт L4, запущенный в непривилегированном режиме. L4 добавляет только около 5%-10% накладных расходов, в то время как Mach добавляет 15%, что весьма интересно, если учитывать двойные переключения контекста.

В результате новые микроядра изменили индустрию в целом, множество некогда мертвых проектов вроде GNU Hurd снова привлекло к себе внимание.

Операционные системы и ядра, основанные на Mach

См. также


Wikimedia Foundation. 2010.

Игры ⚽ Поможем решить контрольную работу

Полезное


Смотреть что такое "Микроядро Mach" в других словарях:

  • Mach — У этого термина существуют и другие значения, см. Мах. Необходимо проверить качество перевода и привести статью в соответствие со стилистическими правилами Википедии. Вы можете помочь улучшить эту статью …   Википедия

  • Микроядро — У этого термина существуют и другие значения, см. Микроядро (цитология). Архитектура микроядра основывается на программах серверах пользовательского режима …   Википедия

  • XNU — Ядро XNU Тип Ядро ОС Разработчик NeXT, Apple Операционная система ОС Darwin, Apple iOS, Mac OS X Лицензия Apple Public Source License 2.0 Сайт …   Википедия

  • MkLinux — Разработчик OSF Research Institute, Apple Computer, MkLinux Developers Association Семейство ОС Unix подобная Последняя версия Pre R2 2002 08 05 Поддерживаемые платформы PowerPC Тип ядра …   Википедия

  • Darwin — Разработчик Apple Inc. Семейство ОС Unix Поддерживаемые платформы PowerPC, x86, ARM Тип ядра Гибридное Лицензия В основном Apple Public Source License …   Википедия

  • Операционные системы на основе свободного программного обеспечения — Свободные ядра, библиотеки, среды рабочего стола и другие компоненты используются как в свободных операционных системах, так и во включающих несвободное ПО, или состоящих из него почти полностью. Содержание 1 GNU 2 Linux и GNU/Linux 3 BSD …   Википедия

  • Теванян, Аветис — Аветис Теванян Avie Tevanian Род деятельности: Программист Гражданство …   Википедия

  • Ядро операционной системы — В этой статье не хватает ссылок на источники информации. Информация должна быть проверяема, иначе она может быть поставлена под сомнение и удалена. Вы можете …   Википедия

  • GNU Hurd — HURD …   Википедия

  • Гибридное ядро — Проверить информацию. Необходимо проверить точность фактов и достоверность сведений, изложенных в этой статье. На странице обсуждения должны быть пояснения. Гибридное ядро (англ.  …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»