Обучение машин

Обучение машин

Машинное обучение (англ. Machine Learning) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. Различают два типа обучения. Обучение по прецедентам, или индуктивное обучение, основано на выявлении закономерностей в эмпирических данных. Дедуктивное обучение предполагает формализацию знаний экспертов и их перенос в компьютер в виде базы знаний. Дедуктивное обучение принято относить к области экспертных систем, поэтому термины машинное обучение и обучение по прецедентам можно считать синонимами.

Машинное обучение находится на стыке математической статистики, методов оптимизации и дискретной математики, но имеет также и собственную специфику, связанную с проблемами вычислительной эффективности и переобучения. Многие методы индуктивного обучения разрабатывались как альтернатива классическим статистическим подходам. Многие методы тесно связаны с извлечением информации, интеллектуальным анализом данных (Data Mining).


Содержание

Общая постановка задачи обучения по прецедентам

Имеется множество объектов (ситуаций) и множество возможных ответов (откликов, реакций). Существует некоторая зависимость между ответами и объектами, но она не известна. Известна только конечная совокупность прецедентов — пар «объект, ответ», называемая обучающей выборкой. На основе этих данных требуется восстановить зависимость, то есть построить алгоритм, способный для любого объекта выдать достаточно точный ответ. Для измерения точности ответов определённым образом вводится функционал качества.

Данная постановка является обобщением классических задач аппроксимации функций. В классических задачах аппроксимации объектами являются действительные числа или векторы. В реальных прикладных задачах входные данные об объектах могут быть неполными, неточными, нечисловыми, разнородными. Эти особенности приводят к большому разнообразию методов машинного обучения.

Способы машинного обучения

Так как раздел машинного обучения, с одной стороны, образовался в результате разделения науки о нейросетях на методы обучения сетей и виды топологий архитектуры сетей, а с другой, вобрал в себя методы математической статистики, то указанные ниже способы машинного обучения исходят из нейросетей. То есть базовые виды нейросетей, такие как перцептрон и многослойный перцептрон (а так же их модификации) могут обучаться как с учителем, без учителя, с подкреплением, и активно. Но некоторые нейросети и большинство статистических методов можно отнести только к одному из способов обучения. Поэтому если нужно классифицировать методы машинного обучения в зависимости от способа обучения, то, касательно нейросетей, не корректно их относить к определенному виду, а правильнее классифицировать алгоритмы обучения нейронных сетей.

  1. Метод коррекции ошибки
  2. Метод обратного распространения ошибки
  • Обучение без учителя - для каждого прецедента задаётся только «ситуация», требуется сгруппировать объекты в кластеры, используя данные о попарном сходстве объектов, и/или понизить размерность данных:
  1. Альфа-система подкрепления
  2. Гамма-система подкрепления
  1. Генетический алгоритм.
  • Активное обучение - отличается тем, что обучаемый алгоритм имеет возможность самостоятельно назначать следующую исследуемую ситуацию, на которой станет известен верный ответ:
  • Обучение с частичным привлечением учителя (semi-supervised learning) - для части прецедентов задается пара «ситуация, требуемое решение», а для части - только «ситуация»
  • Трансдуктивное обучение (transduction) - обучение с частичным привлечением учителя, когда прогноз предполагается делать только для прецедентов из тестовой выборки
  • Многозадачное обучение (multi-task learning) - одновременное обучение группе взаимосвязанных задач, для каждой из которых задаются свои пары «ситуация, требуемое решение»
  • Многовариантное обучение (multi-instant learning) - обучение, когда прецеденты могут быть объединены в группы, в каждой из которых для всех прецедентов имеется «ситуация», но только для одного из них (причем, неизвестно какого) имеется пара «ситуация, требуемое решение»

Классические задачи решаемые с помощью машинного обучения

Типы входных данных при обучении

  • Признаковое описание объектов — наиболее распространённый случай.
  • Описание взаимоотношений между объектами, чаще всего отношения попарного сходства, выражаемые при помощи матрицы расстояний, ядер либо графа данных
  • Временной ряд или сигнал.
  • Изображение или видеоряд.

Типы функционалов качества

  • При обучении с учителем - функционал качества может определяется как средняя ошибка ответов. Предполагается, что искомый алгоритм должен его минимизировать. Для предотвращения переобучения в минимизируемый функционал качества часто в явном или неявном виде добавляют регуляризатор.
  • При обучении без учителя - функционалы качества могут определяться по-разному, например, как отношение средних межкластерных и внутрикластерных расстояний.
  • При обучении с подкреплением - функционалы качества определяются физической средой, показывающей качество приспособления агента.

Практические сферы применения

Целью машинного обучения является частичная или полная автоматизация решения сложных профессиональных задач в самых разных областях человеческой деятельности.

Машинное обучение имеет широкий спектр приложений:

Сфера применений машинного обучения постоянно расширяется. Повсеместная информатизация приводит к накоплению огромных объёмов данных в науке, производстве, бизнесе, транспорте, здравоохранении. Возникающие при этом задачи прогнозирования, управления и принятия решений часто сводятся к обучению по прецедентам. Раньше, когда таких данных не было, эти задачи либо вообще не ставились, либо решались совершенно другими методами.

Литература

  • Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. — М.: Финансы и статистика, 1983.
  • Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: исследование зависимостей. — М.: Финансы и статистика, 1985.
  • Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерности. — М.: Финансы и статистика, 1989.
  • Вапник В. Н. Восстановление зависимостей по эмпирическим данным. — М.: Наука, 1979.
  • Журавлев Ю. И., Рязанов В. В., Сенько О. В. «Распознавание». Математические методы. Программная система. Практические применения. — М.: Фазис, 2006. ISBN 5-7036-0108-8.
  • Загоруйко Н. Г. Прикладные методы анализа данных и знаний. — Новосибирск: ИМ СО РАН, 1999. ISBN 5-86134-060-9.
  • Шлезингер М., Главач В. Десять лекций по статистическому и структурному распознаванию. — Киев: Наукова думка, 2004. ISBN 966-00-0341-2.
  • Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning. — Springer, 2001. ISBN 0-387-95284-5.
  • Mitchell T. Machine Learning. — McGraw-Hill Science/Engineering/Math, 1997. ISBN 0-07-042807-7.
  • Ryszard S. Michalski, Jaime G. Carbonell, Tom M. Mitchell (1983), Machine Learning: An Artificial Intelligence Approach, Tioga Publishing Company, ISBN 0-935382-05-4.[1]

Библиография

  1. Vapnik V.N. Statistical learning theory. — N.Y.: John Wiley & Sons, Inc., 1998. [2]
  2. Bernhard Schölkopf, Alexander J. Smola Learning with Kernels. Support Vector Machines, Regularization, Optimization, and Beyond. — MIT Press, Cambridge, MA, 2002 ISBN 13-978-0-262-19475-4 [3]
  3. I.H. Witten, E. Frank Data Mining: Practical Machine Learning Tools and Techniques (Second Edition). - Morgan Kaufmann, 2005 ISBN 0-12-088407-0 [4]

Внешние ссылки

Ресурсы

Журналы

  • Pattern Recognition and Image Analysis

Конференции

Курсы лекций

Российские исследовательские группы и коммерческие фирмы

  • Лаборатория распознавания образов (московский Центр непрерывного математического образования).
  • ABBYY — один из ведущих мировых разработчиков ПО в области распознавания документов (OCR), ввода форм (ICR) и прикладной лингвистики.
  • BaseGroup — добыча данных, анализ и прогнозирование, создание прикладных аналитических систем (Рязань).
  • Forecsys — интеллектуальный анализ данных, прогнозирование продаж, кредитный скоринг, распознавание образов.
  • Megaputer — разработка и производство аналитических систем для углубленного анализа числовых и текстовых баз данных.
  • NeurOK — анализ данных и управление знаниями.
  • SnowCactus — Аналитические технологии для бизнеса.
  • Solutions — Центр технологий анализа данных и прогнозирования (Долгопрудный).
  • ZSoft — Проектирование, разработка и внедрение информационно-аналитических систем (Санкт-Петербург).

Категории


Wikimedia Foundation. 2010.

Игры ⚽ Нужен реферат?

Полезное


Смотреть что такое "Обучение машин" в других словарях:

  • Обучение без учителя — (англ. Unsupervised learning, самообучение, спонтанное обучение)  один из способов машинного обучения, при решении которых испытуемая система спонтанно обучается выполнять поставленную задачу, без вмешательства со стороны… …   Википедия

  • Обучение — 1. процесс приобретения с помощью школьных программ, педагогов и воспитателей относительно несложных навыков (речевых, счётных, трудовых и т.п.) и элементарных сведений, дающих возможность адаптироваться к повседневным обстоятельствам жизни; 2.… …   Энциклопедический словарь по психологии и педагогике

  • Обучение программированное —     один из видов обучения, осуществляемый по заранее составленной обучающей программе, которая реализуется обычно с помощью программированных учебников и обучающих машин. При О.п. материал и деятельность обучаемого расчленяются на порции (дозы)… …   Педагогический терминологический словарь

  • Обучение программированное — один из видов обучения, осуществляемый по заранее составленной обучающей программе, к рая реализуется обычно с помощью программированных учебников и обучающих машин. При О. п. материал и деятельность обучаемого расчленяются на порции (дозы) и… …   Педагогический словарь

  • ПРОГРАММИРОВАННОЕ ОБУЧЕНИЕ — обучение по заранее разработанной программе, в к рой предусмотрены действия как учащихся, так и педагога (или заменяющей его обучающей машины) Идея П.о. была предложена в 50 х гг. 20 в амер психологом Б Ф Скиннером для повышения эффективности… …   Российская педагогическая энциклопедия

  • Программированное обучение —     обучение по заранее разработанной программе, в которой предусмотрены действия как учащихся, так и педагога (или заменяющей его обучающей машины). Идея П.о. была предложена в 50 х гг. 20 в. американским психологом Б.Ф. Скиннером для повышения… …   Педагогический терминологический словарь

  • ГОСТ 27928-88: Машины землеройные. Эксплуатация и обслуживание. Обучение механиков — Терминология ГОСТ 27928 88: Машины землеройные. Эксплуатация и обслуживание. Обучение механиков оригинал документа: 5.2. Второй год обучения 5.2.1. Типовая программа второго года обучения содержит следующие разделы: техническое обслуживание и… …   Словарь-справочник терминов нормативно-технической документации

  • ПРОГРАММИРОВАННОЕ ОБУЧЕНИЕ — (от греч. πρόγραμμα – публичное объявление) – различные психолого педагогич. концепции, для которых общим является: 1) трактовка процесса усвоения знаний как процесса выработки определ. навыков (практических или умственных) на основе… …   Философская энциклопедия

  • ПРОГРАММИРОВАННОЕ ОБУЧЕНИЕ — ПРОГРАММИРОВАННОЕ ОБУЧЕНИЕ. Организация учебного процесса по специальной обучающей программе, обеспечивающей самостоятельное приобретение знаний, навыков и умений. Появилось в результате заимствования педагогикой рациональных принципов и средств… …   Новый словарь методических терминов и понятий (теория и практика обучения языкам)

  • Техническое обслуживание машин — 4.4. Техническое обслуживание машин Курсант должен получить полную подготовку и приобрести соответствующий опыт работы по общему обслуживанию машин, при этом особое внимание следует уделять применению смазочных устройств и инструмента обычных… …   Словарь-справочник терминов нормативно-технической документации


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»