Методы и способы ML (машинного обучения)

2024 год: невозможно представить себе новостной блог без постов о machine learning. Аналитики прогнозируют, что к 2030 году рынок ML достигнет 225 миллиардов долларов. В то время как на 2023 год был запланирован рост до 26 миллиардов долларов.
Методы и способы ML (машинного обучения)

Методы и способы ML (машинного обучения). Фото: из архива компании

Другими словами, machine learning — явление не временное. С каждым годом эта технология будет глубже и глубже проникать во все сферы человеческой жизни: научится прогнозированию, классификации и генерации объектов. О машинном обучении говорят настолько часто, что уже каждому человеку известно, в чём суть машинного обучения, как оно возникло, какие технологии и приёмы использует. Напомним основные моменты в данной статье.

Определение машинного обучения

Машинное обучение (Machine Learning, ML) — это ответвление в области искусственного интеллекта, которая повторяет мыслительный процесс человека. Не нужно прописывать чёткий алгоритм действий, как в программном обеспечении, ML постоянно «думает», почти как человеческий мозг, и способен сам находить наилучший выход из ситуации.

Техники машинного обучения схожи  с прогнозированием на основе big data. Закономерности система находит с помощью нейронных сетей. Нейронная сеть — это тоже разновидность AL, которая работает на основе глубинного обучения.

Возможности машинного обучения нашли своё практическое применение для создания следующих сервисов:

  • Рекомендации продуктов, услуг и контента на основе поведения пользователей. Например, таким образом работают онлайн-кинотеатры, рекомендуя фильмы и телешоу на основе просмотренного.
  • Прогнозирование. Алгоритмы машинного обучения могут предсказывать будущее: наступление вероятных событий, объёмы продаж, даже заболевания на основе анамнеза у пациентов медицинских клиник. Многие сферы уже приняли на вооружение модели машинного обучения: с помощью них банки определяют кредитный потенциал заёмщиков и отсеивают неплатёжеспособных клиентов.
  • Анализ. Модели машинного обучения могут распознавать людей и предметы на изображениях и видео. Они различают человеческую речь и могут анализировать тексты. Это облегчает рутинные процессы, упрощает человеческие задачи, обеспечивая при этом высокую безопасность данных. Как пример: распознавание номерных знаков автомобилей с камер видеонаблюдения.

Как работает машинное обучение

  • Определите параметры отбора нужной информации при сборе. То, что поможет вычленить нужные данные из огромного массива данных.
  • Подготовьте информацию для алгоритмов ML: снабдите их маркерами, по которым алгоритмы ML смогут распознавать нужные элементы. Это длительный процесс, поскольку маркировка сейчас выполняется экспертами вручную и редко автоматизируется.
  • Проверьте данные и выявите закономерности. В ходе этого процесса находят и исправляют ошибки, чтобы не допустить их на следующий этап и получить более чистый результат.
  • Выберите модель и обучите её. Алгоритмы начнут обрабатывать собранные данные и выдавать первые результаты.
  • Произведите оценку полученных данных и результативность алгоритмов. На этом этапе снова проверяются результаты на возможные ошибки, они исправляются и алгоритм готовится для дальнейшей работы.

Как работает машинное обучение

История возникновения Learning Machine

20-й век

Самые ранние упоминания о машинном обучении датируются серединой прошлого века. Исследователи Уолтер Питтс и Уоррен Мак-Каллок впервые успешно воспроизвели нейроны в 1943 году. Но дальше открытие развития не получило.

Более известен проект армии США в 1946 году, в котором с помощью программного обеспечения создавались таблицы корректировки цели и улучшения меткости стрельбы.

Расцвет ML пришёлся на 1950-е годы, когда Джозеф Вейцбаум, Фрэнк Розенблатт и Артур Сэмюэл создали программу Checkers-playing для игры в шашки. Примерно в то же время широкую известность получило изобретение Розенблатта — нейросетевая модель, имитирующая работу человеческого мозга (Mark I Perceptron).

В конце 1950-х мир увидел SNARC — нейронная сеть для решения комплексных задач, её изобрёл американский учёный Марвин Минский.

Определение «машинное обучение» было впервые озвучено на конференции в Дартмутском колледже в США в 1959 году.

Первый образец виртуального помощника был представлен в 1960-х годах. Прототип назвали ELIZA, она имитировала диалог с психотерапевтом и могла оказать профессиональную помощь пациентам. В то же десятилетие были изобретены алгоритмы, способные классифицировать и сортировать данные. В конце 60-х Бернард Уидроу и Себастьян Трун разработали алгоритм обратного распространения ошибки, что послужило мощным толчком в развитии нейронных сетей.

В 1980-х годах учёные вновь применили ML-технологию для игровой индустрии. На этот раз это были шахматы. Перспективные разработчики из Университета Карнеги-Меллон анонсировали ChipTest. На её основе в конце 1990-х годов был создан первый суперкомпьютер Deep Blue, который выиграл у блестящего шахматиста Гарри Каспарова шахматный матч. Этот поединок стал первым соревнованием между ML и человеком, которое подтвердило потенциал искусственного мозга.

21 век

В современную эпоху с увеличением мощности компьютеров и ростом объемов информации ML вышла на более высокий уровень развития: в 2000-х годах возникло понятие «глубокое обучение». В начале 2010-х годов были запущены новые проекты в области нейронных сетей, в игру вступили крупные игроки. В 2012 году компания Google представила алгоритм, который умеет распознавать котят на фотографиях и видео. Кроме того, Google запустила сервис аналитики и машинного обучения Google Prediction API.

Такие гиганты, как Amazon, Microsoft и Facebook*, последовали этому примеру, запустив собственные платформы, которые работают на основании принципов машинного обучения. А разработка DeepFace Марка Цукерберга способна с высокой точностью распознавать лица.

В настоящее время машинное обучение наращивает свою роль во всех отраслях жизни. Технология уже используется в финансах, здравоохранении, промышленности и транспорте и будет все больше проникать в обычную жизнь людей.

Способы и методы машинного обучения

Способы машинного обучения представлены на картинке ниже:

Способы и методы машинного обучения

Байесовский классификатор

Происходит от теоремы Байеса. Байесовский классификатор определяет класс объекта на основе его признаков. Его называют одним из простейших классификаторов и он может использоваться для идентификации объектов на изображениях или, например, выявления спама.

bayes_34dd50caec

Дерево решений

В этом подходе модель определяет взаимосвязь между событиями и результаты их взаимодействия. Графически эту модель можно изобразить в виде «ветвей дерева», которые будут показывать различные варианты развития событий в зависимости от произошедшего выбора. Это похоже на алгоритм тестирования с результатом «да» или «нет». Положительным аспектом такого подхода является его системность, но сфера применения имеет много ограничений.

Дерево решений

Логистическая регрессия

Статистический метод, который не так давно стал использоваться в машинном обучении. Логистическая функция определяет связь между одной или несколькими переменными. Субъекты делятся на две категории на основе определенных значений от 0 до 1.

С помощью методов логистической регрессии можно определять кредитоспособность, прогнозировать успех продаж, итоги рекламных кампаний и других случайных событий.

Логистическая регрессия

Опорные векторы

Система включает в себя несколько алгоритмов классификации объектов на гиперплоскости, разделяемой векторами. Задача системы — найти наиболее правильное расположение линий на плоскости для лучшей классификации.

Этот способ позволяет решать очень сложные задачи, например, определять, кто на фотографии - мужчина или женщина, или какой тип рекламы отображается пользователю на сайте.

Опорные векторы

Линейная регрессия

Смысл этого метода заключается в том, чтобы соотнести переменную N с другой переменной или переменными. Традиционно точки данных располагаются на плоскости, и для их соединения необходимо найти оптимальную прямую линию.

Линейная регрессия

Этот алгоритм позволяет легко предсказывать тенденции и выявлять недостающую информацию в простых линейных рядах. Например, он может продолжить ряд 10, 20, 30, 40, 50…

Ассамблейные методы

Это серия методов, которые создают различные классификаторы и разделяют данные путём усреднения или голосования. Эта техника снижает вероятность ошибки.

Ассамблеи бывают:

Бэггинг — параллельное обучение базовой модели со сложным набором классификаторов.

Ассамблейные методы: Бэггинг

Бустинг — создание сильной модели с помощью слабых моделей. Каждый последующий классификатор обучается на опыте предыдущих для улучшения и исправления ошибок.

Ассамблейные методы: бустинг

Кластеризация K-средних

Один из методов кластеризации в машинном обучении. Алгоритм использует несколько случайных K-кластеров. Каждый кластер имеет центр (точку), от которого вычисляется расстояние до каждой точки данных в кластере. Затем центр кластера уточняется, и точки снова сортируются на кластеры. Это делается до того момента, пока система не станет стабильной и перестанет претерпевать какие-либо изменения.

Кластеризация полезна для биологических исследований, информационных технологий и в социологии.

Кластеризация K-средних

Состязательно-генеративное обучение

Этот метод основан на работе нейронных сетей, которые как бы конкурируют друг с другом (отсюда и название). Внутри нейронной сети есть дискриминационный алгоритм и генеративный алгоритм. Первый классифицирует входные данные и пытается отнести их к определённой категории. Второй алгоритм, наоборот, пытается выбрать изображения, соответствующие категории. Другими словами, генератор создаёт объекты, а дискриминатор проверяет их подлинность. Именно с помощью этого метода нейронка смогла создать изображение несуществующего человека так, чтобы оно походило на реальное.

Состязательно-генеративное обучение

Заключение

Машинное обучение — это вид искусственного интеллекта, который имитирует деятельность человеческого мозга. Самые ранние алгоритмы машинного обучения появились в 1940-1950-х годах, в XXI веке они получили значительное развитие и теперь используются во многих областях человеческой жизни.

* продукт компании Meta, запрещённой на территории РФ

Подписывайтесь на наш Telegram-канал. Там вы найдёте самые интересные тренды и новости в сфере digital-маркетинга и технологий. Подписывайтесь и будьте в теме вместе с нами!

Упомянутый сервис

Altcraft Platform Российская омниканальная платформа для автоматизации коммуникаций и маркетинга
Российская омниканальная платформа для автоматизации коммуникаций и маркетинга

1 комментарий

Добавить комментарий

Больше интересного

Актуальное

Как сократить расходы в бизнесе?
Программы-вымогатели принесли их операторам рекордные 450 миллионов долларов в первой половине 2024 года
В Zoom представили онлайн-мероприятия с аудиторией до 1 миллиона участников
Ещё…