Методы и способы ML (машинного обучения)
Методы и способы ML (машинного обучения). Фото: из архива компании
Другими словами, machine learning — явление не временное. С каждым годом эта технология будет глубже и глубже проникать во все сферы человеческой жизни: научится прогнозированию, классификации и генерации объектов. О машинном обучении говорят настолько часто, что уже каждому человеку известно, в чём суть машинного обучения, как оно возникло, какие технологии и приёмы использует. Напомним основные моменты в данной статье.
Определение машинного обучения
Машинное обучение (Machine Learning, ML) — это ответвление в области искусственного интеллекта, которая повторяет мыслительный процесс человека. Не нужно прописывать чёткий алгоритм действий, как в программном обеспечении, ML постоянно «думает», почти как человеческий мозг, и способен сам находить наилучший выход из ситуации.
Техники машинного обучения схожи с прогнозированием на основе big data. Закономерности система находит с помощью нейронных сетей. Нейронная сеть — это тоже разновидность AL, которая работает на основе глубинного обучения.
Возможности машинного обучения нашли своё практическое применение для создания следующих сервисов:
- Рекомендации продуктов, услуг и контента на основе поведения пользователей. Например, таким образом работают онлайн-кинотеатры, рекомендуя фильмы и телешоу на основе просмотренного.
- Прогнозирование. Алгоритмы машинного обучения могут предсказывать будущее: наступление вероятных событий, объёмы продаж, даже заболевания на основе анамнеза у пациентов медицинских клиник. Многие сферы уже приняли на вооружение модели машинного обучения: с помощью них банки определяют кредитный потенциал заёмщиков и отсеивают неплатёжеспособных клиентов.
- Анализ. Модели машинного обучения могут распознавать людей и предметы на изображениях и видео. Они различают человеческую речь и могут анализировать тексты. Это облегчает рутинные процессы, упрощает человеческие задачи, обеспечивая при этом высокую безопасность данных. Как пример: распознавание номерных знаков автомобилей с камер видеонаблюдения.
Как работает машинное обучение
- Определите параметры отбора нужной информации при сборе. То, что поможет вычленить нужные данные из огромного массива данных.
- Подготовьте информацию для алгоритмов ML: снабдите их маркерами, по которым алгоритмы ML смогут распознавать нужные элементы. Это длительный процесс, поскольку маркировка сейчас выполняется экспертами вручную и редко автоматизируется.
- Проверьте данные и выявите закономерности. В ходе этого процесса находят и исправляют ошибки, чтобы не допустить их на следующий этап и получить более чистый результат.
- Выберите модель и обучите её. Алгоритмы начнут обрабатывать собранные данные и выдавать первые результаты.
- Произведите оценку полученных данных и результативность алгоритмов. На этом этапе снова проверяются результаты на возможные ошибки, они исправляются и алгоритм готовится для дальнейшей работы.
История возникновения Learning Machine
20-й век
Самые ранние упоминания о машинном обучении датируются серединой прошлого века. Исследователи Уолтер Питтс и Уоррен Мак-Каллок впервые успешно воспроизвели нейроны в 1943 году. Но дальше открытие развития не получило.
Более известен проект армии США в 1946 году, в котором с помощью программного обеспечения создавались таблицы корректировки цели и улучшения меткости стрельбы.
Расцвет ML пришёлся на 1950-е годы, когда Джозеф Вейцбаум, Фрэнк Розенблатт и Артур Сэмюэл создали программу Checkers-playing для игры в шашки. Примерно в то же время широкую известность получило изобретение Розенблатта — нейросетевая модель, имитирующая работу человеческого мозга (Mark I Perceptron).
В конце 1950-х мир увидел SNARC — нейронная сеть для решения комплексных задач, её изобрёл американский учёный Марвин Минский.
Определение «машинное обучение» было впервые озвучено на конференции в Дартмутском колледже в США в 1959 году.
Первый образец виртуального помощника был представлен в 1960-х годах. Прототип назвали ELIZA, она имитировала диалог с психотерапевтом и могла оказать профессиональную помощь пациентам. В то же десятилетие были изобретены алгоритмы, способные классифицировать и сортировать данные. В конце 60-х Бернард Уидроу и Себастьян Трун разработали алгоритм обратного распространения ошибки, что послужило мощным толчком в развитии нейронных сетей.
В 1980-х годах учёные вновь применили ML-технологию для игровой индустрии. На этот раз это были шахматы. Перспективные разработчики из Университета Карнеги-Меллон анонсировали ChipTest. На её основе в конце 1990-х годов был создан первый суперкомпьютер Deep Blue, который выиграл у блестящего шахматиста Гарри Каспарова шахматный матч. Этот поединок стал первым соревнованием между ML и человеком, которое подтвердило потенциал искусственного мозга.
21 век
В современную эпоху с увеличением мощности компьютеров и ростом объемов информации ML вышла на более высокий уровень развития: в 2000-х годах возникло понятие «глубокое обучение». В начале 2010-х годов были запущены новые проекты в области нейронных сетей, в игру вступили крупные игроки. В 2012 году компания Google представила алгоритм, который умеет распознавать котят на фотографиях и видео. Кроме того, Google запустила сервис аналитики и машинного обучения Google Prediction API.
Такие гиганты, как Amazon, Microsoft и Facebook*, последовали этому примеру, запустив собственные платформы, которые работают на основании принципов машинного обучения. А разработка DeepFace Марка Цукерберга способна с высокой точностью распознавать лица.
В настоящее время машинное обучение наращивает свою роль во всех отраслях жизни. Технология уже используется в финансах, здравоохранении, промышленности и транспорте и будет все больше проникать в обычную жизнь людей.
Способы и методы машинного обучения
Способы машинного обучения представлены на картинке ниже:
Байесовский классификатор
Происходит от теоремы Байеса. Байесовский классификатор определяет класс объекта на основе его признаков. Его называют одним из простейших классификаторов и он может использоваться для идентификации объектов на изображениях или, например, выявления спама.
Дерево решений
В этом подходе модель определяет взаимосвязь между событиями и результаты их взаимодействия. Графически эту модель можно изобразить в виде «ветвей дерева», которые будут показывать различные варианты развития событий в зависимости от произошедшего выбора. Это похоже на алгоритм тестирования с результатом «да» или «нет». Положительным аспектом такого подхода является его системность, но сфера применения имеет много ограничений.
Логистическая регрессия
Статистический метод, который не так давно стал использоваться в машинном обучении. Логистическая функция определяет связь между одной или несколькими переменными. Субъекты делятся на две категории на основе определенных значений от 0 до 1.
С помощью методов логистической регрессии можно определять кредитоспособность, прогнозировать успех продаж, итоги рекламных кампаний и других случайных событий.
Опорные векторы
Система включает в себя несколько алгоритмов классификации объектов на гиперплоскости, разделяемой векторами. Задача системы — найти наиболее правильное расположение линий на плоскости для лучшей классификации.
Этот способ позволяет решать очень сложные задачи, например, определять, кто на фотографии - мужчина или женщина, или какой тип рекламы отображается пользователю на сайте.
Линейная регрессия
Смысл этого метода заключается в том, чтобы соотнести переменную N с другой переменной или переменными. Традиционно точки данных располагаются на плоскости, и для их соединения необходимо найти оптимальную прямую линию.
Этот алгоритм позволяет легко предсказывать тенденции и выявлять недостающую информацию в простых линейных рядах. Например, он может продолжить ряд 10, 20, 30, 40, 50…
Ассамблейные методы
Это серия методов, которые создают различные классификаторы и разделяют данные путём усреднения или голосования. Эта техника снижает вероятность ошибки.
Ассамблеи бывают:
Бэггинг — параллельное обучение базовой модели со сложным набором классификаторов.
Бустинг — создание сильной модели с помощью слабых моделей. Каждый последующий классификатор обучается на опыте предыдущих для улучшения и исправления ошибок.
Кластеризация K-средних
Один из методов кластеризации в машинном обучении. Алгоритм использует несколько случайных K-кластеров. Каждый кластер имеет центр (точку), от которого вычисляется расстояние до каждой точки данных в кластере. Затем центр кластера уточняется, и точки снова сортируются на кластеры. Это делается до того момента, пока система не станет стабильной и перестанет претерпевать какие-либо изменения.
Кластеризация полезна для биологических исследований, информационных технологий и в социологии.
Состязательно-генеративное обучение
Этот метод основан на работе нейронных сетей, которые как бы конкурируют друг с другом (отсюда и название). Внутри нейронной сети есть дискриминационный алгоритм и генеративный алгоритм. Первый классифицирует входные данные и пытается отнести их к определённой категории. Второй алгоритм, наоборот, пытается выбрать изображения, соответствующие категории. Другими словами, генератор создаёт объекты, а дискриминатор проверяет их подлинность. Именно с помощью этого метода нейронка смогла создать изображение несуществующего человека так, чтобы оно походило на реальное.
Заключение
Машинное обучение — это вид искусственного интеллекта, который имитирует деятельность человеческого мозга. Самые ранние алгоритмы машинного обучения появились в 1940-1950-х годах, в XXI веке они получили значительное развитие и теперь используются во многих областях человеческой жизни.
* продукт компании Meta, запрещённой на территории РФ
Подписывайтесь на наш Telegram-канал. Там вы найдёте самые интересные тренды и новости в сфере digital-маркетинга и технологий. Подписывайтесь и будьте в теме вместе с нами!
1 комментарий
Можно сказать, что Machine Learning уже стал как часть нашей повседневной жизни. С развитием ML можно ожидать, что эти методы станут ещё более точными и востребованными, т.к. находят применение в самых неожиданных сферах. Информация подана доступно, что особенно важно для тех, кто только начинает знакомство с этой темой.
Добавить комментарий