Нейросети простыми словами

Хорошо, когда данные можно описать понятными для алгоритма параметрами, но это не всегда возможно. Например, как в случае с голосом, изображением и текстом. К ним применяют иные методы, которые называются искусственными нейронными сетями. Обучившись на массиве предварительных данных, они обретают способность самостоятельно подбирать для себя признаки правильного ответа. Например, «посмотрев» на десятки тысяч картинок зданий, людей, природные ландшафты, нейросеть учится опознавать их на изображениях.

Происходит это так. Математические функции, получившие название нейронов, принимают информацию на вход, обрабатывают ее и передают дальше – другим нейронам или группам нейронов. Первые нейроны «смотрят» на фотоизображение и распознают лишь примитивные фигуры – наклоненные прямые, углы. Затем обработанная информация о примитивах поступает на вход следующего слоя нейронов, а затем еще одного, и еще одного, и так нейронная сеть делает последовательность выводов о том, что было ей показано на входе. Наклоненные прямые и углы на одном из следующих слоев превращаются в глаз, потом в лицо и в финале – в человека. Но нейронная сеть, будучи компьютерной программой, очевидно, не имеет никакого понятия о глазах, лицах и людях, для нее значительная часть признаков будет чем-то, что, в свою очередь, человек не сможет интерпретировать.

Разработчикам предстоит объяснять ей их с помощью заранее известных пар изображений и правильных ответов. Изначально все нейроны заполняются случайными коэффициентами, и им поступает на вход первая картинка. Итог сперва неверный. Но за счет того, что у нейросети есть правильный ответ и алгоритм обучения умеет варьировать коэффициенты в нейронах (которые, как мы помним, являются не более чем математическими функциями), за счет многократной обратной связи на каждом из слоев нейросеть учится распознаванию.

Сегодня существует несколько десятков нейросетей различной архитектуры. Они различаются по количеству и порядку слоев и взаимодействию нейронов, которые используются для разных задач. При анализе изображений используются так называемые сверточные нейросети: на каждом слое изображение уменьшается и в итоге последние слои видят его целиком. В процессе обучения нейронная сеть с помощью подбора значений своих параметров пытается сформировать уникальное представление лица каждого человека, на которое не должны влиять ориентация его головы в пространстве, наличие или отсутствие бороды или макияжа, факторы освещения, возрастные изменения.

Для распознавания текста используются рекуррентные сети, способные возвращаться на предыдущий слой. Значение слова зависит от контекста. Такие же сети преобразовывают речь в текст – они должны запоминать, какие звуки были распознаны раньше, чтобы сложить их в слова. Для распознавания речи нейросеть должна обучиться на сотне часов разных дикторов, чтобы учитывать варианты произнесения одних и тех же звуков разными людьми и в разных условиях. Звук разбивается на кусочки по 10–20 миллисекунд, для каждого из которых составляется гипотеза, что это может быть за звук. Чем дольше фрагмент распознаваемой записи, тем больше вероятность учесть не только связи между звуками в слове, но и грамматические связи в предложении, тематику и стиль речи.

А вот синтез речи проще, поскольку на вход подаются «идеальные» данные без помех. Хотя задача в целом похожа – нейросеть должна подобрать лучшие сочетания звуков (фонем) между собой, чтобы речь была плавной. Похожим образом работает синтез музыкальных произведений: нейросеть обучается на примерах гармоничного звучания и различных стилях музыки, после чего может синтезировать мелодии в стиле Баха или Чайковского.

Для текстовой аналитики может использоваться несколько нейросетей. Например, в огромном количестве документов нужно выявить контракты, которые могут повлечь риски для компании. Одна сеть будет извлекать из текстов сущности, другая – связи между ними, третья – находить взаимосвязи, которые будут определять, какие из них несут риски для компании. Эти нейросети могут работать последовательно или параллельно, результаты работы одной сети могут становиться входными данными для другой, чтобы улучшать результат обучения.

Данные для нейросетей

Одной из причин бурного развития нейросетей и машинного обучения связано с появлением в свободном доступе огромного количества цифровых данных, доступных для обработки. Большие данные необходимы для обучения нейронных сетей – эту взаимосвязь можно сравнить с двигателем и топливом.

Рынок данных начал развиваться именно в интернете, где все данные изначально были цифровыми, но сейчас реальный взлет этого сектора завершился: интернет-данные собраны, и никто не собирается ими делиться. Но в других отраслях (промышленность, предсказательное техобслуживание, медицина, налоговая и бухгалтерская сфера) данные еще оцифровываются, и именно в них прогнозируются прорывы.

Основной эффект от применения этих технологий состоит в том, что процессы становятся быстрее, качественнее и дешевле и клиент сразу замечает эти улучшения.

Искусственный интеллект без нейросетей

Компьютеры работают по алгоритмам, которые пишет человек, но если их писать слишком сложно, то можно дать компьютеру правильные и неправильные ответы, чтобы он сам написал алгоритм, который и решит задачу.

В самом простом смысле это подбор параметров формулы, дающей правильный ответ на заданный вопрос. Допустим, риэлтор хочет знать цену квартиры. Если отталкиваться лишь от площади и расстояния до метро, то вероятность ошибки велика, поскольку на самом деле факторов гораздо больше: этаж, наличие лифта, ремонт, парк поблизости. Рассчитать влияние каждого из них риэлтору не под силу, и тут возникает программист, вооруженный методами машинного обучения. Он задает алгоритму интересующие его признаки и примеры объявлений о продаже квартир. Алгоритм сам подбирает «вес» каждого из заданных параметров так, чтобы итоговая формула расчета учитывала их и с минимальной ошибкой определяла цену квартиры. А точность важна. Хотя отдельный человек вполне может ее не чувствовать, повышение даже на 1% существенно для низкомаржинального бизнеса, где прибыль не превышает нескольких процентов.

Это самый популярный метод машинного обучения в мире и он применяется намного чаще раскрученных в прессе нейросетей. Его применяют и в поисковых алгоритмах «Яндекса», и в кредитном скоринге в банках. Алгоритмы машинного обучения – подвид искусственного интеллекта.

Источник (по материалам)

Data Scientist # 1

Машинное обучение, большие данные, наука о данных, анализ данных, цифровой маркетинг, искусственный интеллект, нейронные сети, глубокое обучение, data science, data scientist, machine learning, artificial intelligence, big data, deep learning

Данные — новый актив!

Эффективно управлять можно только тем, что можно измерить.
Copyright © 2016-2021 Data Scientist. Все права защищены.