Создаем новую сеть, которая обрабатывает закодированные данные. Обучение нейронной сети на неконтролируемых данных включает в себя изучение полезных - Общее обсуждение

MetaQuotes 2023.06.12 09:21 #511

Автоэнкодеры (DL 22)

Во многих сценариях глубокого обучения мы часто сталкиваемся с идеей обучения нейронной сети на одном наборе данных и использования скрытого слоя этой сети для кодирования данных, которые можно применить к другим задачам или наборам данных. Эта концепция известна как трансферное обучение. Например, в остаточных сетях предварительное обучение включает в себя изучение полезных методов обработки изображений, которые впоследствии можно применять к другим наборам данных. Отбрасывая выходные слои предварительно обученной модели и добавляя новые выходные слои для новой задачи, мы, по сути, создаем новую сеть, которая обрабатывает закодированные данные, созданные предварительно обученной моделью.

Вложения слов также служат цели кодирования данных, где цель состоит в том, чтобы изучить представление, которое фиксирует значимую информацию в скрытых слоях. Эта идея распространяется и на различные другие контексты. Одной из примечательных моделей, использующих эту концепцию, является автоэнкодер. Автоэнкодер обучается на неконтролируемых данных, где входные данные и выходные данные совпадают. Хотя решение этой проблемы регрессии с помощью линейной регрессии может показаться тривиальным, основная цель автоэнкодера — изучить более компактное представление в его скрытых слоях.

Постепенно уменьшая размер скрытых слоев, автоэнкодер заставляет сеть изучать сжатые представления входных данных. Если сеть может стабильно воспроизводить исходный ввод из этого сжатого представления, она эффективно обучается сжатию данных. Например, если у нас есть изображение 200x200 пикселей в качестве входных данных и мы уменьшаем его до скрытого слоя из 1000 нейронов, который затем может расширяться, чтобы воспроизвести близкое приближение к исходному изображению, мы достигаем коэффициента сжатия 20:1.

Однако использование нейронной сети исключительно для сжатия данных не особенно полезно, поскольку доступны более эффективные алгоритмы сжатия, не основанные на обучении. Вместо этого ценность автоэнкодера заключается в использовании либо первой половины сети для создания представления для передачи обучения в других задачах глубокого обучения, либо второй половины в качестве декодера для создания примеров данных из входного набора.

Первоначальное применение автоэнкодера для трансферного обучения было заметным на заре глубокого обучения. Однако с тех пор были разработаны лучшие подходы к передаче обучения. С другой стороны, использование части сети декодера для генерации образцов данных стало основой для многих других алгоритмов глубокого обучения.

Самый простой подход предполагает достижение максимально возможного сжатия за счет минимизации размера скрытого слоя. В этом сценарии любой разумный входной вектор, переданный декодеру, должен генерировать данные, напоминающие распределение входных данных. Однако определение оптимального размера скрытого слоя является сложной задачей. Он может быть либо слишком маленьким, что делает невозможным точное воспроизведение входных данных, либо слишком большим, что приводит к созданию нереалистичных данных, не похожих на исходный набор данных.

Чтобы решить эту проблему, мы можем изменить архитектуру, чтобы побудить автоэнкодер изучать представления, которые напоминают случайно выбранные векторы. Эта модификация приводит нас к вариационному автоэнкодеру. В вариационном автоэнкодере средний скрытый вектор заменяется двумя векторами, представляющими среднее значение и дисперсию. Процесс обучения включает генерацию случайного вектора с использованием нормального распределения, который затем объединяется со скрытыми векторами кодирования для создания входных данных для декодера. Кроме того, потеря для сети кодировщика включает в себя член расхождения, который способствует тому, чтобы среднее значение и дисперсия оставались близкими к нормальному распределению. Это помогает сгруппировать представления вокруг центра пространства, делая его более надежным для случайной выборки. Таким образом, вариационный автоэнкодер позволяет нам генерировать выборки, очень похожие на распределение данных, полученное сетью.

Таким образом, концепция использования скрытого слоя нейронной сети в качестве кодирования данных превратилась в возможность выборки из изученного распределения вероятностей. Это открывает двери для генеративных состязательных сетей и генерации разнообразных и интересных данных.

Python для алготрейдинга Нейронные сети Quantitative trading

MetaQuotes 2023.06.12 09:22 #512

Генеративно-состязательные сети (DL 23)

Генеративно-состязательные сети (DL 23)

В прошлой лекции мы рассмотрели вариационные автоэнкодеры, которые представляют собой тип подхода к генеративному моделированию. Основная цель автоэнкодера — узнать скрытые переменные, которые можно использовать для выборки из генеративного распределения. Другой способ генерировать выборки из распределения — использовать вычислительные генераторы случайных чисел .

При использовании случайной библиотеки в программировании выборки из случайных распределений генерируются на основе последовательности случайных или псевдослучайных битов. Генератор случайных чисел выполняет вычисления для преобразования этой последовательности битов в выборки из другого распределения. Многие дистрибутивы построены поверх однородных дистрибутивов в этих генераторах.

Этот альтернативный подход к генеративному моделированию включает в себя обучение нейронной сети генератора. Генератор принимает случайный шум в качестве входных данных и преобразует его в случайную выборку из распределения данных. Например, если набор данных состоит из изображений щенков, цель состоит в том, чтобы обучить нейронную сеть генерировать случайные изображения щенков при любом входном шуме.

Для обучения сети генератора используется дополнительная нейронная сеть, называемая дискриминатором. Дискриминатор принимает входные данные либо из реальных обучающих данных, либо из выходных данных генераторной сети и определяет, являются ли входные данные реальными или поддельными. Сеть генератора предназначена для создания выборок, которые могут обмануть дискриминатор, в то время как дискриминатор стремится отличать реальные данные от поддельных. Это создает враждебные отношения между двумя сетями.

Процесс обучения включает в себя сначала обучение дискриминатора, что позволяет ему изучить распределение реальных данных. Затем генератор обучается производить выходные данные, которые напоминают реальные данные и могут обмануть дискриминатор. Обучение чередуется между дискриминатором и генератором, чтобы улучшить их работу.

Функция потерь для генераторной сети может быть противоположна потерям дискриминатора или вообще отличаться от функции потерь. Градиенты могут передаваться обратно через дискриминатор в сеть генератора для обновления ее весов на основе функции потерь. Это позволяет генератору научиться улучшать свою целевую функцию.

Для сетей генератора и дискриминатора можно использовать различные функции потерь, особенно когда целью является создание выборок для определенных категорий в распределении данных. Генератор может быть обусловлен дополнительной информацией, такой как метки, для создания образцов, которые обманывают дискриминатор, заставляя его выводить определенные категории.

При обучении враждебных сетей необходимо учитывать возможные режимы отказа. Одним из видов отказа является то, что генераторная сеть просто производит выборки из реального распределения данных, что не минимизирует ее целевую функцию. Еще одной проблемой является переобучение, поскольку генератор может запоминать фактические данные вместо создания различных выборок.

Чтобы избежать переобучения, важно ограничить воздействие генератора на реальные данные и убедиться, что у него не слишком много возможностей для их запоминания. Реальный набор данных не вводится напрямую в сеть генератора. Генератор учится на реальных данных косвенно, когда они влияют на веса в сети дискриминатора, что затем влияет на потери, передаваемые обратно в генератор.

В случае успеха обученная сеть генераторов может генерировать образцы, которые напоминают реальные данные, но выходят за их рамки. Это может быть полезно для увеличения данных при обучении других нейронных сетей и в художественных целях. В лекции обсуждались примеры генеративно-состязательных сетей, используемых для аугментации искусства и данных.

Кроме того, обученные сети генераторов могут быть полезны в различных приложениях, помимо увеличения данных и искусства. Одним из таких приложений является создание синтетических данных для улучшения обучения нейронных сетей для решения других важных задач.

Используя сеть генератора, мы можем генерировать образцы данных, специально предназначенные для улучшения обучения нейронных сетей. Например, если у нас есть проблема классификации, когда классы несбалансированы, мы можем использовать генератор для создания дополнительных выборок для недопредставленного класса. Это может помочь сбалансировать набор данных и улучшить способность модели изучать класс меньшинства.

Кроме того, генеративно-состязательные сети могут генерировать образцы, которые исследуют пространство между различными категориями или комбинациями признаков. Например, если мы обеспечим генератор комбинацией признаков, таких как 0,5 собаки и 0,5 кошки, он может создать образец, который сочетает в себе характеристики как собак, так и кошек. Эта возможность интерполяции между различными категориями или функциями открывает возможности для творческих и новых результатов.

Генеративно-состязательные сети нашли применение в различных областях. В области компьютерного зрения они использовались для создания реалистичных изображений, улучшения качества изображения и даже создания глубоких подделок. При обработке естественного языка они использовались для создания реалистичного текста, перевода с одного языка на другой и даже для создания чат-ботов.

Важно отметить, что обучение генеративно-состязательных сетей может быть сложной задачей. Это требует тщательной настройки гиперпараметров, выбора соответствующих функций потерь и управления компромиссом между сетями генератора и дискриминатора. Кроме того, важными соображениями являются обеспечение стабильности обучения и предотвращение коллапса режима, когда генератор создает только ограниченный набор образцов.

Несмотря на эти проблемы, генеративно-состязательные сети продемонстрировали впечатляющие возможности в создании реалистичных и разнообразных образцов. Текущие исследования продолжают развивать эту область, изучая новые архитектуры, функции потерь и методы обучения для дальнейшего повышения производительности и надежности этих сетей.

В заключение, генеративно-состязательные сети предлагают мощную основу для генеративного моделирования. Обучая сеть генератора и дискриминатора состязательным образом, мы можем научиться генерировать выборки, которые напоминают реальное распределение данных. Это открывает захватывающие возможности для увеличения данных, творческих приложений и улучшения обучения различным задачам машинного обучения.

Python для алготрейдинга AI 2023. Встречайте ChatGPT. Quantitative trading

MetaQuotes 2023.06.12 09:23 #513

AlphaGo и AlphaGo Zero (DL 24)

AlphaGo и AlphaGo Zero (DL 24)

AlphaGo и AlphaGo Zero — два игровых агента, разработанных DeepMind, дочерней компанией Google. Эти системы сочетают в себе глубокие сверточные нейронные сети с обучением с подкреплением для самостоятельной игры, чтобы добиться значительных успехов в алгоритмах игры. В 2016 году AlphaGo стал первым ИИ, победившим чемпиона мира среди людей. В этом видео мы рассмотрим, как DeepMind создала эти системы, и обсудим основные результаты исследований, опубликованных как на AlphaGo, так и на AlphaGo Zero.

Го — это игра для двух игроков с простыми правилами: игроки по очереди размещают черные и белые камни на пустом перекрестке доски. Камни или группы камней, окруженные фигурами противника, захватываются и убираются с доски. Игра заканчивается, когда оба игрока спасуют, и счет определяется количеством камней и пустых перекрестков, окруженных.

Разработка алгоритма ИИ для движения требует планирования нескольких шагов вперед. Шахматные движки, такие как Deep Blue, достигли этого, рассматривая все возможные последовательности ходов и оценивая полученные позиции на доске. Однако оценка качества позиции на доске для го является более сложной задачей из-за сложности игры и более высокого фактора ветвления. Ограничение пространства поиска многообещающими ходами и определение качества позиции на доске были серьезными проблемами, которые AlphaGo решила с помощью глубокого обучения.

AlphaGo решила эти проблемы, обучив глубокие нейронные сети оценивать ценность и политику состояний доски. Сеть ценности предсказывает вероятность выигрыша из данного состояния, в то время как сеть политик оценивает качество хода. Эти модели управляют алгоритмом планирования, ограничивая внимание многообещающими ходами и предоставляя оценки качества.

Архитектура AlphaGo и AlphaGo Zero отличается. Первоначальная AlphaGo использовала отдельные сети политик и ценности, в то время как AlphaGo Zero использовала единую сеть с отдельными головками для политики и выходных ценностей. Обе архитектуры включают остаточные блоки для извлечения важной информации о состоянии платы. Обучающие данные для AlphaGo включали игры, в которые играли любители высокого уровня, в то время как AlphaGo Zero использовал данные исключительно из самостоятельной игры.

Обучить сеть создания стоимости относительно просто, используя представления состояния доски и метки выигрышей/проигрышей. Обучение сети политик является более сложным, так как требует прогнозирования качества перемещения. AlphaGo Zero улучшила это, обучив сеть политики на оценках качества перемещения, сгенерированных алгоритмом поиска во время развертывания. Со временем сеть политик научится оценивать качество перемещения на несколько шагов вперед.

И AlphaGo, и AlphaGo Zero используют поиск по дереву Монте-Карло (MCTS) в качестве алгоритма планирования. MCTS выполняет развертывание для сбора информации о значениях последовательности перемещений и неопределенности. Алгоритм поиска использует политику и сети ценности для оценки состояния доски и оценки качества ходов. Благодаря самообучению с подкреплением обе системы улучшают оценки качества своих сетей и становятся более сильными игроками в го.

В целом, разработка AlphaGo и AlphaGo Zero представляет собой важную веху в развитии искусственного интеллекта. Эти системы сочетают глубокое обучение с алгоритмами обучения с подкреплением и планирования для достижения выдающихся результатов и стратегической игры в игре го.

Quantitative trading Разговор с искусственным интеллектом AI 2023. Встречайте ChatGPT.

MetaQuotes 2023.06.12 09:24 #514

Расчетные графики (DL 25)

Расчетные графики (DL 25)

Эта лекция посвящена вычислительным графам, которые являются визуальным представлением потока данных и последовательности вычислений в программе. Хотя вычислительные графы обычно используются для понимания прямого и обратного распространения в нейронных сетях, их можно применять к любой программе. Делая неявные операции в нейронной сети явными, вычислительные графы обеспечивают более четкое понимание задействованных вычислений.

В вычислительном графе каждый узел представляет собой вычисление, такое как умножение весов на активации, суммирование взвешенных входных данных, вычисление функций активации или вычисление потерь. Связи между узлами представляют зависимости между переменными в программе. Зная, как получить производную от любого узла на графике, мы можем представить в нейронной сети шаги как прямого, так и обратного распространения.

Чтобы вычислить частные производные, необходимые для градиентного спуска в нейронной сети, мы распространяем производные обратно по сети, используя цепное правило. На каждом шаге мы умножаем производную текущей операции на производную предыдущего узла. Когда узел имеет несколько выходов, мы суммируем производные от каждого выхода.

Вычислительный граф позволяет нам вычислить выходные данные нейронной сети и вычислить частные производные потерь по каждому весу. Работая в обратном направлении через топологический вид графа и распространяя производные, мы можем определить частные производные для любого параметра в сети.

В лекции также представлены примеры вычислительных графиков, иллюстрирующие, как вычисляются промежуточные значения и производные. Разбивая функции на более мелкие вычисления и присваивая имена промежуточным значениям, мы можем вычислять как выходные данные функции, так и их частные производные, используя вычислительный граф.

Кроме того, вычислительные графы могут обрабатывать не только скалярные переменные, но и переменные, представляющие векторы, матрицы или тензоры. Используя переменные, соответствующие многомерным объектам, такие как векторы активации и весовые матрицы, мы можем применять вычислительные графы к плотно связанным нейронным сетям и другим сложным вычислениям.

Чтобы расширить вычислительный граф для плотносвязной нейронной сети, мы можем ввести переменные, соответствующие векторам активаций или матрицам весов. Назовем вектор активаций на всем этом слое сети как «a1», обозначаемый символом векторной шляпы (^). Точно так же мы можем представить веса в виде матрицы W1.

В этом расширенном графе входными данными для каждого узла слоя является скалярное произведение вектора активаций (a1) и соответствующей матрицы весов (W1). Мы можем представить эту операцию как умножение матриц: a1 * W1.

Кроме того, мы можем ввести вектор смещения (b1), связанный с каждым узлом в слое. Член смещения добавляется поэлементно к точечному произведению активаций и весов перед применением функции активации.

Затем мы применяем функцию активации (например, сигмовидную или ReLU) поэлементно к полученному вектору. Обозначим этот вектор как «a2» (с символом шляпы), представляющий активации следующего слоя.

Мы можем повторить этот процесс для последующих слоев нейронной сети, соединяя узлы ребрами и распространяя активации и веса по графу.

Чтобы вычислить прямой проход в этом расширенном вычислительном графе, мы должны начать с входных значений (таких как интенсивность пикселей для изображения) и распространить их вперед по графу, применяя матричные умножения, поэлементные сложения и функции активации в каждом узле. пока не получим окончательный результат.

Когда дело доходит до обратного распространения, цель состоит в том, чтобы вычислить частные производные функции потерь по отношению к каждому весу в сети. Расширяя вычислительный граф, мы можем отслеживать поток градиентов в обратном направлении по сети, что позволяет нам эффективно вычислять эти частные производные с помощью цепного правила.

Во время обратного распространения мы начинаем с производной функции потерь по отношению к конечному результату и используем цепное правило для распространения ее обратно по графу. В каждом узле мы умножаем входящую производную на производную соответствующей операции (функция активации, умножение матриц и т. д.) по своим входам.

Следуя этому процессу, мы можем вычислить градиенты для каждого веса в сети, что позволяет нам обновлять веса, используя алгоритмы оптимизации, такие как градиентный спуск и его варианты.

Таким образом, расширение вычислительного графа для представления плотно связанной нейронной сети позволяет нам визуализировать и вычислять шаги прямого и обратного распространения. Это позволяет эффективно вычислять градиенты и облегчает оптимизацию сети за счет обновлений весов.

Машинное обучение в трейдинге: OpenCL в трейдинге Python для алготрейдинга

MetaQuotes 2023.06.12 09:25 #515