Обсуждение статьи "Нейросети в трейдинге: Обучение глубоких спайкинговых моделей (SEW-ResNet)"

 

Опубликована статья Нейросети в трейдинге: Обучение глубоких спайкинговых моделей (SEW-ResNet):

Приглашаем к знакомству с фреймворком SEW-ResNet, который позволяет строить глубокие спайковые модели без проблем деградации и с эффективным управлением градиентами. В этой статье мы демонстрируем, как реализовать базовый спайковый нейрон и его алгоритмы средствами MQL5.

Однако, несмотря на впечатляющую биологическую правдоподобность и новые перспективы, спайковые модели всё ещё уступали классическим нейронным сетям в ряде практических задач. Особенно это проявлялось на сложных наборах данных, где требовалась высокая точность и глубина анализа. В какой-то момент стало очевидно, что путь к прогрессу лежит через интеграцию идей глубокого обучения в архитектуру спайковых моделей. Так появились первые попытки адаптировать ResNet в спайковом формате. Концепция Spiking ResNet казалась многообещающей — перенести остаточные блоки из классической архитектуры и заменить функции активации на спайковые нейроны. Такой подход давал возможность использовать проверенный временем принцип глубины и остаточных связей в новом, событийном контексте.

Результаты оказались неоднозначными. С одной стороны, модели, конвертированные из классических нейронных сетей, демонстрировали выдающуюся точность и задавали высокий уровень для других решений. С другой — при прямом обучении Spiking ResNet вскрылись проблемы: деградация качества при увеличении глубины, исчезающие и взрывающиеся градиенты, трудности с реализацией корректного тождественного отображения. Всё это делало задачу построения по-настоящему глубоких и устойчивых спайковых моделей нерешённой.

На этом фоне появление фреймворка SEW-ResNet, представленного в работе "Deep Residual Learning in Spiking Neural Networks", стало значительным шагом вперёд. Основная идея заключалась в том, чтобы по-новому взглянуть на механизм остаточного обучения применительно к спайковым архитектурам. Авторы фреймворка предложили Spike-Element-Wise подход, позволяющий естественным образом реализовать тождественное отображение и одновременно избежать ключевых проблем с градиентами. Практическая проверка подтвердила правильность концепции. SEW-ResNet показал не только более высокую точность, но и способность масштабироваться с ростом глубины модели, чего раньше достичь не удавалось. Более того, впервые удалось построить спайковую сеть с глубиной свыше 100 слоёв, которая сохраняла стабильность обучения и превосходила по результатам многие существующие решения.

Автор: Dmitriy Gizlyk