Рыночный этикет или правила хорошего тона на минном поле - страница 11

 
Neutron >>:

Всё так.

Но, на входе каждого персептрона имеется отдельный дополнительный вход для постоянного смещения +1. Это ускоряет обучение и увеличивает мощность Сети.

Или, если входной слой не считать, то с учетом всего сказнного:



Если есть ошибки поправьте пожалуйста.

 
Neutron >>:

Всё так.

Но, на входе каждого персептрона имеется отдельный дополнительный вход для постоянного смещения +1. Это ускоряет обучение и увеличивает мощность Сети.

Это типа рюшка, которая заменяет порог нейрона без увеличения количества настраиваемых параметров? Прикольно, первый раз вижу, но мне нравиццо :)

 

А где постоянное смещение на входе каждого нейрона?

paralocus писал(а) >>

Насколько мне удалось вас понять, на рисунке изображена оптимальная архитектура НС для рынка.

Это я так считаю. Возможно, это не соответствует действительности. Но результаты численных экспериментов подтверждают это утверждение.

Число входов - 12, а число синапсов 4 значит по формуле Popt=k*w*w/d получаем 144/4 = 36... это что 36 баров что ли? Или 36 ближайших ситуаций покупка/продажа? Все ли я правильно понял?

Считаем внимательно: Число Всех синапсов в вашей архитектуре: w=12+4=16

Число входов: d=3 (не 4*3, а только 3).

Оптимальная длина обучающей выборки: Popt=k*w*w/d =4*16*16/3=340 отсчётов по каждому временному ряду (их у вас 4, на каждом входном нейроне). Это могут бары или значения индикаторов, а могут быть трансакционные отсчёты и вам решать, что лучше для повышения предсказуемости... Помните, что предсказуемость входит в показатель нормы прибыли МТС в 4 степени! Очень сильная зависимость (см. данный топик вначале).

 
paralocus писал(а) >>

Или, если входной слой не считать, то с учетом всего сказнного:

Если есть ошибки поправьте пожалуйста.

Не понял!

Зачем вы не считаете входной слой? Он что, не принимает участие в обучении и не прогнозирует?

Оптимальнее всего два слоя - скрытый (он же входной) и выходной. При такой архитектуре, у вас w=4*4+5=21, d=4 и Р=4*21*21/4=440 отсчётов.

 
TheXpert писал(а) >>

Это типа рюшка, которая заменяет порог нейрона без увеличения количества настраиваемых параметров?

FION писал(а) >>

Понятно. Постоянное смещение просто немного смещает точку активации на кривой гипертангенса .

В общем правильно, но если быть точным, то при поступлении очередной партии данных на вход НС, мы подразумеваем их не центрированость (МО!=0). Вот, для этого и вводится дополнительный постоянный вход на каждом нейроне. В процессе обучения, конкретный нейрон так подбирает значение веса на этом входе, что бы он компенцировал возможное смещение входных его данных. Это позволяет статистически более быстро (из центра воображаемого облака) обучаться.

 
Neutron >>:

А где постоянное смещение на входе каждого нейрона?

Это я так считаю. Возможно, это не соответствует действительности. Но результаты численных экспериментов подтверждают это утверждение.

Считаем внимательно: Число Всех синапсов в вашей архитектуре: w=12+4=16

Число входов: d=3 (не 4*3, а только 3).

Оптимальная длина обучающей выборки: Popt=k*w*w/d =4*16*16/3=340 отсчётов по каждому временному ряду (их у вас 4, на каждом входном нейроне). Это могут бары или значения индикаторов, а могут быть трансакционные отсчёты и вам решать, что лучше для повышения предсказуемости... Помните, что предсказуемость входит в показатель нормы прибыли МТС в 4 степени! Очень сильная зависимость (см. данный топик вначале).

Popt=k*w*w/d, где k - безразмерная константа порядка 1 и учитывает факт изменчивости рынка.

Тогда в этой формуле d это число входов одного нейрона скрытого слоя, а k это число нейронов в скрытом слое? Извините, мне почему-то трудно поверить, что сеть может обучиться на 340 барах. Это ведь очень мало... Скорее всего я чего-то не понял.

До сих пор я был знаком только с простейшим перцептроном, котоый "обучается" в тестере терминала МТ4 генетическим алгоритмом. Так там требуется прогнать хоть сколько-нибудь значимую(2 - 3 месяца) историю. Я конечно понимаю, что на самом деле генетик ничему не обучает перцептрон, просто подбирает ему наиболее подходящие коэффициенты и работает с очень малой эффективностью, т.к. действует вслепую. Ну, да ладно. Это было лирическое отступление.


Правильно ли я понял, что единичные входы тоже должны иметь свои весовые коэффициенты? И как можно "выбелить" входы? То есть допустим, что у меня на входе нормализованный гипертангенсом RSI матожидание которого аж 0,21. Если я сделаю так: f(t) = th(RSI(i)*kf), где kf > 1 это специально подобранный коэффициент, выравнивающий плотность вероятности ценой некоторого искажения входного сигнала, то это будет нормально или нет?

Что такое трансакционные отсчеты?

 
Neutron >>:


Кстати, всем интересующимся: стратегия - "фиксировать убытки и давать расти прибыли" или "фиксировать прибыль и давать расти убыткам" (в зависимочти от того, трендовый рынок или флетовый, на выбранном торговом горизонте) - не является оптимальной, при реинвестировании капитала. В этом случае, выгоднее фиксироваться на каждом шаге с реинвестированием! Т.е., если у нас 10 непрерывных профитных трансакций, то выгоднее на каждой отдать комиссию ДЦ и реинвестировать, чем удерживать одну позицию всё это время и экономить на спреде.

Вот такой парадокс, от которого недалеко до бернуллизации трансакций, а после этого - к эффективному использовонию основного уравнения торговли в аналитическом виде (в отличии от Винса) без всяких заморлчек с параметризацией.

Это не то что бы парадокс, просто свойство ММ с реинвестированием. Эффективность этого ММ зависит от количества сделок, в числе прочего. Доходность этого ММ - это среднее геометрическое в степени количества сделок. При малом количестве сделок проигрывает по доходности простому ММ, но если удастся выжить на большом количестве сделок (играть долго) то и доход может быть больше. Но как всегда, ничего за просто так не даётся. Расплачиваться придется ассиметричностью плеча, и его следствием, - продолжительным периодом низких доходов, по сравнению с обычным ММ.

 
paralocus писал(а) >>

Popt=k*w*w/d, где k - безразмерная константа порядка 1 и учитывает факт изменчивости рынка.

Тогда в этой формуле d это число входов одного нейрона скрытого слоя, а k это число нейронов в скрытом слое? Извините, мне почему-то трудно поверить, что сеть может обучиться на 340 барах. Это ведь очень мало... Скорее всего я чего-то не понял.

До сих пор я был знаком только с простейшим перцептроном, котоый "обучается" в тестере терминала МТ4 генетическим алгоритмом. Так там требуется прогнать хоть сколько-нибудь значимую(2 - 3 месяца) историю. Я конечно понимаю, что на самом деле генетик ничему не обучает перцептрон, просто подбирает ему наиболее подходящие коэффициенты и работает с очень малой эффективностью, т.к. действует вслепую. Ну, да ладно. Это было лирическое отступление.

Правильно ли я понял, что единичные входы тоже должны иметь свои весовые коэффициенты? И как можно "выбелить" входы? То есть допустим, что у меня на входе нормализованный гипертангенсом RSI матожидание которого аж 0,21. Если я сделаю так: f(t) = th(RSI(i)*kf), где kf > 1 это специально подобранный коэффициент, выравнивающий плотность вероятности ценой некоторого искажения входного сигнала, то это будет нормально или нет?

Что такое трансакционные отсчеты?

paralocus, вы боитесь ошибиться? Бросте! - Попробуйте так и этак, и посмотрите результат - всё встанет на свои места.

k это не число входов нейрона, а эмпирическая характеристика Рынка - его изменчивости и подбирается в диапазоне от 2 до 4. Если бы рынок был бы стационарен, то k можно было бы брать и 10 и 20, что означало бы выход на асимптотику по процессу обучения Сети. К сожалению, Рынок можно назвать стационарным только в своей нестационарности поэтому, коэффициент необходимо брать минимально возможным по процессу переобучения НС. Отсюда и получается озвученый выше диапазон для k.

Ваш генетик, это разновидность стохастического метода обучения с элементами градиентного спуска (если не путаю). Вещь не плохая, но проигрывает по скорости обучения ОРО. Откажитесь от генетика в пользу обратного распространения ошибки - обучение будет эффективнее и нет ограничения на число входов и синапсов Сети.

Единичные входы имеют свои коэффициенты, которые обучаются в штатном режиме и не отличаются по свойствам от других входов.

Выбеливание входов, это устранение корреляционных зависимостей между ними. Что бы использовать эту процедуру, сначала убедите себя в наличии этой самой корреляции.

Трансакция, это акт покупки-продажи актива на рынке, т.е. сделка, взятка (не в криминальном смысле:-)

 
Neutron >>:

Откажитесь от генетика в пользу обратного распространения ошибки - обучение будет эффективнее и нет ограничения на число входов и синапсов Сети.


Все, отказался. Сел писать сетку с ОРО. Возможно по самому ОРО воникнут какие-то вопросы.

 
paralocus писал(а) >>

Возможно по самому ОРО воникнут какие-то вопросы.

Не вопрос!

Кстати, разберём внимательно архитектуру вашей Сети.

Вы имеете комитет трёх независимых двуслойных сетей обьединённых выходным нейроном (поэтому комитет). Каждая Сетка вашего комитета содержит всего один нейрон на входе, это не правильно, т.к. такая архитектура не отличается по вычислительной мощности от однослойного персептрона. Именно по этому, у вас число входов три (4 с учётом смещения) а не 12. Ещё раз: вы создали аналог совета директоров, где председатель общим голосованием (выходной нейрон) выбирает "правильный" ответ, а каждый из голосуещих представлен всего одним-единственным нейроном. Такая архитектура не даст преимущества в торговле. Правильно, обеспечить хотя бы по два нейрона на входе каждого члена комитета, это позволит в полной мере эксплуатировать свойство нелинйности ФА и заметно увеличит предсказательную мощность комитета.

Видите, как много общего между ИИ и нами... По сути, голосование на комсомольском собрании, ни что иное, как оптимальная схема поведения коллектива с точки зрения наибыстрейшего достижения поставленой цели при минимуме затрат!

Заметьте, на выходе комитета нет нелинейной функции активации, это просто сумматор и его функция - принятие решения по результатам голосования. Таким образом, эта архитектура наиболее близка к вашей идеи и является комитетом двуслойных нелинейных сетей с одним скрытым слоем. Число нейронов в скрытом слое можно наращивать, увеличивая таким образом доставерность прогноза, но нужно помнить, что длина обучающей выборки при этом растёт квадратично и очень скоро наступает момент, когда эффективность наращивания падает и даже приводит к ухудшению прогнозных способностей Сети. По результатам моих численных экспериментов, оптимум не превышает 2-4 неронов в скрытом слое.

Для приведённой архитектуры, оптимальная длина обучающей выборки Р=1500 отсчётов.

P.S. Красиво получилось. Я про картинку. Получаю эстетическое наслаждение!

Причина обращения: