Обсуждается методика анализа финансовых данных и определение шума как не полезного сигнала

Alexey Burnakov 2012.10.12 13:52 #431

Ладно, не будем про СБ здесь.

Возвращаясь к моей теме, при помощи вычисления взаимной информации между котировками я смог таки получить положительные форвард тесты на некоторых финансовых рядах (DJI D1, кажется это был), но ручаться за то, что это было не случайно - не могу. И, на форексе, таких результатов получить не удалось.

Базовые типы нейронных слоёв Регуляризация Тестирование модели на новых

[Deleted] 2012.10.12 14:47 #432

alexeymosc:

Ладно, не будем про СБ здесь.

А жаль, вечер обещал быть интересным;)

Но, Вы хозяин ветки, Вам и решать.

DDFedor 2012.10.12 15:01 #433

Avals:

торгуешь тот же пробой экстремума. Модель подразумевает, что за экстремумами сработают стоп-лоссы, а так же и другие моментщики потключаться. Эти трейды будут полезными с т.з. модели, а все другие шумовыми. Нетолько те, что против открытой сделки, а открытые по иным мотивам, чем те что заложенны в модель. Если полезных очень мало по сравнению с шумовыми, то эффект будет пшик))) Для других моделей эти "шумовые" трейды могут быть полезными.

Шум - это то, что не учитывает конкретная модель. Абсолютного шума не существует, а м.б. недостаток информации у конкретного чела о процессах формирования цены. Кому не нравится слово шум, может называть это "неучтёнкой" к примеру))) Но по сути действовать она будет как и шум на фоне полезного сигнала в физике

З.Ы. это всё о "шумах" после входа в трейд. Аналогично и до входа в трейд.

Я бы предложил назвать "разменным ТФ". Существуют ситуации, когда ВСЕ "видят" "ведущий ТФ" и в едином порыве пользуются его плодами. Когда же наступают разногласия в обозначении "ведущего ТФ", тогда начинаются "метания" от одного "ведущего" к другому "ведущему" ТФ. Имею ввиду построение паттернов на различных ТФ различными "построителями". Так вот в этой ситуации любые другие "не ведущие" можно было бы определять как "разменные". Но ни как ни "шум" и "неучтёнка". Ассоциация - нарубили в лесу вязанку дров, остальное - неучтёнка. Вычерпнули ведро воды, остальное - шум. Выражение "мусор в ДНК" меня тоже не устраивает... Интересно, что при построении паттернов на "ведущем ТФ", на "разменных ТФ" ТАКЖЕ можно наблюдать паттерны, которые помогают "разменивать" паттерны на "ведущем ТФ". Вообще же главная задача, по-моему, это суметь выявить "ведущие" и "разменные" паттерны. Выявить в таких паттернах "общие участки" и именно эти "общие участки" и работать.

Инструкции Сверточные нейронные сети Два типа индикаторов: для

Alexey Burnakov 2012.10.12 19:23 #434

TheXpert:
А ведь в самом деле. Ну ведь отличная компания. Давайте об интересном. Но только не о шуме.

Да, уже пора. Очень хочется :)

Я, кстати, хочу съездить в ближайшие 2-3 месяца в Минск просто ради удовольствия. Можно пересечься.

[Deleted] 2012.10.12 20:27 #435

TheXpert:

Те кто имеет положительные результаты на СБ делятся на 3 категории -- шулеры, тупилы и халявщики.

Если у тебя зудит по поводу СБ, ты ошибся темой дружок.

Зудит у вас, когда поднимают такие темы, или зависть гложет, что не умеете, или что, не знаю. Просто там где темой не ошибаются- сами темы исчезают. Вам теоретюгам лишь бы к слову прицепиться всем понятно уже что имеется ввиду псевдо СБ, хотя что такое псевдо - вы тоже не сможете объяснить. Просто в природе идиального СБ нет, какого тогда вы своими теориями обзываете людей тупицами, хотя таковым являетесь больше вы, когда приписываете в расчетах абстрактный идиальный случайный процес к реальным условиям, в которых этой случайности в помине нет. Скрываете свою несостоятельность оскарблениями .

Типы данных и значения Инициализация MACD - Осцилляторы -

[Deleted] 2012.10.12 20:44 #436

Здравствуйте.

Что-то ветка заглохла, а было очень интересно. Попробую оживить.

Прошу сильно не пинать, выскажу мысли по теме и затронутым вопросам.

О шуме:

поскольку я технарь, то и рассуждаю как технарь.

В радиотехнике шум определяется по критерию полезности. Все, что полезно есть нужный сигнал, все, что не нужный сигнал - шум. Потому главная задача на этапе определения шума - определить критерий полезности (простите за тавтологию).

Примеры просты. Вы сидите на лекции и пытаетесь разобраться в излагаемом материале, рядом сидит сосед и слушает музыку. Он в наушниках, но музыка вам слышна и постоянно вас отвлекает, не дает сосредоточиться. Для вас она шум. Для соседа это полезный сигнал, а болтовня преподавателя - шум.

Теперь плавно переходим к критерию оценки шума. Для того, чтобы отделить его от полезного сигнала, достаточно, чтобы полезный сигнал превысил определенное значение, которое называется пороговым. Величина этой полезности определяется отношением сигнал\шум.

Для торговли полезно все, что выше спреда. (Во всяком случае в ДЦ на форе). Потому, критерием полезности является превышение значения текущей котировки над спредом относительно предыдущего тика. При входе в позицию спред с нас возьмут по-любому. Это и есть пороговое значение шума. Отсюда задача - войти в позицию так, чтобы на следующем тике был преодолен этот пороговый барьер.

Логично пойти дальше и рассмотреть горизонт инвестирования. Задача тогда сводится к следующему - на горизонте инвестирования получить:

задача минимум - безубыток

задача максимум - планируемую прибыль.

Все просто.

Теперь по теме топика.

Теория информации создавалась как приложение к теории передачи сигналов и у нас преподавалась как "статистическая теория связи". Потому я при прочтении ветки часто удивлялся - то ли я все забыл, то ли участники ветки не совсем понимают, чего же хотят откопать.

Статистическая теория связи описывает методы кодирования информации и распознавания этой информации на приемной стороне. Методы распознавания оптимизируются.

Решаются также совместные частные задачи - распознавание ошибок, коррекция ошибок, шифрование и дешифрование. Для коррекции и распознавания ошибок применяются различные коды - БХ (Блоха-Харкевича), Шеннона, БЧХ(Боуза_Чоудхури_Хоквингема) и еще много-много других. Думаю, с момента окончания мной вуза количество их выросло в геометрической прогрессии. Так вот, все коды строятся на свойстве ИЗБЫТОЧНОСТИ. И это главное в теории информации. Именно для описания избыточности и было введено понятие энтропии, которое эквивалентно количеству информации.

Что есть избыточность, понять очень легко. Слово "...усский" поймет каждый, хотя первая буква пропущена. Вообще, язык избыточен по самой своей сути, потому и легко восстановить исходное слово или фразу при искажениях.

Про алфавит.

Алфавит определяется информационными "паттернами", состящими из примитивов. В теории информации паттерны задаются автоматически. Например, двоичная система счисления - два примитива. Задаем алфавит длиной в 10 примитивов, итого наш алфавит состоит из 1к слов (2 в десятой степени).

Плавно переходим к рынку. Задача - создать алфавит. Значит нужны примитивы, они же паттерны. А значит, возникает закономерный вопрос - что принимаем к рассмотрению.

Цена?

О"кей. Как образовать алфавит для цены? Берем самый большой Размах по цене за всю историю инструмента и делим на минимально возможные отсчеты, т.е. пункты. Итого, имеем два примитива (0 и 1) и алфавит, количество знаков (состояний) в котором будет два в степени, равной =размах\количество пунктов.

Вводим корректировку - нет у нас тиковой истории, только минутки. Тогда ищем самую маленькую по размаху минутку, принимаем величину ее размаха за единицу и снова получаем алфавит.

Время?

Время необходимо учитывать исходя из понимания того, что у каждого трейдера есть горизонт инвестирования.

Нужно проводить анализ, исходя из этого горизонта, считая все, что не укладывается в этот горизонт шумом. Пусть мы хотим работать на часовках. Тогда необходимо скорректировать ценовой алфавит, исходя из величины минимальной часовой свечи за всю историю. За единицу времени необходимо взять величину интервала. Вопрос в том, как определить, сколько интервалов взять, ведь они будут определять "емкость временного алфавита". Решение предложили уважаемые многоточки - рассматривать интервалы, задаваемые экстремумами цены. Опять имеем два примитива (0-начало интервала, 1-конец интервала) и алфавит, заданный экстремумами цены (временные лаги).

Все.

Инструменты статистического анализа и Статьи по разработке торговых Инструкции, блоки кода и

[Deleted] 2012.10.12 20:57 #437

alexeymosc: Я, кстати, хочу съездить в ближайшие 2-3 месяца в Минск просто ради удовольствия. Можно пересечься.

Я уж отчаялся в Минске хоть одного разработчика увидеть, а они оказывается вот где прячутся :)

[Deleted] 2012.10.12 21:24 #438

VNG:

Кто ясно мыслит...;)

Спасибо Вам неведомый (или ведомый?) друг.

Sceptic Philozoff 2012.10.12 21:51 #439

VNG: Теория информации создавалась как приложение к теории передачи сигналов и у нас преподавалась как "статистическая теория связи". Потому я при прочтении ветки часто удивлялся - то ли я все забыл, то ли участники ветки не совсем понимают, чего же хотят откопать.

Давайте поговорим о первом посте топикстартера. Вы нашли там неизлечимые ошибки?

Про алфавит.

Алфавит определяется информационными "паттернами", состящими из примитивов. В теории информации паттерны задаются автоматически. Например, двоичная система счисления - два примитива. Задаем алфавит длиной в 10 примитивов, итого наш алфавит состоит из 1к слов (2 в десятой степени).

Плавно переходим к рынку. Задача - создать алфавит. Значит нужны примитивы, они же паттерны. А значит, возникает закономерный вопрос - что принимаем к рассмотрению.

Цена?

О"кей. Как образовать алфавит для цены? Берем самый большой Размах по цене за всю историю инструмента и делим на минимально возможные отсчеты, т.е. пункты. Итого, имеем два примитива (0 и 1) и алфавит, количество знаков (состояний) в котором будет два в степени, равной =размах\количество пунктов.

Вводим корректировку - нет у нас тиковой истории, только минутки. Тогда ищем самую маленькую по размаху минутку, принимаем величину ее размаха за единицу и снова получаем алфавит.

Во-первых, исследуются возвраты цены, а не сама цена. Вот такой объект исследования. Ищу дополнительные аргументы, чтобы показать, что цену так же исследовать не получится.

Во-вторых, это уже сделано: делим распределение возвратов на квантили (топикстартер сделал иначе). Каждый квантиль - это буква алфавита. Букв может быть от 2 до бесконечности, но больше 40 уже нецелесообразно, пожалуй.

Идентификаторы Сравнение строк Переменные и идентификаторы

Igor Makanu 2012.10.12 23:39 #440

VNG:

Логично пойти дальше и рассмотреть горизонт инвестирования. Задача тогда сводится к следующему - на горизонте инвестирования получить:

1.задача минимум - безубыток

2.задача максимум - планируемую прибыль.

Все просто.

1. получить торговую систему в которой ордер будет в безубытке, скажем, 7 из 10 раз не так сложно как кажется, в таких ТС график баланса имеет вид последовательно расположенных прямоугольных треугольников(заработали, заработали, заработали, слили все что заработали, заработали,..... ). Задача минимум это минимальные риски. Лучше рассматривать реальные "задачи минимум", четко заданные соотношения прибыль/убыток ---> тейкпрофит/стоплосс, иначе очередное исследование_сферического_коня_в_вакууме

2. прибыль это хорошо, но не встречал ТС в которых не бывает череды убытков, только прибыльные, так называемые "Граали" (Граальщиков видел, знаю, но у них не череда убытков, а сразу слив депозита )))) ). Я к тому, что задача максимум это уменьшение числа серии непрерывно убыточных сделок

Все совсем не просто, было бы просто - пенсионный фонд РФ зарабатывал бы на рынках, а не сливал бы (((

Отчет о тестировании - Торговый отчет - Для Как выбрать сигнал -

Статистика зависимостей в котировках (теория информации, корреляция и другие методы feature selection) - страница 44