Обсуждение статьи "Случайные леса предсказывают тренды" - страница 4

 
gpwr:

Модель и выбор предикторов взаимосвязаны. Сначала надо выбрать модель, а потом выбрать предикторы на основе этой модели путём отсеивания этой же моделью тех предикторов, которые имеют наименьшую "полезность" в предсказании. Хотя многие статьи iи учебники учат другому: сначала выбираем предикторы используя какой-то метод вычисления связи между этими предикторами и целевым рядом - выходом. Наиболее распространёнными методами отсеивания являются коэффициент корреляции между предикторами и выходом и взаимная информация. Потом выбирают модель обычно не связанную с тем как были выбраны предикторы. Если вдуматься (и это вам в учебниках по эконометрике не скажут, надо самому подумать), то метод выбора предикторов коэффициентом корелляцией с выходом по существу выбирает те предикторы, которые будут иметь наименьшую ошибку в линейной регриссионной моделе (МНК). Метод выбора предикторов по их взаимной информации с выходом по существу выбирает те предикторы, которые дадут наименьшую ошибку в моделе основанной на Nadaraya-Watson регрессии (заумное название GRNN).

Полностью согласен с Вами в отношении корреляции. влияние предикторов на целевую переменную не может быть установлено по корреляции и не устанавливается по регрессии. Это делает по другому. Наиболее популярным является индекс Gini, но мне удалось его использовать и использую собственные соображения и некоторую последовательность действий. пока удалось подобрать некоторый набор предикторов для предсказания трендов, найти набор предикторов для предсказания приращения цены мне не удалось.

Хочу обратить Ваше внимание мою книгу. Проблема предикторов гораздо более сложная, чем корреляция и индекс Gini. Книга многое проясняет. 

Файлы:
PredictTrend.zip  858 kb
 

faa1947:

Хочу обратить Ваше внимание мою книгу. Проблема предикторов гораздо более сложная, чем корреляция и индекс Gini. Книга многое проясняет.


Спасибо! Почитаю на досуге. Может быть прояснюсь?
 
faa1947:

Хочу обратить Ваше внимание мою книгу. Проблема предикторов гораздо более сложная, чем корреляция и индекс Gini. Книга многое проясняет. 

Книги там нет, есть реклама.

Раньше здесь было мало информации о сетях. Народ хотел изучить эти сети и попробовать в торговле. А сейчас появилось очень много книг и статей о сетях с пошаговыми инструкциями как их применять. Смотрю я на эти книги и статьи о сетях и они у меня не только желание читать отбивают, но даже вызывают какое-то отвращение к сетям. Проблема этих писанин в том что они даже не пытаются заинтересовать читателя: дескать читайте и пользуйтесь. А зачем время зря терять? Где приманка? Покажите в начале книги или статьи привлекательный результат торговли по методам изложенным в книге или статье и мы заинтересуемся в их прочтении и понимании. Вот смотрю я на новую статью о глубоких сетях и думаю ну кто её читать будет кроме пары спецов, которые уже знают о них? Я тоже уже знаю эти сети, а также знаю что они как и другие сети к торговле на рынке неприменимы. Это даже изобрататель этих сетей, Джефри Хинтон, признал уже давно. Послушайте его лекции на ютюбе.

 
gpwr:

Книги там нет, есть реклама.

Раньше здесь было мало информации о сетях. Народ хотел изучить эти сети и попробовать в торговле. А сейчас появилось очень много книг и статей о сетях с пошаговыми инструкциями как их применять. Смотрю я на эти книги и статьи о сетях и они у меня не только желание читать отбивают, но даже вызывают какое-то отвращение к сетям. Проблема этих писанин в том что они даже не пытаются заинтересовать читателя: дескать читайте и пользуйтесь. А зачем время зря терять? Где приманка? Покажите в начале книги или статьи привлекательный результат торговли по методам изложенным в книге или статье и мы заинтересуемся в их прочтении и понимании. Вот смотрю я на новую статью о глубоких сетях и думаю ну кто её читать будет кроме пары спецов, которые уже знают о них? Я тоже уже знаю эти сети, а также знаю что они как и другие сети к торговле на рынке неприменимы. Это даже изобрататель этих сетей, Джефри Хинтон, признал уже давно. Послушайте его лекции на ютюбе.

Обычное занятие треейдера при разработке ТС - это найти некоторую совокупность сигналов, которая предскажет  будущее, так называемый паттерн. Мы берем готовые индикаторы, покупаем, пишем сами, комбинируем их между собой ...

Я же утверждаю, что этой проблемы нет. Существуют алгоритмы, которые найдут все возможные паттерны для данной совокупности предикторов. в моей статье и книге - это около 200 паттернов. Ничего подобного традиционным способом найти невозможно.

Более того, освоив R, у меня нет проблемы поменять один алгоритм поиска паттернов, например, нейросети, на глубокие нейросети, а их еще на что-нибудь. Более того, нет необходимости вникать в то, что нашел алгоритм.

  А в чем проблема?

А в том, о чем Вы писали в своем посту выше: правильном подборе предикторов. Добавлю. Правильной предварительной обработке предикторов. Это умение. В результате чтения книг у Вас появится такое умение, так как Вы сами об этом задумались.

А моя книга? Это поверхностный обзор всей проблемы целиком, а не только конкретных алгоритмов поиска паттернов. При этом я Вам гарантирую один результат: вы будите свободно владеть несколько моделями на достаточном для трейдинге уровне, не очень в вникая  в эти модели, всякие там персептроны, слои, баггинги и бустинги - все это будет Вам не нужно. Вы сосредоточитесь на предикторах.

Совершенно другой подход. 

И хочу закончить напоминаем аксиомы статистики: "Мусор на входе - мусор на выходе". И никакая модель, никакой алгоритм не способен этого изменить.  Поэтому вместо дефиса надо поставить черный ящик с каким-либо названием и не заморачиваться им, а заниматься разгребанием мусора.

 
faa1947:

Обычное занятие треейдера при разработке ТС - это найти некоторую совокупность сигналов, которая предскажет на будущее, так называемый паттерн. Мы берем готовые индикаторы, покупаем, пишем сами, комбинируем их между собой ...

Я же утверждаю, что этой проблемы нет. Существуют алгоритмы, которые найдут все возможные паттерны для данной совокупности предикторов. в моей статье и книге - это около 200 паттернов. Ничего подобного традиционным способом найти невозможно.

Более того, освоив R, у меня нет проблемы поменять один алгоритм поиска паттернов, например, нейросети, на глубокие нейросети, а их еще на что-нибудь. Более того, нет необходимости вникать в то, что нашел алгоритм.

  А в чем проблема?

А в том, о чем Вы писали в своих посту выше: правильном подборе предикторов. Добавлю. Правильной предварительной обработке предикторов. Это умение. В результате чтения книг у Вас появится такое умение, так Вы сами об этом задумались.

А моя книга? Это поверхностный обзор всей проблемы целиком. При этом я Вам гарантирую один результат: вы будите свободно владеть несколько моделями на досточном для трейдинге уровне, не очень в вникая  в эти модели, всякие там персептроны, слои, баггинги и бустинги - все это будет Вам не нужно.

Совершенно другой подход. 

A сами пользуетесь этими методами в торговле? И каковы результаты? Я серьёзно, намекните хотя бы на результат. Например, зработал достаточно что книги писать не нужно, купил виллу в Ниццах или Багамах и теперь отдыхаю, филантропством занимаюсь, раздаю книги забесплатно.
 
gpwr:
A сами пользуетесь этими методами в торговле? И каковы результаты? Я серьёзно, намекните хотя бы на результат. Например, зработал достаточно что книги писать не нужно, купил виллу в Ниццах или Багамах и теперь отдыхаю, филантропством занимаюсь, раздаю книги забесплатно.

Если сумеете найти набор предикторов, то реализуете свой перечень. 


ПС.

А книга? Позволяет собрать приятную тусовку, а цена отсекает соискателей грааля.  

 

Скажите, а нельзя ли привести Out Of Sample хотя бы один?

PS. Послал вам email.

 
elab74:

Скажите, а нельзя ли привести Out Of Sample хотя бы один?

PS. Послал вам email.

Табл.2 в разделе 5.3 моей статьи. Пакет  rattle() выдает ООВ автоматически плюс другие очень полезные сведения, которые показаны в статье. Кроме этого под все эти сведения формируется программный код, который можно использовать автономно без rattle(). В моей книге 400 страниц, поэтому все разжевано подробнейшим образом включая идеологию применения, которой нет в оригинальной документации по rattle() и пакетам, которые он использует. rattle - это оболочка, GUI. 

ПС.

На емэил ответил 

 
faa1947:

Табл.2 в разделе 5.3 моей статьи. Пакет  rattle() выдает ООВ автоматически плюс другие очень полезные сведения, которые показаны в статье. Кроме этого под все эти сведения формируется программный код, который можно использовать автономно без rattle(). В моей книге 400 страниц, поэтому все разжевано подробнейшим образом включая идеологию применения, которой нет в оригинальной документации по rattle() и пакетам, которые он использует. rattle - это оболочка, GUI. 

ПС.

На емэил ответил 

Я имел ввиду Out Of Sample тест в МТ4 - сугубо профит от модели интересует. Скажем так + или - зигзага с ошибкой в 17...20% на практике могут превратиться в еще один замечательный сливатор. 

PS. email поймал, надеюсь, скоро смогу оплатить (нужно ждать аккамуляции денег) 

 
elab74:

Я имел ввиду Out Of Sample тест в МТ4 - сугубо профит от модели интересует. Скажем так + или - зигзага с ошибкой в 17...20% на практике могут превратиться в еще один замечательный сливатор. 

PS. email поймал, надеюсь, скоро смогу оплатить (нужно ждать аккамуляции денег) 

Не проводил и не вижу смысла, так как модель надо строить на предикторах, которые имеют предсказательную способность предсказывать разные классы. Именно это свойство предикторов будет гарантировать модель от переобученности (сверхподгонки). В статье и в книге все свалено в кучу. Надо чистить предикторы, строить модель и ее тестировать в МТ4.
Причина обращения: