Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2478

 
Maxim Dmitrievsky #:
Сложно сказать какой объём выборки оптимальный, наверное, зависит от кол-ва компонентов гауссовских смесей. Слишком большая выборка, при зашумленном датасете, приводит к генерации сильно похожих семплов, то есть вероятность возникновения часто повторяющихся примеров увеличивается, т.к. используются гауссианы для оценки плотности и генерации. Поэтому скорее нет, чем да.

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку. 

 
iwelimorn #:

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку. 

Да, конечно 
 
iwelimorn #:

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку. 

Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет. Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...
 
И к стати в наших рядах появилась дама как я понял??? Вот это действительно редкий случай, можно сказать исключение из правил... :-)
 
Mihail Marchukajtes #:
Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет . Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...

ты хоть сам понял, что написал?

 

Mihail Marchukajtes #:
Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет. Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...

Я согласен с вами, если один и тот же пример описывает несколько состояний, то при классификации любым доступным алгоритмом мы получим вероятность близкую к  1/n  где n - количество состояний.

Но ведь не существует абсолютно похожих примеров, они похожи в определённой степени. Вопрос как выявить эту "похожесть".


100 примеров за 3 месяца на М5... интересно...  А вы перед обучением выбираете семплы из исходной выборки  по правилам, которые затем используете при торговле?

 
iwelimorn #:

Я согласен с вами, если один и тот же пример описывает несколько состояний, то при классификации любым доступным алгоритмом мы получим вероятность близкую к  1/n  где n - количество состояний.

Но ведь не существует абсолютно похожих примеров, они похожи в определённой степени. Вопрос как выявить эту "похожесть".


100 примеров за 3 месяца на М5... интересно...  А вы перед обучением выбираете семплы из исходной выборки  по правилам, которые затем используете при торговле?

Если один и тот же набор независимых переменных в обучающей выборке соответствует только одной зависимой переменной, то это детерминированный ряд.

Там и классифицировать нечего - ошибка прогноза 0.

Да, это уже агония  

 
Dmytryi Nazarchuk #:

Если один и тот же набор независимых переменных в обучающей выборке соответствует только одной зависимой переменной, то это детерминированный ряд.

Там и классифицировать нечего - ошибка прогноза 0.

Да, это уже агония  

Спасибо.  Возможно, это не агония, а отсутствие у меня фундаментальных знаний. 

Это также справедливо если несколько наборов независимых переменных соответствует одной переменной?

 
iwelimorn #:

Спасибо.  Возможно, это не агония, а отсутствие у меня фундаментальных знаний. 

Это также справедливо если несколько наборов независимых переменных соответствует одной переменной?

Нит. Такое нормально
 
Dmytryi Nazarchuk #:

ты хоть сам понял, что написал?

Ну да. Это называется противоречивость данных. Я так то 20 лет сетями занимаюсь и можно сказать сторожила этой ветке. А почему Вы спрашиваете?
Причина обращения: