Возможно, что большее количество сгенерированых семплов даст более стандартизированную выборку - Общее обсуждение

iwelimorn 2021.10.29 12:06 #24771

Maxim Dmitrievsky #:
Сложно сказать какой объём выборки оптимальный, наверное, зависит от кол-ва компонентов гауссовских смесей. Слишком большая выборка, при зашумленном датасете, приводит к генерации сильно похожих семплов, то есть вероятность возникновения часто повторяющихся примеров увеличивается, т.к. используются гауссианы для оценки плотности и генерации. Поэтому скорее нет, чем да.

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку.

Maxim Dmitrievsky 2021.10.29 13:00 #24772

iwelimorn #:

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку.

Да, конечно

Mihail Marchukajtes 2021.10.30 18:20 #24773

iwelimorn #:

Спасибо. Вероятно я не корректно задал вопрос, я имел в виду, возможно ли такое, что большее количество сгенерированых семплов даст более стандартизированную выборку.

Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет. Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...

Советник на подобии нейросети Рыночный этикет или правила FOREX - Тенденции, прогнозы

Mihail Marchukajtes 2021.10.30 18:21 #24774

И к стати в наших рядах появилась дама как я понял??? Вот это действительно редкий случай, можно сказать исключение из правил... :-)

Dmytryi Nazarchuk 2021.10.30 18:27 #24775

Mihail Marchukajtes #:
Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет . Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...

ты хоть сам понял, что написал?

iwelimorn 2021.10.30 19:05 #24776

Mihail Marchukajtes #:
Важно что бы при формировании выборки было как можно меньше противоречий иначе от обучения толку не будет. Представьте что в одном случае при одном и том же значении входного вектора целевая имеет значение 1, а в следующем примере при идентичном входном векторе целевая имеет 0. Что тогда делать алгоритму? Как реагировать? Поэтому увеличение обучающих семплов актуально только в том случае когда это не ведёт к увеличению противоречий. Филосовский вопрос. Я вот например на 100 обучающих примерах охватываю 3 месяца рынка на М5. Как пример...

Я согласен с вами, если один и тот же пример описывает несколько состояний, то при классификации любым доступным алгоритмом мы получим вероятность близкую к 1/n где n - количество состояний.

Но ведь не существует абсолютно похожих примеров, они похожи в определённой степени. Вопрос как выявить эту "похожесть".

100 примеров за 3 месяца на М5... интересно... А вы перед обучением выбираете семплы из исходной выборки по правилам, которые затем используете при торговле?

торговая стратегия на базе Мой эксперт выполняет двойную 2 вопроса МТ5

Dmytryi Nazarchuk 2021.10.30 19:08 #24777

iwelimorn #:

Я согласен с вами, если один и тот же пример описывает несколько состояний, то при классификации любым доступным алгоритмом мы получим вероятность близкую к 1/n где n - количество состояний.

Но ведь не существует абсолютно похожих примеров, они похожи в определённой степени. Вопрос как выявить эту "похожесть".

100 примеров за 3 месяца на М5... интересно... А вы перед обучением выбираете семплы из исходной выборки по правилам, которые затем используете при торговле?

Если один и тот же набор независимых переменных в обучающей выборке соответствует только одной зависимой переменной, то это детерминированный ряд.

Там и классифицировать нечего - ошибка прогноза 0.

Да, это уже агония

iwelimorn 2021.10.30 19:21 #24778

Dmytryi Nazarchuk #:

Если один и тот же набор независимых переменных в обучающей выборке соответствует только одной зависимой переменной, то это детерминированный ряд.

Там и классифицировать нечего - ошибка прогноза 0.

Да, это уже агония

Спасибо. Возможно, это не агония, а отсутствие у меня фундаментальных знаний.

Это также справедливо если несколько наборов независимых переменных соответствует одной переменной?

Dmytryi Nazarchuk 2021.10.30 19:34 #24779

iwelimorn #:

Спасибо. Возможно, это не агония, а отсутствие у меня фундаментальных знаний.

Это также справедливо если несколько наборов независимых переменных соответствует одной переменной?

Нит. Такое нормально

Mihail Marchukajtes 2021.10.31 10:13 #24780

Dmytryi Nazarchuk #:

ты хоть сам понял, что написал?

Ну да. Это называется противоречивость данных. Я так то 20 лет сетями занимаюсь и можно сказать сторожила этой ветке. А почему Вы спрашиваете?

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2478