Вы упускаете торговые возможности:
- Бесплатные приложения для трейдинга
- 8 000+ сигналов для копирования
- Экономические новости для анализа финансовых рынков
Регистрация
Вход
Вы принимаете политику сайта и условия использования
Если у вас нет учетной записи, зарегистрируйтесь
faa1947, покажите на примере внизу как работает ваша модель. Первый столбец - моделируемый ряд, 2-й и 3-й столбцы - предикторы. Какая предсказательная способность у этих предикторов?
Я не являюсь универсальным специалистом-математиком. Стараюсь рассуждать очень конкретно, и на почве трейдинга получить выборку в 10000 строк не составляет труда. Делать какие-либо заключения на 40 строках я не умею и не вижу необходимости учиться, хотя все о чем я рассказываю применимо и для таких выборок. Для медицины 40 строк - это нормально.
1. Вообще я пишу о переобученности модели, в рамках которой возникла "предсказательная способность".
2. Занимаюсь предсказанием номинальных величин - "лонг-шорт". Это классификационные модели. Ваш пример, регрессионные модели, которыми я не занимаюсь .
Готов продолжить.
Мне надо котир, на котором можно провести ЗЗ и чтоб было несколько изломов. Отсюда нужен довольно большой файл.
Кроме самого котира несколько предикторов, пусть даже один. Я отвечу на вопрос: обладает ли этот предиктор предсказательной способностью "лонгов-шортов".
И, конечно, нужен файл - или Вы предлагаете набрать все вручную?
TheXpert:
Секрет "высокой обобщающей способности" Вашей выборки раскрыт: значение первого столбца - это сумма значений двух остальных столбцов.
Ну вот взял все испортил ) . И как это так твой высокий ИИ сразу не распознал банальную сумму?А он не предназначен для распознания сумм, поскольку строит модели для бинарной классификации, а задача из раздела множественной регрессии.
Хотя модель для бинарной классификации, но тем не менее, выражение:
упрощается до: y ~ v0 + v1
А далее всего лишь осталось проверить гипотезу в электронной таблице.
Добрый день, СанСаныч.
По вопросу недоученности,переучености можно посмотреть драфт книги здесь http://www.iro.umontreal.ca/~bengioy/dlbook/
в разделе 5.3.3 очень хорошо описано всё. Вообще вся книга очень полезна, тем более написана корифеями.
Удачи
Добрый день, СанСаныч.
По вопросу недоученности,переучености можно посмотреть драфт книги здесь http://www.iro.umontreal.ca/~bengioy/dlbook/
в разделе 5.3.3 очень хорошо описано всё. Вообще вся книга очень полезна, тем более написана корифеями.
Удачи
Добрый день!
Спасибо за ссылку.
У меня имеется полный набор инструментов и подбор литературы по этому вопросу. Но это не облегчает практическое применение.
Если желаете, могу поделиться в надежде довести весь этот инструментарий до автоматизма вместе.
Добрый день!
Спасибо за ссылку.
У меня имеется полный набор инструментов и подбор литературы по этому вопросу. Но это не облегчает практическое применение.
Если желаете, могу поделиться в надежде довести весь этот инструментарий до автоматизма вместе.
Я программно решаю эту проблему. Результаты нормальные.
Удачи
Я не являюсь универсальным специалистом-математиком. Стараюсь рассуждать очень конкретно, и на почве трейдинга получить выборку в 10000 строк не составляет труда. Делать какие-либо заключения на 40 строках я не умею и не вижу необходимости учиться, хотя все о чем я рассказываю применимо и для таких выборок. Для медицины 40 строк - это нормально.
1. Вообще я пишу о переобученности модели, в рамках которой возникла "предсказательная способность".
2. Занимаюсь предсказанием номинальных величин - "лонг-шорт". Это классификационные модели. Ваш пример, регрессионные модели, которыми я не занимаюсь .
Готов продолжить.
Мне надо котир, на котором можно провести ЗЗ и чтоб было несколько изломов. Отсюда нужен довольно большой файл.
Кроме самого котира несколько предикторов, пусть даже один. Я отвечу на вопрос: обладает ли этот предиктор предсказательной способностью "лонгов-шортов".
И, конечно, нужен файл - или Вы предлагаете набрать все вручную?
Проверить переобученность модели довольно просто, сравнивая её поведение на обучающей выборке и вне.
Это большие иллюзии и как я понимаю еще Вами не оплаченные. Приведенная в статье модель имеет одинаково хорошие результаты на трех выборках вне обучения - но эта модель переобучена.
А вот как сделать модель не переобученной зависит от нашей возможности определить какие предикторы-входы имеют отношение к моделируемому ряду а какие нет, что намного сложнее определения переобученности.
Сначала читаем внимательно статью - таблица 3 приводит знАчимость предикторов при предсказании целевой переменной
А затем учим матчасть, например, изучаем специализированные пакеты по выбору предикторов varSerf, Boruta, FSelector. А пакет CORElearn имеет 35 (!) разных алгоритмов по выбору предикторов, которые имеют значение для целевой переменной.
Из моего опыта по отбору предикторов, имеющих значение для целевой переменной.
1. формируем довольно большой набор предикторов, например штук 50 с количество баров 15000
2. С помощью одного из указанных алгоритмов на этих 15 тысячах баров отбираем предикторы - получается обычно от 15 до 20 штук, который используются при построении модели чаще, чем в 20% случаев.
3. Затем берем меньшее окно, например 2000 баров и начинаем его двигать по одному бару, отбирая знАчащие предикторы из отобранных ранее 20 из 50.
4. Конкретный перечень знАчащих предикторов все время меняется.
Так как определить релеватность данных вы видимо не умеете, то интереса у меня к вашим статьям и книгам нет.
Эффективность использования указанных пакетов в Ваших руках сильно возрастет, если потратите небольшую сумму на мою книгу, которая объясняет зачем это нужно и как это понимать и реальными примерами на реальных данных.
А еще больший эффект будет если мы с Вами вместе попытаемся создать не переобученную модель на Ваших предикторах. Успех не гарантирован, но гарантируется, что столь поверхностных постов после общения со мной Вы писать не будете. Более того, будете гораздо осторожнее на реальных счетах.
1. формируем довольно большой набор предикторов, например штук 50 с количество баров 15000
Ну, теперь понятно, почему вы зарабатываете деньги продажей своей книги, а не трейдингом.
Это большие иллюзии и как я понимаю еще Вами не оплаченные. Приведенная в статье модель имеет одинаково хорошие результаты на трех выборках вне обучения - но эта модель переобучена.
Переобученность это устоявшийся и вполне конкретный термин. Вы его мало того что подменяете так еще и не объясняете что это такое в вашем понимании.
Очень султона напоминает ) по манере общения.