Ирисы не подходят для использования с foreca, так как данные не соответствуют требованиям пакета.

Dr. Trader 2016.08.09 10:11 #951

Данные о лепестках ирисов это не сигнал, эта таблица для теста foreca совсем не подходит. Для пакета подойдут только временные ряды, когда вам через определённые промежутки времени приходят новые значения, и вы их объединяете в вектор. По этой причине для foreca нельзя менять порядок строк в таблице данных. И нельзя убирать рандомно часть строк для валидации, всё должно быть строго по порядку - сначала данные для тренировки, потом данные для валидации. Никакого sample.

Лучшее что можно сделать с ирисами - использовать максимальное число компонент min(dim(forec.dt)) = 14, но думаю что точность всё равно будет ниже 100%.

Элитные показатели :) Off-linе графики и порядок Построение коэффициентов

mytarmailS 2016.08.09 10:22 #952

Dr.Trader:

Лучшее что можно сделать с ирисами - использовать максимальное число компонент min(dim(forec.dt)) = 14, но думаю что точность всё равно будет ниже 100%.

делал и так, получилось точность около 85% а просто форест показал 95%

СанСаныч Фоменко 2016.08.09 10:23 #953

Dr.Trader:

Данные о лепестках ирисов это не сигнал, эта таблица для теста foreca совсем не подходит. Для пакета подойдут только временные ряды, когда вам через определённые промежутки времени приходят новые значения, и вы их объединяете в вектор. По этой причине для foreca нельзя менять порядок строк в таблице данных. И нельзя убирать рандомно часть строк для валидации, всё должно быть строго по порядку - сначала данные для тренировки, потом данные для валидации. Никакого sample.

Лучшее что можно сделать с ирисами - использовать максимальное число компонент min(dim(forec.dt)) = 14, но думаю что точность всё равно будет ниже 100%.

Мне кажется пост про ирисы очень важным.

Дело в том, что rf феноменально склонен к переобучению.

А тут оказывается, что foreCA такой склонностью не обладает. Значит весьма полезный пакет.

mytarmailS 2016.08.09 10:34 #954

Dr.Trader:

А у вас там какие результаты с ВР ?

Dr. Trader 2016.08.09 10:53 #955

СанСаныч Фоменко:

Мне кажется пост про ирисы очень важным.

Дело в том, что rf феноменально склонен к переобучению.

А тут оказывается, что foreCA такой склонностью не обладает. Значит весьма полезный пакет.

Лес хоть и переобучается, но если к 4 предикторам для ирисов добавить ещё 10 колонок с рандомными значениями, то лес всё равно предсказывает новые данные с почти 100% точностью. Я удивлён, и рад что лес справился. Сам раньше не проводил такой эксперимент, учту на будущее.

foreCA в свою очередь назвал вообще все предикторы шумом с прогнозируемостью ~ 1% (и длины лепестков, и предикторы из случайных значений), и попытался из всего этого извлечь хоть какой-то сигнал. Извлекать сигнал оттуда где его не должно быть - по-моему бесполезно, этот эксперимент для foreca ничего не говорит.

mytarmailS:
А у вас там какие результаты с ВР ?

Модель ещё учится. Я подал наверное слишком много данных, но отменять уже не хочется, пускай работает до конца, я оставлю. Потом напишу о результатах когда всё закончится.

Обсуждение статьи "Random Decision Группировка листьев - требуются Предсказание рынка на основе

Mihail Marchukajtes 2016.08.09 14:45 #956

Я конечно не хочу забегать вперёд, но Решетов такую крутую штуку замутил в новом релизе.... Что ваши задачи раскусит на раз. Я ему идею подкинул, но он и сам уже об этом думал, так что у дураков мысли сошлись и в итоге мощнейшая штука получилась. Зря вы на него бочку катили.....

Обсуждение статьи "Машинное обучение Неправильный расчет индикатора из [Архив!] Курилка

СанСаныч Фоменко 2016.08.09 15:33 #957

Mihail Marchukajtes:
Я конечно не хочу забегать вперёд, но Решетов такую крутую штуку замутил в новом релизе.... . Зря вы на него бочку катили.....

Крутые разговоры про крутые штуки...

А хоть одно сравнение с общепринятым и общеизвестным и общепризнанным увидим?

Mihail Marchukajtes 2016.08.09 15:39 #958

СанСаныч Фоменко:

Крутые разговоры про крутые штуки...

А хоть одно сравнение с общепринятым и общеизвестным и общепризнанным увидим?

Когда нибудь увидите, отчего же нет то.....

mytarmailS 2016.08.09 17:13 #959

Dr.Trader:

Лес хоть и переобучается, но если к 4 предикторам для ирисов добавить ещё 10 колонок с рандомными значениями, то лес всё равно предсказывает новые данные с почти 100% точностью. Я удивлён, и рад что лес справился. Сам раньше не проводил такой эксперимент, учту на будущее.

Да я сам удивлен что он настолько блестяще игнорировал шум и отличал от предикторов, тоже никогда так не делал, самому было интересно....

Так еще до сегодняшнего дня я абсолютно не доверял функцией importense

но она меня заставила поверить

[архив c 17.03.2008] Юмор Опция скидок и акций Должен ли пользователь знать

Dr. Trader 2016.08.09 18:34 #960

Продолжайте не доверять importance при использовании для форекс. Ирис это очень простые данные, там есть прямые закономерности между имеющимеся данными и классами. RF достаточно найти минимальный набор предикторов на которых можно определить классы iris - и всё готово.

А теперь давайте на Проблема загрузки данных из От теории к практике

Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 96