Обсуждение статьи "Оценка и выбор переменных для моделей машинного обучения" - страница 3

 
Vladimir Perervenko:

Сначала дается определение Классификации на уровне детского сада. Потом рассказывается о том, что порождается неопределенность(!?) А заканчивается как всегда : "Где ключ от квартиры где деньги лежат?"

Вам нужно повысить теоретическую подготовку. Учиться, учиться и еще раз ... Ну вы знаете.

И будьте скромнее.

ПС. Свое предложение разместите во Фриланс. Получите реальный продукт.

О ключе от квартиры слышал не в первый раз. Перечитайте мое предложение: "Детали модели, нормализации данных, и их выбора меня не интересуют. Меня интересуют результаты предсказаний ..." Причём предсказаний на прошлом участке истории от 2000 года по сегодня. Так что читать видимо мы тут все не умеем. Короче, теория продолжается. Перечитали другие книги и статьи и написали свою. Вы хоть попробуйте сначала поторговать на реальном рынке ипользуя свои методы, а потом пишите статьи. Ну ладно, теоретики-академики. Дал я вам тут рекламы немного, а то ветка начала тонуть в навале новых статей. 

 

Вот ещё пара статей на данную тему:

http://robotwealth.com/machine-learning-financial-prediction-david-aronson/

http://robotwealth.com/machine-learning-for-financial-prediction-experimentation-with-david-aronsons-latest-work-part-2/

 

Возможно, кому-то покажется полезным. 

Machine learning for financial prediction: experimentation with David Aronson’s latest work – part 1
Machine learning for financial prediction: experimentation with David Aronson’s latest work – part 1
  • 2016.03.04
  • Robot Master
  • robotwealth.com
One of the first books I read when I began studying the markets a few years ago was David Aronson’s Evidence Based Technical Analysis. The engineer in me was attracted to the ‘Evidence Based’ part of the title. This was soon after I had digested a trading book that claimed a basis in chaos theory, the link to which actually turned out to be...
 
Эндрю Нг (Andrew  Ng) -  в русской транскрипции все-таки наверное более правильно Эндрю Ын ;)

Во первых, ОГРОМНОЕ спасибо автору за уникальную серию статей, это действительно Грааль для тех, кто в теме или по крайней мере пытается разобраться!

Во-вторых, без предварительной подготовки чтение данных материалов для среднестатистического человек темный лес, я бы даже сказал лежит за его event horizon когнитивных возможностей. Посему очень рекомендуется прослушать курсы по машинному обучению на курсере https://ru.coursera.org (есть нарезка тех же лекций на ютубе).

В них вся информация, как говориться из первых рук и их читают так сказать отцы-создатели deep learning: есть курс и от Geoffrey E. Hinton и от Andrew  Ng.

В качестве базы  перед этими курсами, я бы также рекомендовал курсы по эконометрике и линейной алгебры от ВШЭ на том же ресурсе.

И только после этого возможно придет понимание того, о чем пишет Владимир в своих статьях.

Еще раз, БРАВО! 
 

Уважаемый Владимир, спасибо за хорошую статью.

Я читаю все ваши статьи и они очень интересны.

Что касается этой статьи, то я так и не понял, зачем вы используете preProcess для разбиения данных и как происходит разбиение данных?

Судя по моим экспериментам, эта функция разбивает данные в разном порядке.

Вопрос в том, как я могу восстановить первоначальный порядок после получения результатов от функции predict?

Получается, что в этом результате данные располагаются в другом порядке.

Заранее спасибо за ваши комментарии.

С уважением,

 
mg64ve:

Уважаемый Владимир, спасибо за хорошую статью.

Я читаю все ваши статьи и они очень интересны.

Что касается этой, то я так и не понял, зачем вы используете preProcess для разбиения данных и как они разбиваются?

Судя по моим экспериментам, эта функция разбивает данные в разном порядке.

Вопрос в том, как я могу восстановить исходный порядок после получения результатов от функции predict?

Получается, что в этом результате данные располагаются в другом порядке.

Заранее спасибо за ваши комментарии.

Спасибо

Привет,

Вероятно, вы неправильно поняли. Выполняется разделение функций holdout(). Затем функция preProcess() , определяемая параметрами нормализации в обучающем множестве. И далее код .

С уважением

Владимир

> idx <- rminer::holdout(y = data.f$Class)
> prep <- caret::preProcess(x = data.f[idx$tr, -ncol(data.f)],
+             method = c("spatialSign"))
> x.train <- predict(prep, data.f[idx$tr, -ncol(data.f)])
> x.test <- predict(prep, data.f[idx$ts, -ncol(data.f)])
> y.train <- data.f[idx$tr, ncol(data.f)]
> y.test <- data.f[idx$ts, ncol(data.f)]
 

Это работает?" best <- Cs(cci, cmo, slowD, oscK, signal, tr, ADX. chv, atr, ar)".


 

Правильный код должен быть таким:

>library(Hmisc)

>best <- Cs(cci, cmo, slowD, oscK, signal, tr, ADX,chv, atr, ar)

"ADX." должно быть "ADX,"?

 
JunCheng Li:

Правильный код должен быть таким:

>library(Hmisc)

>best <- Cs(cci, cmo, slowD, oscK, signal, tr, ADX,chv, atr, ar)

"ADX." должно быть "ADX,"?

Да, это опечатка в статье.

 
Большое спасибо автору статьи. Я только начал и столкнулся с проблемой. Я установил RStudio, а не Revolution R Open 3.2.1, как предлагает автор. Пакет "RandomUniformForests" ипакет "RoughSets" загружаются, но функция nearZeroVar() и функция findLinearCombos() вызываются некорректно. Пакет "RandomUniformForests" и пакет "RoughSets" загружаются, нофункция nearZeroVar() ифункция findLinearCombos() вызываются некорректно, являются ли эти функции специфичными для Revolution R Open?
Microsoft R Open: The Enhanced R Distribution · MRAN
  • Microsoft Corporation
  • mran.revolutionanalytics.com
Microsoft R Open, formerly known as Revolution R Open (RRO), is the enhanced distribution of R from Microsoft Corporation. It is a complete open source platform for statistical analysis and data science. The current version, Microsoft R Open 3.3.2, is based on (and 100% compatible with) R-3.3.2, the most widely used statistics software in the...
 

Привет, Влад,

Я пытаюсь повторить ваш пример шаг за шагом.

В разделе Входные данные, функция In(p=16) имеет дело с объектом цены. Каков его R-формат или класс (zoo, xts или dataframe) и как он выглядит (названия столбцов и т.д.). Без этой информации невозможно выполнить команду x <- In(p = 16) ...

С уважением.

Жюльен