Машинное обучение в трейдинге: теория, модели, практика и алготорговля - страница 2974

 
Нужно ли спасать человека который очевидно тонет,  но наслаждаться своим суицидом?
Когда эму протягиваешь руку помощи он её отвергает, спорит с тобой, не пытается сделать ничего что выбраться сам и диктует свои условия типа:
Либо ты меня спасаешь сам, выносишь из воды держа над головой и под мою любимую музыку, либо никак.. 
 И вообще значит у тебя нету желания меня спасать..


 
Forester #:

Вы хоть раз на код в том же катбусте смотрели? Вы же им пользуетесь. Он не пользуется сторонними пакетами. А вот такой маленькой функцией (она даже проще того что я описал, не смещает точку разделения на количество дубликатов).
Написал комментарии того, что приосходит. На вход подается отсортированный столбец.

Конечно я смотрел. Кроме того, готов оплатить работу по воспроизведению всех методов квантования в MQL5. Пока попытки были неудачны, хотите попробовать?

Forester #:

Как видите все очень просто и ничего интеллектуального тут нет - просто отсчитываем например 100 строк и всё.

Вы привели самый простой метод - да, тут не сложно.

К тому же, я разве писал, что там гениальные методы квантования или что-то типа такого? Как это противоречит мной написанному?

 
mytarmailS #:
Нужно ли спасать человека который очевидно тонет,  но наслаждаться своим суицидом?
Когда эму протягиваешь руку помощи он её отвергает, спорит с тобой, не пытается сделать ничего что выбраться сам и диктует свои условия типа:
Либо ты меня спасаешь сам, выносишь из воды держа над головой и под мою любимую музыку, либо никак.. 
 И вообще значит у тебя нету желания меня спасать..


Сидите на берегу - герой - это Ваш выбор.

Я достаточно рассказал в чём суть и почему решение задачи даст прирост стабильности модели.

Какой прок хвастать, что Вы знаете пакет в R, который может решить такую то задачу, если я им не могу воспользоваться?

 
Aleksey Vyazmikin #:

Пока попытки были неудачны, хотите попробовать?

Нет. Попробуйте сами (пока идут очередные расчеты  и время займете), языки похожи.

Aleksey Vyazmikin #:

Вы привели самый простой метод - да, тут не сложно.

У других та же простая суть. Пару вариантов я описал текстом - пропуск дублей и перерасчет базового размера кванта с учетом дублей. Еще есть разбивка не по количеству, а по диапазону  и комбинирование этих методов.

 
Forester #:

Нет. Попробуйте сами (пока идут очередные расчеты  и время займете), языки похожи.

У других та же простая суть. Пару вариантов я описал текстом - пропуск дублей и перерасчет базового размера кванта с учетом дублей. Еще есть разбивка не по количеству, а по диапазону  и комбинирование этих методов.

Как раз проблема не в механическом исполнении, а в том, как посчитать непропорциональные сетки. Там строятся распределения плотности вероятности и они уже квантуются, как я понял.

Времени у меня мало свободного и я предпочитаю его тратить на кодирование того, что понимаю, как делать. Может, если это будет последняя задача, то сяду и буду тупить днями на пролет, а пока предпочитаю двигаться по другим направлениям этого проекта. Благо, что таблицы квантования можно выгрузить.

 
Aleksey Vyazmikin #:

Там строятся распределения плотности вероятности и они уже квантуются, 

это в каком методе квантования? они все на той странице.

 
Aleksey Vyazmikin #:

если я им не могу воспользоваться?

Вам сказали что делать,  вам назвали пакет. 

Всё что надо это открыть Гугл 
Это сложно... 

Набрать там название пакета
Задача не из лёгких.. 

Открыть туториал
Миссия невыполнима... 

Скопировать три строчки кода примера 
Ну тут наверное профессионалов надо звать на помощь, не меньше десятка... 


И когда это все проговариваешь, тебе в ответ -  неё это мне надо но я не буду это делать,  сделай ты это за меня и опубликуй готовый код для меня тут, потому что мне надо.. А я сам не буду, потому не могу, а почему не могу,  ну потому что не могу.. 



 
Forester #:

это в каком методе квантования? они все на той странице.

Метод GreedyLogSum - как пример, видно, что сетка не равномерная. Предполагаю, что строится логнормальное распределение по метрикам выборки через апроксимацию, и уже на нём сетка делается каким то образом. Не умею я формулы читать.

Подробно тут формулы.

 
mytarmailS #:
Вам сказали что делать,  вам назвали пакет. 

Говорить Вы умеете, а вот слышать - не уверен.

Да, идея с деревом решений может быть рабочей для построения квантовой таблицы. Спасибо за идею!

Пусть даже я нашел неизвестный пакет, и даже создал дерево.

Дальше мне требуется разобраться с циклами в R, сохранением деревьев.

А в каком формате они сохраняться? Вероятно в виде правил, а значит нужно делать парсер, который эти правила трансформирует в нужный формат.

Не проще ли мне тогда сразу решать задачу через гистограмму с равномерными отрезками в 0,5%, объединяя схожие по метрике/условию столбцы?


И вообще, я спрашивал же изначально о метриках, характеризующих выборку, которая попала в квантовый отрезок. Нет идей в этом направлении или не хотите думать - скажите.

А то привыкли тут шоу устраивать - оттого и ветка мусорная.

 
Aleksey Vyazmikin #:

Метод GreedyLogSum - как пример, видно, что сетка не равномерная. Предполагаю, что строится логнормальное распределение по метрикам выборки через апроксимацию, и уже на нём сетка делается каким то образом. Не умею я формулы читать.

Подробно тут формулы.

Та простая функция тоже сделает неравномерную по значениям сетку. Равномерная - это Uniform.

GreedyLogSum Maximize the greedy approximation of the following expression inside every bucket:
∑ i = 1 n log ⁡ ( w e i g h t ) , w h e r e i=1nlog(weight),where
- n n — The number of distinct objects in the bucket.
- w e i g h t weight — The number of times an object in the bucket is repeated.


Она работает с числом повторов/дубликатов. Все примерно то же самое. Функцию не нашел (быстрым просмотром), поэтому точно сказать не могу...  варианты учета дублей описал ранее, думаю там одно из них или что-то близкое.

Причина обращения: