Bayesian regression - Делал ли кто советник по этому алгоритму? - страница 6

 
Dmitry Fedoseev:
По такой формуле на тренде дисперсия будет равна 0. Это то, что надо?
Не будет равна 0, попробуйте подставить значения.  :)
 
Mike:
Не будет равна 0, попробуйте подставить значения.  :)
Допустим, тренд идеальный, т.е. на каждом баре одинаковое приращение. Значит график приращений - прямая линия. Ну и чему будет равна дисперсия прямой линии?
 
Dmitry Fedoseev:
Допустим, тренд идеальный, т.е. на каждом баре одинаковое приращение. Значит график приращений - прямая линия. Ну и чему будет равна дисперсия прямой линии?
Вы сначала написали "на тренде". :) Про идеальные - не знаю, не встречал таких ...
 
Суслика тоже не видел? А он есть.
 
Dmitry Fedoseev:
Допустим, тренд идеальный, т.е. на каждом баре одинаковое приращение. Значит график приращений - прямая линия. Ну и чему будет равна дисперсия прямой линии?

Да, тогда нулю.

А максимизируется дисперсия на приращениях с равномерной плотностью. Для рынка это - говоря другими птичьими словами - период наибольшей энтропии, когда одинаково часто встречаются и маленькие, и средние, и большие приращения. 

 
Alexey Burnakov:

.......................

Поэтому когда экономисты говорят, что мы померяли, например, дисперсию такого-то инструмента, они делают следующее: variance = sum((Xi - X^)^2) / (N - 1),

где Xi - это приращение, посчитанное по одной из формул,

X^ - это икс с кепочкой - выборочная оценка среднего значения приращений на доступной выборке

N - 1 - это размер выборки минус один,

а вся формула - несмещенная оценка дисперсии.

А потом эти экономисты начинают думать, что плотность приращений нормальна и пытаются, например, проделать такую вещь как: sqrt(variance) * sqrt(m) * 1,96,

где корень из дисперсии - это оценка стандартного отклоения, а вся формула, это натягивание на не(!)нормальный ряд следствия нормальности для получения оценки крайней границы разброса цены через m шагов вперед с вероятностью 95%. И получаются ошибки, ессно.

Надеюсь, примерно объяснил. А исходный ценовой ряд он даже в первом приближении не похож на нормальный, в отличие от приращений.

В этом посте, раздел 5. Снятие тренда
https://www.mql5.com/ru/articles/363
автор показывает вполне приемлемое приближение выборки приращений к нормальной. А точки, которые не ложатся на прямую  - с ними давно известно как поступать: исключить из выборки примерно 7-10 % максимальных по модулю значений.  Тогда даже критерий согласия Колмогорова (очень чувствительный к форме распределения) показывает нормальность выборки. Что касается исключённых значений - это те точки, на которых произошёл слом текущей тенденции. В том источнике, откуда эта методика (читал давно что-то англоязычное, не помню где) в принципе предлагается формировать выборки приращений из точек, которые находятся между точками слома тенденции, вот это и предлагается называть текущей тенденцией.
Преобразование Бокса-Кокса
Преобразование Бокса-Кокса
  • 2012.01.17
  • Victor
  • www.mql5.com
Статья призвана познакомить читателя с преобразованием Бокса-Кокса (Box-Cox Transformation). В статье кратко затрагиваются вопросы, связанные с его использованием и приводятся примеры, позволяющие оценить эффективность данного преобразования по отношению к случайным последовательностям и реальным котировкам.
 
Alexey Burnakov:

Да, тогда нулю.

А максимизируется дисперсия на приращениях с равномерной плотностью. Для рынка это - говоря другими птичьими словами - период наибольшей энтропии, когда одинаково часто встречаются и маленькие, и средние, и большие приращения. 

А смысл? Конечно найти можно его, если поискать, за время существования рынков придумано множество всяких разных индикаторов, каждый из которых с большим или меньшим успехом можно куда-то прикрутить.
 
Mike:
В этом посте, раздел 5. Снятие тренда
https://www.mql5.com/ru/articles/363
автор показывает вполне приемлемое преобразование выборки приращений. А точки, которые не ложатся на прямую  - с ними давно известно как поступать: исключить из выборки примерно 7-10 % максимальных по модулю значений.  Тогда даже критерий согласия Колмогорова (очень чувствительный к форме распределения) показывает нормальность выборки. Что касается исключённых значений - это те точки, на которых произошёл слом текущей тенденции. В том источнике, откуда эта методика (читал давно что-то англоязычное, не помню где) в принципе предлагается формировать выборки приращений из точек, которые находятся между точками слома тенденции, вот это и предлагается называть текущей тенденцией.

Как же все наоборот здесь перевернулось.

Читаю: "Наличие такой явной "трендовости" наводит на мысль о том, чтобы попытаться сначала исключить тренд". 

Как будто с луны свалились. Как будто выявить волны составляет сложность. Основная проблема теханализа и соответственно торговли - это выявление тренда.

 
Dmitry Fedoseev:

Как же все наоборот здесь перевернулось.

Читаю: "Наличие такой явной "трендовости" наводит на мысль о том, чтобы попытаться сначала исключить тренд". 

Как будто с луны свалились. Как будто выявить волны составляет сложность. Основная проблема теханализа и соответственно торговли - это выявление тренда.

Автор в указанном посте просто неудачно выразился. В статистических пакетах есть стандартные процедуры для анализа временных рядов: выделение тренда, выделение сезонной компоненты и взятие разности. Автор имел ввиду третью, которая используется для перехода к стационарному ряду (на самом деле - приближение к стационарности).
 
Dmitry Fedoseev:
Допустим, тренд идеальный, т.е. на каждом баре одинаковое приращение. Значит график приращений - прямая линия. Ну и чему будет равна дисперсия прямой линии?

Когда мы пытаемся применить статистику, то краеугольным камнем, фундаментом, является вопрос о ПРИМЕНИМОСТИ того или иного инструмента из этой науки.

Ваш пример не содержит случайных величин - константы. Дисперсия относится ТОЛЬКО к случайным величинам. В Вашем конкретном случае быцл получен уникальный для статистики результат: расчет дисперсии показал, что на вход поданы константы, а не случайные числа.

Уникальность Вашего примера состоит в том, что получен правильный и легко объяснимый результат. Обычно же, если тщательно не обосновать возможность применения какого-либо инструмента, например, линейной регрессии,  то будет получен результат не имеющий никакого отношения к реальности, и, соответственно, совершенно не пригодный для использования на практике: цифры будут, их видно (суслика видим), а в реальности всех этих цифр нет!  Просто игра в цифирь.

На примере линейной регрессии: стандартный алгоритм (не самопальный) рассчитывает коэффициенты регрессии и, обычно, крайняя правая колонка говорит о том, существуют ли в реальности те коэффициенты регрессии, которые мы видим. Если в крайне правой колонке стоит цифра 0.5 (50%) то точно, что напечатанных цифр нет. Если 10%, то так, в тумане. а если менее 5%, то цифры реально существуют. И этому можно верить только в том случае, если перед этим вам удалось обосновать ВОЗМОЖНОСТЬ применения этой самой линейной регрессии.   

Причина обращения: