Линейная регрессия. Вроде должно сходиться, а не сходится. А может не должно? - страница 2

 
Integer:

Про то, что значения должны совпадать я не говорил. Если привести обе картинки к одному масштабу, то должно быть совпадение. Зрительно должны быть одинаковые картинки.

Это и называется "совпадать с точностью до масштабного коэффициента".
 
Candid:
Это и называется "совпадать с точностью до масштабного коэффициента".

Но ведь не совпадает, а должно совпадать.
 
Да не должно же. То моё рассуждение ведётся "от противного", в конце должно становиться ясно, что мы пришли к противоречию. По крайней мере так было задумано :)
 

Нет разницы - двигаем ли предмет перед фоном и масштабируем предмет, или двигаем фон относительно предмета и масшатбируем фон. Смысл линейной регресси в этом - в смещении и масштабировании, минимальная ошибка остается минимальной, хоть умножь все на 10000000, хоть подели на 1000000.

 
Integer:

Нет разницы - двигаем ли предмет перед фоном и масштабируем предмет, или двигаем фон относительно предмета и масшатбируем фон. Смысл линейной регресси в этом - в смещении и масштабировании, минимальная ошибка остается минимальной, хоть умножь все на 10000000, хоть подели на 1000000.

Правильно. Поэтому функция расчёта ЛР из индикатора должна возвращать то, что я написал. Но она не может это возвращать, поскольку её формула несимметрична. Это и есть искомое противоречие. Следовательно функция должна быть другой.

Вообще я и не претендовал на полный ответ, поскольку его ранее дал lea (точнее Пирсон в 1901 г. :) ). Просто решил обозначить ещё один способ рассуждений.

 
Вот подкинул же lea книжицу:) Придется читать с самого начала, глядя на указанную страницу сразу не въезжаю.
 

Вообще конечно масштабным коэффициентом пренебрегать было нельзя :) . Потому что если его выписать явно, становится понятно, что совпадения не может быть ни при какой формуле. :)

В самом деле, обозначим iEUR значения индикатора на графике EURUSD, EUR - сам курс EURUSD, GBP - GBPUSD, А и B - коэффициенты регрессии, К - масштабный коэффициент. Тогда предположение о подобии означает следующее:

iEUR = А + В*EUR = K*GBP

Теперь внимательно на это смотрим и видим, что мы собственными руками выписали утверждение: курс евро к доллару есть однозначная (да ещё и линейная) функция курса фунта к доллару. Что не соответствует действительности. Следовательно никакая линейная функция добиться подобия нам не позволит, добиться подобия нам позволит только "истинная" функция "зависимости" EURUSD от GBPUSD.

Есть предположения о виде этой функции? :)

 
Представьте, что вы фотограф, надо сфотографировать мячик на фоне клетчатого одеяла, так, что бы мячик занимал все пространство одной клетки. Ставим фотоаппарат на штатив, мячик на подставку, вешаем фон и начинаем двигать или мячик или фон, нет ни какой разницы что двигать - мячик ли отдалять/приближать к фону, или фон отдалять и приближать к мячику. Важна пропорция, размер не имеет значения.
 
А получаем что? В одном случае, когда двигаем мячик, он вдруг превращается в бублик, а когда двигаем одеяло - клеточки превращаеютя в цветочки. Вот в чем вопрос!
 

to Candid

Привет, Николай. Я вижу ты тоже рад нашей встрече и, более того, готов опять ввязаться в бесконечные споры. :-)

Candid:

В данном случае речь идёт о разных регрессиях: одна минимизирует квадрат отклонения Xi, другая Yi . Они совершенно не обязаны совпадать.

Да и формулы у них разные :)

Кстати, вот это утверждение ошибочно:

- прямые как раз будут разные (см. начало этого поста). Именно про это рекомендованная lea картинка из Пирсона.

Yurixx:

Когда Вы делаете линейную регрессию для двух рядов {Х} и {Y}, то у Вас действительно получается одна прямая в координатах [X,Y].

Если ты внимательно посмотрел Пирсона, то должен был заметить, что прямая EE' минимизирует функционал S((y'-y)^2), прямая FF' - функционал S((x'-x)^2), а прямая AA' - функционал S(p^2), где p - расстояние от точки [x,y] до прямой AA'. Судя по первой фразе цитаты, ты это заметил.

Если ты взглянул хотя бы глазом на функцию fLR_AB (в индикаторах Integer'a она строит ЛР), то ты должен был заметить, что она строит регрессию первого символа по второму. То есть соответствует у Присона прямой АА'. И точно также моему утверждению, которое ты обозвал ошибочным. :-)

Регрессии EE' и FF' действительно разные, но у Integer'a они не используются.

Candid:
Yurixx:

При этом хорошо бы еще учитывать, что EUR и GBP это не реальные данные цены пар EURUSD и GBPUSD, а точки линии регрессии, то есть некоторое приближение реальных данных.


Нет, я говорю здесь о конкретных индикаторах Integer'а, поэтому в правых частях реальные данные цены пар EURUSD и GBPUSD, а вот в левых - значения этих самых индикаторов, которые, по его предположению, "должны" совпадать с реальной ценой с точностью до масштабного коэффициента. То есть на самом деле не должны. В этом смысле формулы действительно не совсем корректны, поскольку этот самый масштабный коэффициент для простоты опущен :)


Речь идет о выписанных тобой формулах EUR = B*GBP + Val_0 и GBP = EUR/B - Val_0/B. Они вполне соответствуют во-первых, моему утверждению что произведение коэффициентов перед EUR и GBP в этих ЛР должно быть равно 1. Во-вторых, моему утверждению о том, что речь идет о прямой AA', которая и у Пирсона одна-единственная.

В своем первом посте ты заявил:

Candid:

То есть, если fLR_AB("EURUSD",0,"GBPUSD",0,period,0,Val_0,B) возвращает V0 и B0, то fLR_AB("GBPUSD",0,"EURUSD",0,period,0,Val_0,B) должна возвращать -V0/B0 и 1/B0. Однако выражения для коэффициентов ЛР несимметричны по отношению к X и Y, поэтому точно это правило выполняться не может.

По-моему, твой довод не обладает достаточной доказательностью. Но проверить это в числах еще проще, чем доказать на бумаге. Благо все программы для расчета написаны. В своем первом посте я попросил Integer'a проверить этот факт, но у него видно руки не дошли. Николай, может ты это сделаешь чтобы подтвердить свое утверждение ? Я считаю, что выделенное красным должно выполняться не статистически, а точно, на каждом тике.

Но я полностью согласен с тобой, что у Integer'a в правых частях обсуждаемых формул используются реальные цены, а левые части дают значения индикаторов. И как раз в этом заключается проблема (а не в масштабном коэффициенте). Если бы использовались координаты точек прямой AA', то формула соблюдалась бы и пары были бы одинаковы на любых графиках. А так получается, что для каждого реального значения EUR, получается соответствующая координата прямой AA', которая естественно не совпадает со значением GBP, и наоборот.

Впрочем, я написал об этом Integer'у на прошлой странице. Но ответа пока не получил. Могу добавить только то, что регрессия у Integer'a вычисляется для пары [GBP,EUR], а графики в самом первом посте приведены для [GBP, time] и [EUR, time]. Непорядок, однако. :-)

Причина обращения: