Выравнивание котировок для портфеля

 

Было ли где-нибудь на форуме обсуждение, как "привести к общему знаменателю" котировки по нескольким символам? Имеется в виду удаление неполных записей, заполнение пропусков и тд.

Интересует общий подход к проблеме.

 
Не понял.
 
https://habr.com/ru/articles/542638/#comment_22692548 интересный CHM файл
 
fxsaber #:
Не понял.

Пусть есть два актива. Для первого цены известны в моменты времени 1, 2, 4. Для второго цены известны в моменты 1, 3, 4. Пропуски по объективным причинам.

Нужно построить портфель (линейную комбинацию цен). Для моментов времени 1 и 4 очевидно. Моменты 2 и 3 можно (а) выбросить, (б)  заместить последним известным значением (цены в моменты 1, 2, 2, 4 для первого и 1, 1, 3, 4 для второго). Если строить приращения портфеля, то можно пропуски просто заменять нулями. Наверно ещё есть варианты.

В языке R есть пакеты (zoo например) с функциями для подобных действий. Подумалось, что где-то на форуме эта тема должна быть хорошо обсуждена.

 
Rorschach #:
интересный CHM файл
Вполне возможно, но здесь тема - предобработка данных.
 
Aleksey Nikolayev #:

Подумалось, что где-то на форуме эта тема должна быть хорошо обсуждена.

Мультисимвольные бары здесь неоднократно строили по close-данным на этом принципе:

Aleksey Nikolayev #:

Пусть есть два актива. Для первого цены известны в моменты времени 1, 2, 4. Для второго цены известны в моменты 1, 3, 4. Пропуски по объективным причинам.

Моменты 2 и 3 можно (а) выбросить, (б)  заместить последним известным значением (цены в моменты 1, 2, 2, 4 для первого и 1, 1, 3, 4 для второго).

Основной логический вопрос всегда возникал, почему такие матрицы строят на основании постоянного квантования времени? Даже примитивная корреляция жутко зависит от того, как будете квантовать.

Например, если строить по тикам на основе пункта (б), то корреляция будет сильно плавать, в зависимости от количества тиков на одном и том же интервале.

 
fxsaber #:
Мультисимвольные бары

Спасибо, теперь есть за что зацепиться в поиске.

fxsaber #:

Основной логический вопрос всегда возникал, почему такие матрицы строят на основании постоянного квантования времени? Даже примитивная корреляция жутко зависит от того, как будете квантовать.

Например, если строить по тикам на основе пункта (б), то корреляция будет сильно плавать, в зависимости от количества тиков на одном и том же интервале.

Наверно нужны какие-то более грубые но робастные методы. Например, вместо корреляции связь можно смотреть по тому насколько меньший размах будет у портфеля чем размах у символов, его составляющих.

 
Aleksey Nikolayev #:

Спасибо, теперь есть за что зацепиться в поиске.

Наверно нужны какие-то более грубые но робастные методы. Например, вместо корреляции связь можно смотреть по тому насколько меньший размах будет у портфеля чем размах у символов, его составляющих.

Размах портфеля вроде всегда будет меньше наибольших размахов символов и больше наименьших. Пропуски и борьба с ними обсуждались, полноценных тем не встречал. Раз в секунду как решение обычно предлагалось. И забей на пропуски. Логики мало по мне в таком решении.
 
Valeriy Yastremskiy #:
Размах портфеля вроде всегда будет меньше наибольших размахов символов и больше наименьших. Пропуски и борьба с ними обсуждались, полноценных тем не встречал. Раз в секунду как решение обычно предлагалось. И забей на пропуски. Логики мало по мне в таком решении.

Возможно разные вещи имеем в виду, но если под портфелем разумеется сумма активов, то

Максимум=сумма_максимумов, минимум=сумма_минимумов. Размах=максимум минус минимум. Среднее, без учёта распределений = среднеквадратичное от среднеквадратичных (а это меньше чем среднее от средних и ближе к общему минимуму чем к максимуму)

местные портфельные торговцы и хедж-деятели влетают на том что выделено болдом. Риски никто не считает, всё считают прибыль и "толстые хвосты" складываются в эпичный лингам. 

 
Valeriy Yastremskiy #:
Размах портфеля вроде всегда будет меньше наибольших размахов символов и больше наименьших. Пропуски и борьба с ними обсуждались, полноценных тем не встречал. Раз в секунду как решение обычно предлагалось. И забей на пропуски. Логики мало по мне в таком решении.

Ну, речь была о первой пришедшей в голову замене корреляции для определения зависимости.

Приводим нормировкой и сдвигом все символы к диапазону от -0.5 до 0.5 (размах равен одному). Берём все портфели с весами, сумма модулей которых равна единице, и находим с наименьшим размахом. Суть примерно та же, что и при поиске коинтеграции, только вместо суммы квадратов берётся размах (на языке математики норма Linf вместо L2)

 
Aleksey Nikolayev #:

Приводим нормировкой и сдвигом все символы к диапазону от -0.5 до 0.5 (размах равен одному). Берём все портфели с весами, сумма модулей которых равна единице, и находим с наименьшим размахом. Суть примерно та же, что и при поиске коинтеграции, только вместо суммы квадратов берётся размах (на языке математики норма Linf вместо L2)

Такое где-то было в КБ.