Автоматический расчет описательных статистик выборки на MQL5 - страница 4

 
Alexandr Sokolov #:

Ексель файл не могу прикрепить - пишет что некорректный формат файла, если хотите могу отправить в телеграмм



Не поддерживаемые форумом файлы можно архивировать в zip и прикреплять. Только exe не надо - их модераторы не одобряют.

 
Суть в конце видео - середина, это объяснение
 
Ексель файл
Файлы:
 
* в видео забыл уточнить что по самому весу можно определить индекс на котором расположен "выброс" - это для того чтобы знать какой ряд исключить из выборки
 
Alexandr Sokolov #:
* в видео забыл уточнить что по самому весу можно определить индекс на котором расположен "выброс" - это для того чтобы знать какой ряд исключить из выборки

Спасибо за видео и файл xlsx!

Да, по сути Вы поняли правильно задачу.

Я ознакомился с информацией. Хотел уточнить формулу:

=(I4+J4)/СУММ($I$4:$J$14)

Уверены, что сумму всех строк не нужно разделить на число строк?

По самому методу - пока не осмыслил до конца.

У нас данные в процентах, а значит значение минимум 0%, а максимум 100% будет в каждом интервале. Если ставить натуральные цифры, то модель может перестать работать на новых данных, где на порядок больше будет нулей и единиц. Конечно, если речь просто об очистке от выбросов, то это может быть интересно. Но, выбросы могут быть как большие величины, так и очень маленькие - к примеру одно наблюдение за интервал. Выбросом может оказаться и такой вариант - когда нулей наблюдалось 10, а единиц только 2, в то время, как обычно нулей и единиц на порядок больше, т.е. это тогда чистка до преобразования в проценты нужна. Так же нужно сохранить информацию будет об исключенных данных - их месте, и объеме.

 
Aleksey Vyazmikin #:

Уверены, что сумму всех строк не нужно разделить на число строк?

=(I4+J4)/СУММ($I$4:$J$14)

Конкретно эта формула предназначена для расчёта весов - поэтому нет, иначе сумма этих весов не будет ровняться 1

Aleksey Vyazmikin #:

По самому методу - пока не осмыслил до конца.

Завтра в первой половине дня можем связаться через TeamViever и созвониться через телеграм или WhatsApp - в живом диалоге будет проще объяснить, там ничего сложного, в самих формулах и мне бывает трудно разобраться, а если понимаешь что, для чего и почему делается то всё становится ясно

Aleksey Vyazmikin #:

У нас данные в процентах, а значит значение минимум 0%, а максимум 100% будет в каждом интервале. Если ставить натуральные цифры, то модель может перестать работать на новых данных, где на порядок больше будет нулей и единиц. Конечно, если речь просто об очистке от выбросов, то это может быть интересно. Но, выбросы могут быть как большие величины, так и очень маленькие - к примеру одно наблюдение за интервал. Выбросом может оказаться и такой вариант - когда нулей наблюдалось 10, а единиц только 2, в то время, как обычно нулей и единиц на порядок больше, т.е. это тогда чистка до преобразования в проценты нужна. Так же нужно сохранить информацию будет об исключенных данных - их месте, и объеме.

Здесь я уже не во всём Вас понял ;)

Скажу лишь что этим способом можно также определить "выбросы" значения которых заметно меньше средних значений всей выборки (или в вашем случае интервала) - просто попробуйте поставить все значения по -400 и 500, а в одном 4 и 5

 
Alexandr Sokolov #:

Конкретно эта формула предназначена для расчёта весов - поэтому нет, иначе сумма этих весов не будет ровняться 1

Так сумма и не равна единице же.

Alexandr Sokolov #:

Завтра в первой половине дня можем связаться через TeamViever и созвониться через телеграм или WhatsApp - в живом диалоге будет проще объяснить, там ничего сложного, в самих формулах и мне бывает трудно разобраться, а если понимаешь что, для чего и почему делается то всё становится ясно

Ваш энтузиазм вдохновляет!

Спасибо за предложение!

Однако, пока я самостоятельно хочу понять что к чему, и задать Вам вопросы в случае необходимости.

Alexandr Sokolov #:

Здесь я уже не во всём Вас понял ;)


Скажу лишь что этим способом можно также определить "выбросы" значения которых заметно меньше средних значений всей выборки (или в вашем случае интервала) - просто попробуйте поставить все значения по -400 и 500, а в одном 4 и 5

Вот допустим такие данные у нас

Такой график

Итоговые расчетные столбцы выдают такие значения

На какие примеры выборки они говорят, как на выброс?

 
Aleksey Vyazmikin #:

Так сумма и не равна единице же.

Равна - проверьте, сумма весов для взвешенного среднего всегда равна 1, иначе это уже не взвешенное среднее

Aleksey Vyazmikin #:

На какие примеры выборки они говорят, как на выброс?

При таком наборе чисел этот способ выбросов не определил - там не важен сам уровень "корреляции", для определения выброса важно только то на сколько сильно CC далеко от среднего между двумя взвешенными коэффициентами

 
Alexandr Sokolov #:

Равна - проверьте, сумма весов для взвешенного среднего всегда равна 1, иначе это уже не взвешенное среднее

При таком наборе чисел этот способ выбросов не определил - там не важен сам уровень "корреляции", для определения выброса важно только то на сколько сильно CC далеко от среднего между двумя взвешенными коэффициентами

Понял, значит нужен другой какой то способ.

 

Странным образом, получаю хороший результат при прогнозе на 66 будущих периодов - точность - 0,67, но на 33 периода только 0,54. В обучении 116 периодов.

Причина обращения: