Discussão do artigo "Florestas Aleatórias na Previsão das Tendências" - página 8

 
Demi:

Não, não está claro - eu não tenho um gato e duvido que a temperatura de qualquer animal de estimação seja relevante para as informações de câmbio.

A propósito, acredito 100% que a dinâmica da temperatura do gato terá uma correlação diferente de zero com a série de preços de um instrumento financeiro

Bem, você afirmou anteriormente que todos os dados têm poder de previsão. É claro que estamos falando de previsão de mercados financeiros.

Se o poder de computação de nossos computadores nos permitisse usar todas as informações disponíveis, inclusive a temperatura do gato, ela seria simplesmente eliminada do processo de cálculo. Mas como os recursos são limitados, temos de usar nossa própria cabeça.Quanto à correlação, o fato de ela ser diferente de zero é um dado, zero raramente pode acontecer. Mas é quase zero. Em geral, compre um gato, coloque um termômetro nele e verifique )) Talvez você tenha sorte e ele o torne rico ).

 
meat:

Agora, você disse anteriormente que todos os dados têm poder de previsão. É claro que estamos falando de previsão dos mercados financeiros.

Se o poder de computação de nossos computadores nos permitisse usar todas as informações disponíveis, inclusive a temperatura do gato, elas seriam simplesmente descartadas no processo de cálculo. Mas como os recursos são limitados, temos que usar nossa própria cabeça.Sobre a correlação, o fato de ela ser diferente de zero - nem é preciso dizer que zero em geral raramente acontece, mas quase zero. Em geral, compre um gato, coloque um termômetro nele e verifique )) Talvez você tenha sorte e ele o torne rico )

você está mentindo - cito a mim mesmo"Eu lhe dou a resposta à sua pergunta - há algum "poder preditivo" em todos os dados. E daí? Há algum tipo de informação em todos os dados de câmbio".

Se você tiver um conjunto de centenas de milhares de observações, a questão da potência do computador seria relevante.

 
Demi:

você está mentindo - cito a mim mesmo"Eu lhe dou a resposta à sua pergunta - há algum "poder preditivo" em todos os dados. E daí? Há algum tipo de informação em todos os dados de forex.".

carne:

Você afirmou anteriormente que há poder de previsão em todos os dados

E qual é a mentira?

 
meat:

E qual é a mentira?

Eu me decodifiquei na segunda frase.
 
Demi:
Eu me decodifiquei na segunda frase.

Ou seja, informação = poder de previsão? Como você pode ter tanta certeza disso? Se eu lhe disser alguns dos "dados de câmbio", você poderá prever o preço com base neles?

Não há apenas câmbio, mas também mercados de ações, mercados de commodities e muitas outras coisas.... Tudo está interconectado.

 

faa1947:

Tenho uma dúzia de clientes aqui. Antes de se comunicarem comigo, todos estavam alegres e animados, mas agora estão tristes e pensativos.

Não multiplique a tristeza)))
 

faa1947, mostre como seu modelo funciona no exemplo abaixo. A primeira coluna é a série modelada, a segunda e a terceira colunas são os preditores. Qual é o poder de previsão desses preditores?

-0.35742 0.461646 -0.81907
0.431277 0.004545 0.426731
-0.00018 -0.4037 0.403528
-0.08575 0.90851 -0.99426
0.773826 0.008975 0.764852
0.426905 -0.96485 1.391757
0.253233 0.487955 -0.23472
0.20994 0.880554 -0.67061
-0.09929 0.160276 -0.25956
0.332911 -0.08736 0.420268
0.032258 0.360106 -0.32785
0.253027 -0.06859 0.321621
-0.66668 -0.54985 -0.11683
-0.5476 -0.13231 -0.41529
-0.75652 0.536488 -1.29301
-0.66109 -0.87314 0.212052
-0.09993 -0.86293 0.763
0.014625 0.715032 -0.70041
-0.48345 -0.62666 0.143206
-0.03596 0.935653 -0.97161
-0.17023 0.678024 -0.84826
0.293376 0.079529 0.213847
0.002922 0.754594 -0.75167
0.329194 -0.05535 0.384546
0.639423 -0.41358 1.053007
0.431631 -0.60334 1.034973
0.59125 0.497989 0.093262
0.266098 -0.79645 1.062549
-0.02624 0.643164 -0.6694
0.055014 -0.46214 0.517154
0.436132 -0.89992 1.336052
-0.30143 0.628619 -0.93005
-0.12168 0.886467 -1.00814
-0.10851 -0.0507 -0.0578
-0.74573 -0.50921 -0.23653
-0.574 0.244825 -0.81883
-0.87313 0.336188 -1.20932
-0.00344 0.117363 -0.1208
-0.20265 0.424326 -0.62697
0.177873 -0.17967 0.357541
 
gpwr:


Qual é o poder de previsão desses preditores?

Aparentemente, os números não são aleatórios. Verifiquei isso de forma muito simples: gerei três linhas de 40 linhas aleatoriamente e apliquei o neurônio a elas. Em dados aleatórios, a capacidade de generalização é visivelmente pior do que nos dados mencionados acima.
 
Reshetov:
Aparentemente, os números não são aleatórios. Verifiquei isso de forma muito simples: gerei três linhas de 40 linhas aleatoriamente e apliquei o neuronka a elas. Em dados aleatórios, a capacidade de generalização é visivelmente pior do que nos dados mencionados acima.
Eu estaria interessado em diferentes abordagens algorítmicas universais para determinar a capacidade de previsão desses dois preditores. Econometria, neurônica e redes profundas são bem-vindas. Mostre-nos o que eles podem fazer. Você pode mostrar algum parâmetro que caracterize a capacidade preditiva desses preditores (coeficiente de correlação, informações mútuas, RMS e outras invenções) ou mostrar a comparação da saída do modelo e da série simulada.
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
Применение метода собственных координат к анализу структуры неэкстенсивных статистических распределений
  • 2012.06.21
  • MetaQuotes Software Corp.
  • www.mql5.com
Центральной проблемой прикладной статистики является проблема принятия статистических гипотез. Долгое время считалось, что эта задача не может быть решена. Ситуация изменилась с появлением метода собственных координат. Это очень красивый и мощный инструмент структурного исследования сигнала, позволяющий увидеть больше, чем доступно методами современной прикладной статистики. В статье рассмотрены вопросы практического использования данного метода и приведены программы на языке MQL5. Рассмотрена задача идентификации функций на примере распределения, полученного Хилхорстом и Шером.
 
gpwr:
Eu estaria interessado em diferentes abordagens algorítmicas universais para determinar a capacidade de previsão desses dois preditores. Econometria, neurônica e redes profundas são bem-vindas. Mostre-nos o que eles podem fazer. Você pode mostrar algum parâmetro que caracterize a capacidade preditiva desses preditores (coeficiente de correlação, informações mútuas, RMS e outras invenções) ou mostrar a comparação entre o resultado do modelo e a série simulada.
  1. O termo "capacidade de previsão" é coisa de cartomantes, videntes, xamãs e outros econometristas. No aprendizado de máquina, é possível calcular a capacidade de generalização e, mesmo assim, apenas aproximadamente
  2. Não há dados suficientes, ou seja, estamos lidando com dados pequenos (apenas 40 exemplos) e, portanto, as estimativas da capacidade de generalização podem ser superestimadas, ou seja, um dedo no céu.

Coloquei a amostra em um formato adequado para classificação binária, ou seja, para calcular a variável dependente e ver se ela está acima ou abaixo de zero (arquivo CSV no arquivo anexo), pesquisei com a libVMR e obtive este modelo:


/**
* A qualidade da modelagem:
*
* TruePositives: 9
* TrueNegatives: 11
* FalsePositives: 0
* FalseNegatives: 0
* Sensibilidade da capacidade de generalização: 100.0%
* Especificidade da capacidade de generalização: 100,0%
* Capacidade de generalização: 100,0%
*/
double x0 = 2,0 * (v0 + 0,96485) / 1,900503 - 1,0;
double x1 = 2,0 * (v1 + 1,00814) / 2,399897 - 1,0;

y = 0,12981203254657206 + 0,8176828303879957 * x0 + 1,0 * x1 -0,005143248786272694 * x0 * x1;


O segredo da "alta generalização" de sua amostra é revelado: o valor da primeira coluna é a soma dos valores das outras duas colunas.

libvmr
libvmr
  • code.google.com
VMR - machine learning library
Arquivos anexados:
test.zip  1 kb