Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 75

 
Yury Reshetov:

É por isso que o Dr.Trader não pôde executar uma libVMR completa reescrita em R - demasiados cálculos e demasiado consumo de memória.

Eu tive um erro no meu código na função de conversão do kernel grande. O Atach tem a mesma versão antiga 3.01, mas com correcção. A memória agora está bem, assim como o grande kernel. Mas será mais lento que o Java.

Arquivos anexados:
libVMR.txt  12 kb
 
Dr. Trader:

Eu tinha um bug no meu código na grande função de conversão do kernel. O Atach tem a mesma versão antiga 3.01, mas com uma correcção. A memória está OK agora, assim como a grande máquina do kernel. Mas a velocidade é mais lenta que a do java.

A coisa mais nojenta é que a velocidade é abaixo do rodapé.

Também a libVMR é um classificador binário, o que não é bom. O Ternary pode fazer um objecto doce de merda:

Mihail Marchukajtes:
No próprio preditor o nível de generalização dos dados é 90%, mas no modelo descarregado é apenas 47% Não está claro.... E ainda não funcionou em MQL....
Ou seja, o classificador binário generaliza apenas 47% dos exemplos, o que é muito pior do que o aleatório - 50%. E o ternário um filtra o lixo, obtendo já 90% de capacidade de generalização sobre os restantes exemplos.
 
Aumentou lentamente o nível de generalização do modelo para 100%, vamos ver como funciona no futuro :-)
 
Mihail Marchukajtes:
Lentamente aumentei o nível de generalização do modelo até 100%, vamos ver como funciona no futuro :-)

100% generalisabilidade não é o limite. Podemos melhorá-la ainda mais, selecionando os preditores por viés. Se dois classificadores ternários têm 100% de capacidade de generalização, mas vieses diferentes, então o classificador com o viés mais baixo será melhor - ele tem preditores mais significativos.

Quanto menor o viés, menos exemplos na amostra de teste são marcados com um traço (incerteza).

 
Yury Reshetov:

100% generalisabilidade não é o limite. Ela pode ser ainda melhorada através da seleção de preditores por viés. Se dois classificadores ternários têm 100% de generalizabilidade, mas vieses diferentes, o classificador com o menor vieses será o melhor, pois tem preditores mais significativos.

Quanto menor o viés, menos exemplos na amostra de teste são marcados por traços (incerteza).

LLong eu tenho estado interessado e posso dizer que fiquei intrigado com a pergunta. O que significa o parâmetro Indicador por Reshetov e seu significado? O que significa? E o Bias é igual a zero no meu treino com 100% de generalização...
 
Mihail Marchukajtes:
Há muito tempo que me pergunto e me pergunto. O que significa Indicador por parâmetro Reshetov e o que significa? O que é que isso significa?

A questão é que é um bom indicador da capacidade de aprendizagem, mas não faz qualquer sentido para a capacidade de generalização. É por isso que o vou remover nas próximas versões do jPrediction, para não ser um incómodo.

 
Yury Reshetov:

A questão é que é um bom indicador da capacidade de aprendizagem, mas não faz qualquer sentido para a capacidade de generalização. É por isso que nas próximas versões do jPrediction eu vou removê-lo para torná-lo menos incômodo.

Yuri, uma pergunta. O preditor pode dar probabilidades em vez de aulas?
 
Será que isto nos vai ajudar de alguma forma https://news.mail.ru/society/26600207/?frommail=10
 
Alexey Burnakov:
Yuri, uma pergunta. Pode um prognosticador dar probabilidades em vez de aulas?
Se por probabilidade você se refere ao grau de expressão da característica, então sim, pode. Mas não em comitê, porque sai 0 ou 1 ou -1, mas em binário. Construa um modelo t em todo o mercado e você verá como o modelo salta acima de zero e quanto maior o zero, mais provável é a classe. Mas em termos percentuais....mmm... bem, a menos que você pegue o valor máximo como 100% e calcule a partir dele. Suponha que eu tenho um sinal de compra e o modelo está acima de zero com um valor de, digamos, 0,1, e o valor máximo era 1, eu sei que este sinal de compra tem um estado de verdade de 10%, como este.... se é isso que eu penso que é....
 
Alexey Burnakov:
Yuri, uma pergunta. Um preditor pode produzir probabilidades em vez de aulas?

Não, as probabilidades foram calculadas em versões muito antigas da libVMR, mas havia um grande problema: todos os preditores devem ser estritamente independentes uns dos outros para calcular corretamente o valor da probabilidade. E fazer cumprir tal condição em muitas áreas de aplicação não é de todo realista. Por exemplo, quase todos os indicadores e osciladores na negociação estão correlacionados entre si, ou seja, não são independentes. Além disso, a condição de independência no algoritmo, na sua ausência nos dados, tem um impacto negativo sobre a capacidade de generalização. Por isso, uma tal direcção sem saída teve de ser abandonada.

Agora o jPrediction não presta atenção à independência dos preditores, mas apenas ao valor da generalização. Isto porque vários preditores podem se complementar, ou seja, alguns exemplos darão bons resultados para alguns preditores, outros para outros e combinações de preditores para outros. O cálculo das probabilidades sob tais condições pode ter uma margem de erro muito grande e altamente questionável.