Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 2849

 
Aleksey Vyazmikin #:

nx é o número de elementos do mesmo. Como ele pode ser até 1 se for maior que 1?

Ele diminui de nx para 1. Por exemplo, 5:1 = (5,4,3,2,1) e 1:5 = (1,2,3,4,5).

Aleksey Vyazmikin #:

Em geral, o artigo enfatiza que você precisa conhecer a distribuição antes de aplicar o método em si.

Como de costume no matstat, um análogo empírico é construído a partir da amostra. Como a média em vez da expectativa, a frequência em vez da probabilidade ou a ECDF em vez da CDF.

 
Aleksey Nikolayev #:

Em termos gerais, você não é preguiçoso demais para derrubar árvores, mas é preguiçoso demais para afiar o machado.

A função de risco, a variante mais simples do R

As seções da curva próximas à linha horizontal correspondem a depressões no histograma, e aqui essas seções podem ser determinadas com mais precisão, pois não há conexão com o particionamento (como nos histogramas). Eu uso, por exemplo, ao estudar a distribuição das alturas dos joelhos em ziguezague.

Desculpe-me pelo possível mal-entendido da pergunta.
A função Huber pode ser considerada uma função de risco?
Ela parece ser calculada como você mostrou no R.
Só que, pelo que entendi, ela define um percentil de 10% para as emissões.
É possível aplicar a função de perda Huber como uma função de risco?

Ou isso é de outro tópico?
 
Aleksey Nikolayev #:

Diminui de nx para 1. Por exemplo, 5:1 = (5,4,3,2,1) e 1:5 = (1,2,3,4,5)

Como de costume no matstat, um análogo empírico é construído a partir da amostra. Como média em vez de expectativa, frequência em vez de probabilidade ou ECDF em vez de CDF.

Ok, então eu fiz o gráfico, o que faço com ele?

E como posso usar um histograma se x for o número de elementos na amostra?

Arquivos anexados:
 
Aleksey Vyazmikin #:

E como podemos fazer um histograma se x for o número de elementos na amostra?

X deve ser uma amostra (de alturas de coluna, no seu caso) classificada em ordem crescente. E a função deve ser crescente de zero a log(nx). Se, por exemplo, nx=5, então y=( log(5/5), log (5/4), log (5/3) , log (5/2) , log (5/1)) .


 
Roman #:

Ou é de uma ópera diferente?

Absolutamente diferente. Você está falando de uma das variantes da função de perda, enquanto nós estamos falando da função de risco cumulativo.

 
mytarmailS #:
E o treinamento de reforço?

Com o que você vai reforçar?

De qualquer forma, você não terá nenhuma inteligência, mas apenas um modelo do sistema nervoso autônomo, e isso ...

Talvez você consiga praticar alguns reflexos...

E onde está a inteligência? Onde estão os níveis de abstração? Onde está a esquizofrenia?

Onde está tudo isso em sua inteligência artificial?

 
Aleksey Nikolayev #:

Para X, deve haver uma amostra(de alturas de coluna, no seu caso) classificada em ordem crescente. E a função deve ser crescente de zero a log(nx). Se, por exemplo, nx=5, então y=( log(5/5), log( 5/4), log (5/3) , log (5/2) , log (5/1)).


Esclarecimento importante!

Então é assim?

E como transformar o histograma?

Arquivos anexados:
 
Aleksey Vyazmikin #:

Esclarecimento importante!

É isso mesmo?

E como converter o histograma, então?

Bem, você já pode ver as seções horizontais. Também é desconcertante que a amostra máxima que você tem aqui seja 400, enquanto antes era cerca de 60. Talvez você deva usar log(X) em vez de X, tendo descartado anteriormente os valores zero da amostra - isso permitirá que você veja a área de valores pequenos de X com mais detalhes.

De qualquer forma, não sei qual é sua tarefa em geral. O método responde apenas a uma pergunta específica que você tem - como separar a "cerca" mais alta das "árvores" mais baixas. O início de uma seção horizontal (ou próxima da horizontal em comparação com a inclinação média do restante da curva) é a cerca mais alta, e o final dessa seção é a árvore mais baixa. Não há nenhum ou há muito poucos pontos nessa seção, o que nos permite negligenciá-los.

 
Aleksey Nikolayev #:

Bem, agora você pode ver as seções horizontais. Também é desconcertante que a amostra máxima que você tem aqui seja 400, enquanto antes era cerca de 60. Talvez você deva usar log(X) em vez de X, tendo previamente descartado os valores zero da amostra - isso permitirá que você veja a região de valores pequenos de X com mais detalhes.

Transformei X, mas ainda não entendi o que você viu lá - e como automatizar o processo de definição de coordenadas nele para selecionar o intervalo desejado.

Você pode citar as coordenadas específicas onde o "gráfico suave" começa? E havia um gráfico horizontal e, em seguida, um movimento em um ângulo agudo - ele não conta mais - até o primeiro gráfico suave ou o quê?

Aleksey Nikolayev #:

De qualquer forma, não sei qual é o seu problema em geral. O método responde apenas a uma pergunta específica sua - como separar a "cerca" mais alta das "árvores" mais baixas. O início de um segmento horizontal (ou próximo da horizontal em comparação com a inclinação média do restante da curva) é a cerca mais alta, e o final desse segmento é a árvore mais baixa. Não há pontos ou há muito poucos pontos nessa seção, o que nos permite negligenciá-los.

O objetivo é encontrar preditores que descrevam a natureza das sequências.

Arquivos anexados:
 
Aleksey Vyazmikin #:

Converti o X também, mas ainda não entendi o que você viu ali - e como automatizar o processo de definição de coordenadas nele para selecionar o intervalo desejado.

Você pode citar as coordenadas específicas onde o "gráfico suave" começa? E havia um gráfico horizontal e, em seguida, um movimento em um ângulo agudo - isso não conta mais - até o primeiro gráfico suave ou o quê?

O objetivo é encontrar preditores que descrevam a natureza das sequências.

Na primeira figura, o gráfico horizontal óbvio vai de aproximadamente 2,4 a 3.

Se fosse, por exemplo, uma amostra das alturas dos joelhos de um ziguezague, essa seria uma oportunidade de entrar na quebra do primeiro nível e obter lucro no segundo.

Se fosse, por exemplo, uma amostra da vida útil de uma oportunidade de arbitragem, é melhor entrar naquelas que sobreviveram ao primeiro nível.

Não há força, tempo ou desejo de pensar sobre como exatamente você pode usar essa curva. Já lhe disse várias vezes que sou um oponente da ideia de "trabalho conjunto" no fórum. Vejo o benefício apenas em uma discussão superficial de questões teóricas individuais.

Razão: