mytarmailS #:
Um exemplo concreto:
Existe uma regra lógica que prevê algo com 80% de probabilidade tanto no comboio como no teste e validação cruzada, etc... Mas nos dados de validação (dados novos absolutamente desconhecidos) a regra funciona a nível aleatório...

Há outra regra que se comporta da mesma forma que a primeira num comboio, testa e passa a validação também sem problemas, ou seja, é um padrão real...

Pergunta : como posso distinguir uma regra da outra na fase de comboio, teste, validação cruzada... antes da fase de validação...

Pergunto-me se existem alguns sinais pelos quais possamos traçar a linha entre um e outro, talvez alguns testes estatísticos de aleatoriedade ou determinismo, etc...

A questão da aleatoriedade/continuidade é uma pedra angular para todo o algo e para o ML em algo.

Muitos de todos os tipos de truques e truques.


O mais fácil é ver como você conseguiu o resultado. Se o melhor resultado que tiveres... escolhendo o melhor resultado do conjunto - é claro, a probabilidade de encaixe é muito alta (especialmente se a maioria dos outros resultados for sobre nada). Os resultados do teste. Como os conseguiu? - Claro que, se você pegou os 5% melhores na bandeja, correu todos no teste, selecionou os melhores no teste - claro, a probabilidade de encaixe ainda não é pequena (especialmente se o resultado médio dos outros não for muito). Este "como não o fazer" irá, tenho a certeza, reduzir a probabilidade de ser equipado em excesso de forma muito decente. É por esta razão que eu não vejo como o robô/modelo de outra pessoa pode ser avaliado com equidade - de jeito nenhum.


Além disso, como dito, todo o tipo de truques e truques.

 
Replikant_mih #:

A questão da aleatoriedade/leialidade é uma questão fundamental para todo o algo e para o ML em algo.

É tudo coisas óbvias, oleado... Interessado em truques específicos

==============================

Por exemplo, como variante, análise de superfície de otimização (RP) de TC, regras, AMO e assim por diante...

Por exemplo, a intersecção OD TC de dois vagões por "fator de recuperação" alvo.

É claro que este TS não está a funcionar, nunca esteve e nunca estará


=======================================

E aqui está um TS que funciona em PP, que é muito estável, faz um lucro até agora (Valery sabe :) )


Por assim dizer, sinta a diferença.

 

Por isso, tenho uma ideia obsessiva de que se vires a DO do TC, podes dizer o que é e se vai funcionar com os novos dados...

Mas é longo e complicado contar a DO, talvez ela possa ser contornada de forma mais elegante e menos demorada do ponto de vista dos recursos computacionais.

 
mytarmailS #:

Eu tenho alguma ideia de como algo-traders fazem isso. Não faço ideia de como os cientistas de dados o fazem. E eu sei exactamente como o faço)).


A superfície de otimização, como eu a entendo, é (neste caso) um espaço tridimensional, onde 2 eixos são eixos de parâmetros (modelo, estratégia) e um é a métrica alvo. Sim, claro que pode passar por isso. Eu tenho algumas maneiras, e se necessário, posso pensar noutra coisa. Mas agora estou a vir do outro lado. E claro que não há desejo de compartilhar informações úteis com alguém que entra com"É tudo coisa óbvia, borboletas").

 
mytarmailS #:
Nem sempre é possível rastrear a causalidade

Então só podem ser feitas suposições sobre as causas e a presença de um padrão. As causas são primárias, o comportamento é secundário. Na AT, por vezes esquecem-se da primazia das causas e tomam as repetições aleatórias de comportamentos como padrões, que não o são.

 
Replikant_mih #:

Eu tenho alguma ideia de como algo-traders fazem isso. Não faço ideia de como os cientistas de dados o fazem. E eu sei exactamente como o faço).


A superfície de optimização, tal como a entendo, é (neste caso) um espaço tridimensional, onde 2 eixos são eixos de parâmetros (modelo, estratégia) e um é a métrica alvo. Sim, claro que pode passar por isso. Eu tenho algumas maneiras, e se necessário, posso pensar noutra coisa. Mas agora estou a vir do outro lado. E, claro, não há desejo de compartilhar informações úteis com alguém que entra com"É tudo coisa óbvia, borboletas").

Olha, se a tua resposta à pergunta é: Muitos truques e truques. E além disso, como dito, todo o tipo de truques e truques.

Obrigado por este conhecimento profundo, que definitivamente não é "óleo amanteigado".

Tente responder em sites especiais como SA ou CV, é interessante quantas vantagens você terá ...

Se estás tão incomodado, podes sempre chorar ))

 
mytarmailS #:

Ainda bem que gostaste).

 
Valeriy Yastremskiy #:

Então só pode haver suposições sobre as causas e a presença de um padrão. As causas são primárias, o comportamento é secundário. Na AT, por vezes esquecem-se da primazia das causas e tomam as repetições aleatórias de comportamentos como padrões, que não o são.

Concordo, é uma questão complicada...

Por isso é necessário entrar na matemática para ter uma resposta, não "muitos truques e truques".

 

1) Penso que é óbvio que não há e não pode haver nenhuma maneira de provar que um padrão estabelecido na história funcionará necessariamente no futuro.

2) A existência de um método que estabeleça um padrão determinístico (não aleatório) para o futuro, baseado em dados do passado, seria uma negação de (1)

Temos apenas a validação cruzada, que só pode estabelecer a homogeneidade de um padrão sobre a história. Só podemos interpolar o padrão, não extrapolá-lo. Temos apenas uma PROPOSTA muito fraca de que um padrão bem interpolado acabará por ser bem extrapolado. Isto não é uma inferência dedutiva, mas meramente indutiva - uma variante da inferência por analogia.

 
Aleksey Nikolayev #:

1) Penso que é óbvio que não há e não pode haver nenhuma maneira de provar que um padrão estabelecido na história funcionará necessariamente no futuro.

2) A existência de um método que estabeleça a determinação (não aleatória) de um padrão para o futuro por dados do passado seria uma negação de (1)


Então, qual é a evidência de (1) e quais são os argumentos para a sua validade?
