Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3131

[Excluído]  
Aleksey Vyazmikin #:

Em parte, você está certo, mas não entendo a filosofia de embaralhar tudo - isso certamente funciona se não houver um desvio irrecuperável, por exemplo, com a ciclicidade.

Para começar, eu gostaria de classificar os diferentes tipos de desvios e, em seguida, trabalhar com eles individualmente - se a causa for conhecida, poderemos pensar em uma maneira de eliminá-la. E, se não for possível eliminá-la, então detectá-la (detecção).

a randomização remove o viés entre o teste e o controle, depois disso o impacto do preditor é avaliado

Se você não remover o viés antes disso, será uma relação associativa, não causal.


 
Maxim Dmitrievsky #:
Todo esse conteúdo maravilhoso pode ser colocado em um tópico separado?

Eu já terminei

 
mytarmailS #:

Você pode me mostrar algo assim?

Se for assim tão comum.

O que há de tão difícil nisso? Pular entre escalas é algo que já fizemos antes, não há segredos. Estou procurando coisas mais complicadas, e uma imagem com apenas um negócio não revela a essência de toda a imagem.
 
Renat Akhtyamov #:

Finalmente!

Bem, já é um começo.

O que vem a seguir?

Este é o fim do estudo))))
 
spiderman8811 #:
O que há de tão difícil nisso? Pular entre escalas é algo que já fizemos antes, não há segredos aqui. Estou procurando coisas mais complicadas, e uma imagem com apenas um negócio não revela a essência de toda a imagem de forma alguma.

Estou vendo.

Não é difícil escrever cartas.

 
mytarmailS #:

Eu entendo.

Não é difícil de soletrar, é claro.

Você já viu meu trabalho como freelancer? ))))

 
spiderman8811 #:

Você já viu meu trabalho como freelancer? ))))

Que metodologia pode ser usada para avaliar a qualidade das ofertas ao ver um perfil de freelancer?

 
Maxim Dmitrievsky #:

A randomização elimina o viés entre o teste e o controle, após o que o impacto do preditor é estimado

Se o viés não for removido antecipadamente, ele será associativo e não causal.


O padrão ouro

Na lição anterior, vimos por que e como a associação é diferente da causalidade. Também vimos o que é necessário para que uma associação se torne uma relação causal.

E|Y|T = 1] - E[Y|T = 0] = E[Y - Yo|T = 1] + {E[Yo|T = 1] - E[Yo|T = 0]} COM AJUSTE.

Lembre-se de que a associação se torna causalidade se não houver viés. Não haverá viés se E[Yo T = 0] = E[Yo T = 1]. Em outras palavras, a associação será causal se os pacientes tratados e de controle forem iguais ou comparáveis, exceto pelo tratamento. Ou, para colocar em termos mais técnicos

Acima está uma tradução da imagem.

Para começar, não consigo entender em que ponto você quer dividir a amostra em duas subamostras.

Em seguida, aparentemente há uma terminologia especial aqui, a causalidade é um efeito direto em um resultado, talvez nem mesmo um padrão probabilístico mais. Uma relação associativa é um ativador da causa ou um recurso associado, e geralmente é probabilística.

Não entendo a fórmula - expor o ponto em termos humanos?

Mas o objetivo desses métodos (UpLift) é estimar o fator que influenciou exclusivamente o alvo. Entendo que o grau de influência é avaliado. Digamos que, em nosso caso, não conheçamos esse fator e analisemos tudo - obtemos algumas medidas como resultado. E o que você sugere que façamos com elas? Excluir indicadores ruins?
Como podemos usar isso com o desvio gradual dos dados?

Não excluo, talvez você tenha pensado em algo brilhante, mas ainda não entendi a linha de pensamento.

[Excluído]  
Aleksey Vyazmikin #:

O padrão ouro

Na lição anterior, vimos por que e como a associação é diferente da causalidade. Também vimos o que é necessário para que uma associação seja uma relação causal.

E|Y|T = 1] - E[Y|T = 0] = E[Y - Yo|T = 1] + {E[Yo|T = 1] - E[Yo|T = 0]} COM AJUSTE.

Lembre-se de que a associação se torna causalidade se não houver viés. Não haverá viés se E[Yo T = 0] = E[Yo T = 1]. Em outras palavras, a associação será causal se os pacientes tratados e de controle forem iguais ou comparáveis, exceto pelo tratamento. Ou, para colocar em termos mais técnicos

Acima está uma tradução da figura.

Para começar, não consigo entender em que ponto você deseja dividir a amostra em duas subamostras.

Em seguida, aparentemente há uma terminologia especial aqui, a causação é uma influência direta no resultado, talvez nem seja mais um padrão probabilístico. Uma relação associativa é um ativador da causa ou um recurso associado, e geralmente tem um significado probabilístico.

Não entendo a fórmula - você pode me dar a essência dela em termos humanos?

Mas o objetivo desses métodos (UpLift) é estimar o fator que influenciou exclusivamente o alvo. Entendo que o grau de influência é avaliado. Digamos que, em nosso caso, não conheçamos esse fator e analisemos tudo - obtemos algumas medidas como resultado. E o que você sugere que façamos com elas? Excluir indicadores ruins?
Como usá-lo em caso de desvio gradual dos dados?

Não excluo, talvez você tenha pensado em algo engenhoso, mas ainda não entendi a linha de pensamento.

você pode pedir ao chatgpt a decodificação da fórmula se não entender algum dos símbolos.

Y|T = 1 - resultados do grupo de teste (com tratamento)

Y|T = 0 - grupo de controle (sem)

Y - rótulo de classe, Y0,Y1 - rótulos de classe sem e com o tratamento.

T - tratamento introduzido no modelo (incluindo o preditor) ou não introduzido (1;0)

E - expectativa

Divida em qualquer ponto ao dividir por teste e traço

Se você não fizer a mistura, obterá uma estimativa tendenciosa de ATE+vieses

ATE é o efeito médio do tratamento da exposição

Sonolento, talvez eu tenha confundido as letras em alguns pontos, mas a lógica deve estar clara

[Excluído]  

A propósito, o bard do Google é mais do meu agrado do que o gpt. Ele pode pesquisar no Google e é gratuito.

mas só suporta inglês e vpn nos EUA ou na Inglaterra, não funciona em outros países.

E, basicamente, quem é a openAI e quem são os Googles. Provavelmente categorias de peso diferentes.