Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 1273

 
Aleksey Vyazmikin:

Não sei como você pensa, mas os termos apenas distorcem a essência do pensamento, a menos que estejamos falando de axiomas, há muito estabelecidos e não verificáveis.

Não se pode dar uma analogia, a referência à terminologia é improdutiva.

Todas as analogias se desfarão contra a parede das suas fantasias. Eu dei-te muitos ontem, mas não percebeste nenhum deles.

Stirlitz continuou de pé, era a tortura favorita de Mueller.

Se lhe agrada pensar que um agente está a influenciar o seu oponente de propósito, que é algum tipo de estratégia especial, então pense

e ele simplesmente passa por suas opções, jogando muitas vezes com os adversários, e para cada caso ele escolhe as melhores estratégias (se ganhar ele recebe recompensas), se perder ele é penalizado. Como resultado, ele tem experiência na forma de um NS bem usado que leva em conta muitas combinações de jogo diferentes e pode prever o resultado de cada uma delas, então ele age de acordo com as melhores previsões. Se o adversário muda o estrato, o NS vê-o e reage com outro estrato, activando outros neurónios. E da mesma forma, quando o mercado muda, a NS faz previsões diferentes.

 
Aleksey Vyazmikin:

Não sei como você pensa, mas os termos só distorcem a essência do pensamento, a menos que estejamos falando de axiomas, há muito estabelecidos e não verificáveis.

Não se pode dar uma analogia, a referência à terminologia é improdutiva.

Alexey, você está fazendo spam para ser honesto e eu entendo porque, durante todo o tempo que você escreveu muitas cartas aqui, você escreveu uma única linha de código que apoiaria suas palavras e conjecturas?

Tenho a certeza que não o fiz.

O triste é que quando você pede algum material para aumentar sua consciência sobre um assunto atual, você facilmente o descarta porque está em uma língua que você não está familiarizado, quão difícil pode ser usar tradutores?

Em relação às probabilidades, apenas uma rede neural é treinada em cenários históricos com resultados 100% conhecidos e só após a aplicação da rede treinada, você obtém uma resposta para a situação não 100%, mas probabilística, então com base na lógica que será você, você (outra rede) decidirá o que fazer, assim, eventualmente você obtém uma rede viva, suas decisões e resultados não serão possíveis de prever.

 
Maxim Dmitrievsky:

todas as analogias vão quebrar a parede das suas fantasias. Eu dei-te muitos ontem, mas não percebeste nenhum deles.

Stirlitz continuou de pé, era a tortura favorita de Mueller.

Se lhe agrada pensar que um agente está a influenciar o seu oponente de propósito, que é algum tipo de estratégia especial, então pense

e ele simplesmente passa por suas opções, jogando muitas vezes com os adversários, e para cada caso ele escolhe as melhores estratégias (se ganhar ele recebe recompensas), se perder ele é penalizado. Como resultado, ele tem experiência na forma de um NS bem usado que leva em conta muitas combinações de jogo diferentes e pode prever o resultado de cada uma delas, então ele age de acordo com as melhores previsões. Se o adversário muda o estrato, o NS vê-o e reage com outro estrato, activando outros neurónios. Da mesma forma, quando o mercado muda, a NS muda as suas previsões.

Escreve-o correctamente, estou a discutir isso? Não, eu estou argumentando que a escolha vem daquelas ações que podem ter impacto no meio ambiente, no adversário ou na inação. Sim, a pessoa recebe uma recompensa por influenciar o adversário e assim mudar a probabilidade do resultado geral do evento (jogo), enquanto o trader não tem exatamente tal oportunidade em ação e isto afeta significativamente o vetor de ação. Talvez se dividirmos a acção em três grupos, vemos que é o impacto no adversário que mais contribui para o resultado global, ou seja, é a acção significativa que leva ao resultado global positivo que mais afecta o resultado global.

Se ainda não consegui fazer entender o meu ponto de vista, acho que já tentei o suficiente, pois já estou a criar uma imposição, enquanto só queria partilhar as minhas observações.

 
Farkhat Guzairov:

Alexey, para ser honesto, você está apenas fazendo spam e eu entendo porque, por todo o tempo que você escreveu aqui muitas cartas, você escreveu uma única linha de código que poderia apoiar suas palavras e conjecturas?

Tenho a certeza que não o fiz.

O triste é que quando você pede algum material para aumentar sua consciência sobre um assunto atual, você facilmente o descarta porque está em uma língua que você não está familiarizado, quão difícil pode ser usar tradutores?

Em relação às probabilidades, apenas uma rede neural é treinada em cenários históricos com resultados 100% conhecidos e após a aplicação da rede treinada, você receberá uma resposta sobre uma situação não 100%, mas probabilística, então com base na lógica que será você, você (outra rede) decidirá o que fazer, assim eventualmente você terá uma rede viva, cujas decisões e resultados não serão possíveis de prever.

Não eu não escrevi nenhum código no jogo StarCraft 2, nem consegui encontrar como fazer bots, ou seja, o intelecto lá pode ser programado por gatilhos, e intervenção direta no código, tipo de proibido, como relatado, mas é possível acessar a memória utilizada pelo StarCraft (1) e há muito tempo há competições. No entanto, alguém aqui publicou o código no jogo?

Sim, o material foi-me dado (Maxim é bom em termos de trabalho com literatura/informação estrangeira), mas eu pedi uma definição do termo, e além disso, estimei que o material continha mais informação do que eu poderia encontrar sobre as extensões da Internet de língua russa.

Não entendi a sua mensagem sobre os princípios do MoD. O que quiseste dizer com isso?

 
Aleksey Vyazmikin:

Não, eu não escrevi nenhum código no jogo StarCraft 2, nem consegui descobrir como os bots são feitos, ou seja, a inteligência lá pode ser programada com gatilhos, e a interferência direta com o código é meio proibida, como relatado, mas é possível acessar a memória usada pelo StarCraft (1) e há competições de longa duração lá. No entanto, alguém aqui publicou o código no jogo?

Sobre o StarCraft 2, ninguém está mexendo diretamente no código do jogo, nem existe uma API para recuperar dados do jogo, as coisas são muito mais simples. Os bots aprendem com base em imagens gráficas, apenas capturas de ecrã, ou seja, obtêm exactamente a mesma informação que uma pessoa, mas utilizam-na de forma muito mais eficiente do que um jogador médio.

 
Farkhat Guzairov:

Sobre o StarCraft 2, ninguém está mexendo diretamente no código do jogo, nem existe uma API para recuperar dados do jogo, tudo é muito mais simples. Os bots aprendem com base em imagens gráficas, simplesmente screenshots, o que significa que obtêm exactamente a mesma quantidade de informação que um humano, mas gerem-na de forma muito mais eficiente do que um jogador estatístico médio.

Estou a falar principalmente da aplicação do modelo. Podes ler sobre isso aqui.

История соревнований ИИ по Starcraft
История соревнований ИИ по Starcraft
  • habr.com
Начиная с первого Starcraft AI Competition, проведённого в 2010 году, тема искусственного интеллекта в стратегиях реального времени (RTS) становится всё более популярной. Участники таких соревнований представляют своих ИИ-ботов Starcraft, которые сражаются в стандартной версии Starcraft: Broodwar. Эти соревнования по играм RTS, вдохновлённые...
 
Aleksey Vyazmikin:

Estou a falar principalmente da aplicação do modelo. Você pode ler sobre isso aqui, por exemplo.

No meu post sobre o código, eu estava fazendo uma pergunta retórica, porque muito foi escrito neste tópico, mas muito poucas pessoas acabaram sendo capazes de aplicar pelo menos 5% do que foi discutido aqui. Você pessoalmente fez alguma coisa como resultado?

Sobre os modelos aplicáveis, sim são todos similares (jogos, previsões meteorológicas, mercados, etc), a questão aqui é o que você alimenta no MO, não como ele será tratado dentro do MO, as pessoas ainda não entendem como eles vão acabar com o que eles recebem do MO, esse é todo o problema. Neste aspecto é mais fácil com jogos, porque há uma matriz pronta de dados de entrada, mas em todas as outras áreas você tem que inventar seus próprios métodos de pré-processamento.

 
Farkhat Guzairov:

No meu post sobre o código, eu estava fazendo uma pergunta retórica porque muito foi escrito neste tópico, mas muito poucas pessoas acabaram sendo capazes de aplicar pelo menos 5% do que foi discutido aqui. Você pessoalmente fez alguma coisa como resultado?

Sobre os modelos aplicáveis, sim são todos similares (jogos, previsões meteorológicas, mercados, etc), a questão aqui é o que você alimenta no MO, não como ele será tratado dentro do MO, as pessoas ainda não entendem como eles vão acabar com o que eles recebem do MO, esse é todo o problema. Neste aspecto é mais fácil com os jogos, porque já existe uma matriz pronta de dados de entrada, mas em todas as outras áreas você tem que inventar seus próprios métodos de pré-processamento.

Bem, você mesmo não leu a informação com a qual começou a discutir, e me acusou acima. OK, todas as pessoas são parecidas.

Mais uma vez não entendo a pergunta, sobre "você pessoalmente fez algo como resultado" - desdobrá-lo, em que tipo de resultado, e o que eu deveria ter feito pessoalmente? Se você está falando da minha aplicação de MO, então sim, estou trabalhando nesta questão de várias maneiras (criação de modelos, seleção, aplicação) - escrevi muito aqui sobre minhas conquistas.

É isso mesmo, nem todos os modelos são semelhantes, e os preditores são sim extremamente significativos. Um sistema complexo consiste em diferentes modelos, incluindo diferentes tipos (árvores/NS), dizem os mesmos especialistas de Yandex, por exemplo.

 

A propósito, note que o homem estava perdendo por cometer erros nas ações (clicando torto/esquecimento para ativar uma habilidade), mas foi capaz de vencer usando um movimento tático não-padrão - distraindo constantemente o oponente ao pousar na parte de trás da base do oponente, o que o forçou a destacar suas tropas para atacar a base do homem, o que deu ao homem tempo para desenvolver suas unidades para um nível superior, como resultado ele poderia infligir danos significativos ao oponente e ganhar a partida.

Também é assim que picos inesperados e falsos proboys distraem o trader do seu objectivo.

 
Aleksey Vyazmikin:

A propósito, note que o homem estava perdendo por cometer erros nas ações (clicando torto/esquecimento para ativar uma habilidade), mas foi capaz de vencer usando um movimento tático não-padrão - distraindo constantemente o oponente ao pousar na parte de trás da base do oponente, o que o forçou a destacar suas tropas para atacar a base do homem, o que deu ao homem tempo para desenvolver suas unidades para um nível superior, como resultado ele poderia infligir danos significativos ao oponente e ganhar a partida.

Assim mesmo, espigões inesperados e falsos proboys distraem o trader do objetivo.

Então, no próximo jogo, esse comportamento não-padrão já será batido pelo bot, é claro que no momento um homem pode vencer a IA à custa de um comportamento não-padrão, mas assim que a IA "disser" "Porque é possível fazê-lo", o homem terá dificuldades.