Precisa de ajuda! Não consigo resolver o problema, estou atingindo limitações de hardware - página 13

 
Candid:
Aparentemente, um dos resultados de uma passagem com uma data é uma nova data.

Se a nova data = a próxima seqüência, tudo bem. Se for sequencialmente. Merda, taptologia. Quero dizer, consecutivo.

Você pode ler o pacote de antemão, eles serão rasos.

E nem mesmo o próximo, quem se importa. Indexar e ligar conforme necessário.

 
Urain:

para Komposter: Andrei, se você está preso ao problema da dimensão, significa que cometeu um erro ao formular o problema.

Há três opções aqui:

1 pense nisso você mesmo

2 abrir o problema em um fórum público

3 resolver o problema em particular (para todos aqueles que você acha que podem resolvê-lo e confiar para mantê-lo em segredo).

Deixe-me explicar o que quero dizer: se você salvar notícias, você pode escrever tangas de todas as notícias, ou pode fazer a codificação de frases típicas (compressão), "saldo da conta" se transforma em 1, "patrimônio da conta" em 2, etc. Outra variante do problema típico é o desejo de preencher dados já classificados, para grandes dimensões isto é a morte, é mais fácil adicionar ao final e fazer a classificação condicional por índices.

Acho claro o que quero dizer ao dizer que há um erro na declaração do problema.

Eu ponderaria sobre esta tarefa
 
Já que o problema é bastante acadêmico (como uma pergunta de aplicação de trabalho para um programador) e muitas pessoas demonstraram interesse nele, por que não formulá-lo mais estritamente em termos de formato de descrição dos dados de entrada, e todos poderiam gerar 20 Gig de dados de teste e apresentar sua solução prática?
 
Presumo que estejamos falando de um testador/optimista caseiro?
 
joo:
Presumo que estejamos falando de um testador/optimista caseiro?

Não, é algo mais.

Acho que algum corretor/fornecedor conseguiu o banco de dados do negócio. :)

 

Vou repetir a tarefa em termos simplificados

- Recebemos um grupo de ordens dentro de M minutos (negócios X+Y)
- fazer X primeiras negociações.
- calcular algum critério Kx (por exemplo, lucro=100 ou algo assim).
- verificar os negócios em Y restantes do grupo. Se seu critério calculado Ky tem um desvio não maior que D de Kx, o grupo de pedidos nos serve.

Não sabemos o que fazer com este grupo de pedidos e provavelmente nunca descobriremos, são apenas informações internas :)

Talvez este seja um revendedor que queira perder clientes, ou talvez seja o contrário... um estudo de psicologia.

 
sergeev:

Vou repetir o problema em termos simplificados

- Pegue um grupo de pedidos para M minutos (ofertas X+Y)
- pegue X primeiras ofertas.
- calcular algum critério Kx (por exemplo, lucro=100 ou algo assim).
- verificar os negócios em Y restantes do grupo. Se seu critério calculado Ky tem um desvio não maior do que D de Kx, então o grupo de pedidos nos serve.

E não sabemos o que fazer com este grupo de pedidos, e provavelmente nunca descobriremos, devido à informação privilegiada :)

Talvez esta seja uma corretora que queira drenar clientes, ou vice versa.

Típico de um DB. Mas você tem que agregar os dados... Você pode escrever em uma tabela separada atributos únicos de uma seqüência (datas de ponto c), o valor de lucro médio K e a variância D e, em seguida, procurar as 10 seqüências mais próximas do critério que você precisa. Com índices nestes campos, a busca não levará tanto tempo (mesmo em um milhão de registros). Então, quando você obtém as 10 seqüências corretas, você pode pesquisar através dos dados da fonte, mas não será mais um milhão de pesquisas, porque temos um limite de datas.

Ainda é um mistério - o que deve ser procurado? Se estamos falando em tomar uma decisão em termos de abertura/fecho de um pedido, qualquer processamento de um volume desse tipo levará bastante tempo.

A única maneira de ver a eficácia de tal processamento é agregar os dados e usar uma abordagem probabilística.

Podemos calcular coeficientes de correlação entre o que temos e toda a história do comércio e "salvá-los" no robô, sem usar o DB no futuro.

Há outro ponto. Se estamos falando de ofícios, talvez haja um motivo para separar os ofícios para cada símbolo? E escrever robôs do mesmo tipo projetados para EURUSD, USDJPY, etc.

 
A propósito, é uma idéia interessante... Ofertas lucrativas podem ser geradas tanto quanto você desejar, analisando diariamente (Alto/Baixo) em minutos, e lembrando o tempo de abertura e fechamento dos preços (em um arquivo). Em seguida, escreva um consultor especializado que leia o arquivo, e quando a data e a hora coincidirem, ele abra/feche as negociações, e o execute no testador. Eu fiz isso para um cliente que queria promover as vendas de seu robô. E analisar os negócios já realizados da mesma forma )).
 
sergeev:

Penso que esta é a única maneira de identificar uma estratégia (ou um conjunto de parâmetros para um robô) que foi usada para comercializar em uma determinada seqüência.

Parece-me que desta forma só podemos identificar a estratégia que foi utilizada para comercializar (ou um conjunto de parâmetros robóticos) de uma determinada seqüência, e mudar para ela em uma determinada situação de mercado.

 
marketeer:
Como o problema é bastante acadêmico (parece ser uma questão para contratar um programador) e muitas pessoas mostraram interesse nele, por que não formulá-lo mais estritamente em termos de formato de descrição dos dados de entrada, e todos poderiam gerar 20 Gigs de dados de teste e apresentar sua solução prática?
Eu concordo. A tarefa não é trivial, o interesse está crescendo.
Razão: