Discussão do artigo "Importância da qualidade do gerador de números aleatórios no desempenho dos algoritmos de otimização" - página 5
Você está perdendo oportunidades de negociação:
- Aplicativos de negociação gratuitos
- 8 000+ sinais para cópia
- Notícias econômicas para análise dos mercados financeiros
Registro
Login
Você concorda com a política do site e com os termos de uso
Se você não tem uma conta, por favor registre-se
Há duas abordagens para resolver o problema de avaliar a estabilidade de uma solução encontrada durante a otimização: teórica e prática.
A teórica implica a imersão em cálculos matemáticos de artigos, que geralmente têm as palavras estabilidade e otimização em seus títulos.
A prática pode ser implementada de diferentes maneiras, mas se resume ao trabalho de pesquisa feito pelos autores dos artigos do primeiro ponto. Por exemplo, às custas de N chamadas FF redundantes nas proximidades de cada ponto percorrido para estimar as derivadas locais e, dependendo delas, ajustar os índices para alguns critérios de penalidade. Ou você pode alterar as coordenadas e/ou os valores de FF durante o processo de otimização - essa é a maneira mais econômica (nada precisa ser alterado na base dos próprios algoritmos de otimização). Há também uma ideia de agrupar os resultados da otimização e identificar os pontos com o máximo da fórmula condicional (Índice-FF)/(spread-indicador-FF)*(dispersão mínima por parâmetros). O ponto em que um único resultado bom cairá terá dispersão zero e deverá ser tratado como insatisfatório.
Sua postagem está se adiantando um pouco. Isso não é ruim, mas não ajuda a responder algumas das perguntas que surgiram aqui na discussão.
O Saber já respondeu à minha pergunta. Por favor, responda mais por você, Stanislav, e vamos aguardar a resposta do Andrei. Deixe-me lembrá-lo da pergunta:
Vamos imaginar que temos a oportunidade de realizar uma enumeração completa dos parâmetros do sistema. Fazemos uma execução no histórico do sistema com todos os parâmetros possíveis em princípio. Agora, responda à pergunta: "Você tem uma maneira de escolher um conjunto (ou vários) de todos os parâmetros possíveis que está pronto para usar na operação do sistema em novos dados?
Assim, poderemos revelar de forma mais completa os pontos problemáticos dessas perguntas.
Observação: nessa formulação da pergunta, não há nenhum discurso sobre algoritmos de otimização.
O Saber já respondeu à minha pergunta, responda ao Stanislav e vamos aguardar a resposta do Andrei. Deixe-me lembrá-lo da pergunta:
IMHO, acabei de responder a essa pergunta - 3 opções em uma rápida olhada (alguém pode pensar em mais): derivadas de contagem (*/**), agrupamento (**), ruído (*) - (um asterisco - durante o processo de otimização, dois asteriscos - nos resultados da otimização). Qualquer uma das opções resultará em ajustes nas pontuações de pontos do FF. Em seguida, selecione o melhor conjunto como de costume, mas ele não será mais apenas o FF máximo, mas com correção de estabilidade.
Mas vamos começar falando aqui. Então, novamente, vamos supor que temos acesso a uma pesquisa completa dos parâmetros do sistema. Em princípio, fazemos uma execução no histórico do sistema com todos os parâmetros possíveis. Agora, responda à pergunta: "Você tem uma maneira de selecionar, entre todos os parâmetros possíveis, um conjunto (ou vários) que esteja disposto a usar para executar o sistema em novos dados? Essa é uma pergunta não apenas para você, mas para todos que quiserem responder a ela. Como podemos ver, agora não estamos falando de nenhum algoritmo de otimização, apenas da escolha de um conjunto de parâmetros para executar o sistema em dados desconhecidos.
Que seja o topo de uma das colinas. Mas eu estipulei imediatamente que "A definição de "melhor" é uma questão interessante separada".
O resultado final deve levar em conta os resultados das passagens em um determinado raio.
Em um gráfico 3D, esse seria o topo de uma colina mais alta do que as outras, ou um pouco mais baixa, mas com declives mais suaves.
Do ponto de vista do TC, será o resultado agregado do TC em algum intervalo de valores de cada um de seus parâmetros.
IMHO, acabei de responder a essa pergunta - 3 opções, em uma suposição (alguém pode pensar em mais): derivados de contagem (*/**), agrupamento (**), ruído (*) - (um asterisco - durante o processo de otimização, dois asteriscos - nos resultados da otimização). Qualquer uma das opções resultará em ajustes nas pontuações de pontos do FF. Em seguida, selecione o melhor conjunto como de costume, mas ele não será mais apenas o FF máximo, mas com correção de estabilidade.
A primeira linha em sua postagem:
Vejo duas abordagens para resolver o problema de avaliar a estabilidade da solução encontrada durante a otimização: teórica e prática.
Até o momento, não estamos fazendo otimização, mas sim uma enumeração completa de parâmetros.
Que seja o topo de uma das colinas. Mas eu estipulei imediatamente que "a definição de "melhor" é uma questão interessante à parte".
O resultado final deve levar em conta os resultados das passagens em um determinado raio.
Em um gráfico 3D, esse seria o topo de uma colina mais alta do que as outras, ou um pouco mais baixa, mas com declives mais suaves.
Do ponto de vista do TC, será o resultado agregado da operação do TC em algum intervalo de valores de cada um de seus parâmetros.
A tarefa é encontrar essa região sem uma pesquisa completa.
Então, existe uma maneira de selecionar, entre todos os parâmetros possíveis nos resultados de uma pesquisa completa, o conjunto que usaremos em dados desconhecidos? Fizemos uma pesquisa completa, não há otimização aqui.
Agora é muito importante responder a essa pergunta.
O problema é encontrar essa região sem fazer uma pesquisa completa.
Tenho certeza de que esse problema é apresentado com frequência e, portanto, tem várias soluções publicadas.
A propósito, se já houver valores de FF calculados em trilhões de pontos (pesquisa completa), então encontrar colinas multidimensionais entre eles é um problema de otimização.
Portanto, em todo caso, trata-se de otimização.
Propus uma abordagem iterativa, na qual, antes de cada iteração, as áreas do vértice encontrado (na iteração anterior) são selecionadas como outra execução do AG.
A primeira linha de sua postagem:
Ainda não realizamos nenhuma otimização, mas fizemos uma enumeração completa dos parâmetros.
Isso é algum tipo de jogo terminológico? Sugeri três maneiras de escolher o melhor conjunto - elas também são adequadas para o caso de uma execução completa do histórico em todas as combinações possíveis.
Por exemplo, um problema bem conhecido: há um NS (digamos, negociação em incrementos de preço) e a otimização é usada para encontrar os pesos dessa rede. Se aplicarmos seus algoritmos de forma direta, obteremos um NS excessivamente treinado, que não conseguirá trabalhar com novos dados. Portanto, é fundamental dividir o conjunto de dados original em dois e, ao realizar a otimização em uma metade, controlar a qualidade na segunda metade.