Discussão do artigo "Algoritmos de otimização populacionais: Algoritmo de mudas, semeadura e crescimento (SSG)" - página 13

 
Andrey Dik #:

Infelizmente, ou talvez felizmente, o bot não gera novas informações, mas as informações que estão disponíveis publicamente são muitas vezes distorcidas. acho que isso se deve aos mecanismos de interpolação de informações. ele mente, inventa abreviações inexistentes de algoritmos, até mesmo inventa os nomes dos autores na hora e as datas do algoritmo)))). você deve ter muito cuidado com essas informações.

Como assistente na edição de textos, edições estilísticas e obtenção de referências ao escrever artigos - sim, um assistente indispensável.

Sim, lá, como em todas as redes generativas, há um randomizador na saída para que não sejam obtidas respostas idênticas. Se você diminuir a temperatura, obterá respostas mais precisas/específicas. Mas isso só é possível por meio da API.
 
fxsaber #:

Obrigado. Eu encontro indiretamente os locais por meio da interrupção forçada da otimização quando um grande número de núcleos está envolvido. Em termos gerais, há 20 agentes no testador, e eu interrompo a otimização após 2000 passagens.

Aquiestá um exemplo de conjuntos obtidos com essa interrupção. Se não fossem interrompidas, as imagens no link mostrariam todos os 20 conjuntos da mesma forma. Mas, com a interrupção, você pode ver o comportamento diferente dos conjuntos, entre os quais pode haver aqueles que passam por OOS.

Se encontrarmos 20 extremos locais (sugeri o método de ejeção gradual), a exibição desses extremos em uma imagem como essa fornecerá a avaliação visual mais objetiva do TS.

 
fxsaber #:

Para a autoeducação, qual é a dependência da complexidade em relação à medição?

Andrey Dik #:

Confesso que não sei, só sei que ela cresce de forma não linear e rápida.

Aleksey Nikolavev apareceu aqui, talvez ele saiba a resposta exata para essa pergunta. Esqueci como chamar um usuário do fórum.

Dificilmente é possível obter um conhecimento exato aqui, apenas algumas estimativas.

1) Crescimento do número de assentos em relação ao número de extremos. Vamos supor um caso suave (uma variante descontínua sempre pode ser aproximada por uma suave com alguma precisão). O extremo está em pontos com degenerescência do gradiente e é determinado pelos sinais dos números de eigênio do hessiano. Se a dimensão N e (vamos supor, para simplificar) cada um dos sinais dos valores próprios do hessiano for determinado por uma escolha aleatória com probabilidades iguais de 0,5, então a probabilidade de que todos os sinais sejam iguais (portanto, é um extremo) é 2/(2^N)=2^(1-N). No caso bidimensional, ela será igual a 0,5 (50%), o que é bom e bastante visível nas imagens - o número de selas é aproximadamente igual ao número de extremos. No caso de 10 dimensões, o extremo já será menor que 0,2%.

2) De fato, qualquer algoritmo para encontrar extremos cria um sistema dinâmico, que tende a ser cada vez mais caótico à medida que as dimensões aumentam. Você deve se lembrar que o conjunto de Mandelbrot surge em um sistema dinâmico, que surge quando se busca iterativamente a raiz de uma função quadrática no caso bidimensional).

 
Aleksey Nikolayev #:

O conhecimento exato dificilmente é possível aqui, apenas algum tipo de estimativa.

1) Crescimento do número de selas com relação ao número de extremos. Vamos supor um caso suave (uma variante descontínua sempre pode ser aproximada por uma suave com alguma precisão). O extremo está em pontos com degenerescência do gradiente e é determinado pelos sinais dos números de eigênio do hessiano. Se a dimensão N e (vamos supor, para simplificar) cada um dos sinais dos valores próprios do hessiano for determinado por uma escolha aleatória com probabilidades iguais de 0,5, então a probabilidade de que todos os sinais sejam iguais (portanto, é um extremo) é 2/(2^N)=2^(1-N). No caso bidimensional, ela será igual a 0,5 (50%), o que é bom e bastante visível nas imagens - o número de selas é aproximadamente igual ao número de extremos. No caso de 10 dimensões, o extremo já será menor que 0,2%.

2) De fato, qualquer algoritmo para encontrar extremos cria um sistema dinâmico, que tende a ser cada vez mais caótico à medida que as dimensões aumentam. Você deve se lembrar que o conjunto de Mandelbrot surge em um sistema dinâmico, que surge quando se busca iterativamente a raiz de uma função quadrática no caso bidimensional).

Obtém-se um cálculo bastante pessimista para variantes multidimensionais.

 
fxsaber #:

O cálculo para variantes multivariadas é bastante pessimista.

Em geral, sim. É por isso que, normalmente, em casos multidimensionais, a tarefa de um estudo completo do dispositivo de superfície da função de perda não é definida. Tampouco é a tarefa de procurar o extremo global. De fato, estamos limitados a apenas encontrar pontos suficientemente bons. Bem, talvez exceto nos casos em que é possível construir uma função de perda com boas propriedades, como em MO, por exemplo.

 
ótimo valor
 
Obrigado!