Discusión sobre el artículo "El papel de la calidad del generador de números aleatorios en la eficiencia de los algoritmos de optimización" - página 5
Está perdiendo oportunidades comerciales:
- Aplicaciones de trading gratuitas
- 8 000+ señales para copiar
- Noticias económicas para analizar los mercados financieros
Registro
Entrada
Usted acepta la política del sitio web y las condiciones de uso
Si no tiene cuenta de usuario, regístrese
Existen dos enfoques para resolver el problema de la evaluación de la estabilidad de una solución encontrada durante la optimización: el teórico y el práctico.
El teórico implica sumergirse en los cálculos matemáticos de los artículos, que suelen llevar las palabras estabilidad y optimización en sus títulos.
La práctica puede aplicarse de diferentes maneras, pero se reduce al trabajo de investigación realizado por los autores de los artículos del primer punto. Por ejemplo, a expensas de N llamadas FF redundantes en las proximidades de cada punto recorrido para estimar las derivadas locales y en función de ellas ajustar el rendimiento mediante algún criterio de penalización. O se podría hacer ruido en las coordenadas y/o en los valores FF durante el proceso de optimización - esta es la forma más barata (no hay que cambiar nada en la base de los propios algoritmos de optimización). También existe la idea de agrupar los resultados de la optimización e identificar los puntos con el máximo de la fórmula condicional (Índice-FF)/(dispersión-indicador-FF)*(dispersión-mínima-por-parámetros). El punto en el que caiga un único buen resultado tendrá dispersión cero y deberá tratarse como insatisfactorio.
Tu post se está adelantando un poco. Eso no es malo, pero no ayuda a responder algunas de las preguntas que han surgido aquí en la discusión.
Saber ya ha dado su respuesta a mi pregunta, por favor, responde más por ti Stanislav y esperemos la respuesta de Andrei. Permítanme recordarles la pregunta:
Imaginemos que tenemos la oportunidad de realizar una enumeración completa de los parámetros del sistema. Hacemos un recorrido por la historia del sistema con todos los parámetros posibles en principio. Ahora, por favor, responda a la pregunta: "¿Tiene usted una manera de elegir de todos los parámetros posibles un conjunto (o varios), que está listo para usar para el funcionamiento del sistema en los nuevos datos?
Entonces podremos desvelar mejor los puntos problemáticos de estas preguntas.
Atención: en esta formulación de la pregunta no se habla de algoritmos de optimización.
Saber ya ha respondido a mi pregunta, por favor, responde a Stanislav y esperemos la respuesta de Andrei. Permítanme recordarles la pregunta:
IMHO, acabo de responder a esta pregunta - 3 opciones a simple vista (alguien puede pensar en más): contar derivados(*/**), agrupación (**), ruido (*) - (un asterisco - durante el proceso de optimización, dos asteriscos - en los resultados de la optimización). Cualquiera de estas opciones dará lugar a ajustes en las puntuaciones de los puntos FF. A continuación, seleccione el mejor conjunto como de costumbre, pero ya no será sólo el FF máximo, sino con corrección de estabilidad.
Pero, empecemos hablando aquí. Así que, de nuevo, vamos a suponer que tenemos acceso a una búsqueda completa de los parámetros del sistema. Hacemos una carrera en la historia del sistema con todos los parámetros posibles en principio. Ahora, por favor, responda a la pregunta: "¿Tiene usted una manera de seleccionar de todos los parámetros posibles un conjunto (o varios) que usted está dispuesto a utilizar para ejecutar el sistema en los nuevos datos? Esta es una pregunta no sólo para usted, sino para todos los que estén dispuestos a responder a esta pregunta. Como podemos ver, ahora no estamos hablando de ningún algoritmo de optimización en absoluto, sólo de elegir un conjunto de parámetros para ejecutar el sistema con datos desconocidos.
Que sea la cima de una de las colinas. Pero inmediatamente estipulé que "La definición de "bestness" es una cuestión interesante aparte".
El resultado final debería tener en cuenta los resultados de las pasadas en un radio determinado.
En un gráfico en 3D, sería la cima de una colina más alta que las demás, o ligeramente más baja pero con pendientes más suaves.
Desde el punto de vista del CT -- será el resultado agregado del CT en algún rango de valores de cada uno de sus parámetros.
IMHO, acabo de responder a esta pregunta - 3 opciones a ojo (alguien puede pensar en más): contar derivados(*/**), agrupación (**), ruido (*) - (un asterisco - durante el proceso de optimización, dos asteriscos - en los resultados de la optimización). Cualquiera de estas opciones dará lugar a ajustes en las puntuaciones de los puntos FF. A continuación, seleccione el mejor conjunto como de costumbre, pero ya no será sólo el FF máximo, sino con corrección de estabilidad.
La primera línea de tu post:
Veo 2 enfoques para resolver el problema de la evaluación de la estabilidad de la solución encontrada durante la optimización: teórico y práctico.
Hasta ahora no hacemos optimización, hemos hecho una enumeración completa de parámetros.
Que sea la cima de una de las colinas. Pero inmediatamente estipulé que "La definición de "mejor" es una cuestión aparte interesante".
El resultado final debería tener en cuenta los resultados de las pasadas en un radio determinado.
En un gráfico 3D, sería la cima de una colina más alta que las demás, o ligeramente más baja, pero con pendientes más suaves.
Desde el punto de vista de TC -- será el resultado agregado de la operación TC en algún rango de valores de cada uno de sus parámetros.
La tarea es encontrar esta región sin una búsqueda completa.
Por lo tanto, ¿hay una manera de seleccionar de todos los parámetros posibles en los resultados de una búsqueda completa el conjunto que vamos a utilizar en los datos desconocidos? Hemos hecho una búsqueda completa, aquí no hay optimización.
Ahora es muy importante responder a esta pregunta.
El problema es encontrar esta región sin una búsqueda completa.
Estoy seguro de que ese problema se plantea a menudo y, por tanto, tiene varias soluciones publicadas.
Por cierto, si ya existen valores FF calculados en billones de puntos (búsqueda completa), encontrar colinas multidimensionales entre ellos es un problema de optimización.
Así que, en cualquier caso, se trata de optimizar.
Propuse un enfoque iterativo, en el que antes de cada iteración las áreas del vértice encontrado (en la iteración anterior) se pinchan como otra ejecución de GA.
La primera línea de tu post:
Todavía no hacemos ninguna optimización, hemos hecho una enumeración completa de parámetros.
¿Se trata de algún tipo de juego terminológico? He sugerido 3 maneras de elegir el mejor conjunto - que también son adecuados para el caso de una ejecución completa en la historia en todas las combinaciones posibles.
Por ejemplo, un problema tan conocido: existe una red NS (digamos, la negociación sobre los incrementos de precios), y la optimización se utiliza para encontrar los pesos de esta red. Si aplicamos sus algoritmos de frente, obtendremos una NS sobreentrenada, que no podrá trabajar con nuevos datos. Por lo tanto, es fundamental dividir el conjunto de datos original en dos, y mientras se realiza la optimización en una mitad, controlar la calidad en la segunda mitad.