Algoritmo para combinar rangos de un segmento - ayuda para crear - página 6

 
Aleksey Vyazmikin:

¿Qué diferencia hay entre que los caminos sean largos o cortos, o es una cuestión de estimación (la longitud de la flecha en la analogía de la figura)?

Tenemos el deseo de pisar los dos mejores caminos del ejemplo, si hay menos entonces sólo hay un camino.

Por favor, explique por qué esto puede ser un problema.

Si hay caminos cortos y largos en un conjunto, entonces si llegas a la zona con sólo caminos largos, el camino será más largo que si llegas a la zona con caminos cortos. Por ejemplo, al principio como en tu foto, y luego hay dos zonas paralelas entre sí, y en la primera zona, los segmentos son 3 veces más cortos que en la segunda zona y ocupan el 75% del camino.

 
Valeriy Yastremskiy:

Si hay zonas con segmentos cortos y largos en el conjunto, entonces si se llega a la zona con sólo segmentos largos, el camino será más largo que si se llega a la zona con segmentos cortos. Por ejemplo, al principio, como en tu dibujo, y luego hay dos zonas paralelas entre sí, y en la primera zona, los segmentos son 3 veces más cortos que en la segunda zona y ocupan el 75% del camino.

El movimiento se iniciará desde cada segmento, por lo que debes pasar por esas zonas también.

 
Aleksey Vyazmikin:

El movimiento se iniciará desde cada segmento, por lo que debe pasar por esas zonas también.

El movimiento puede comenzar desde cualquier segmento, pero está claro que no se necesitan puntos de segmentos largos. En tu algoritmo sólo tienes relaciones con los segmentos más cercanos, no con cualquier segmento, y si das con un punto con segmentos largos, y con puntos cercanos sólo con segmentos largos, no es un buen resultado.

 
Valeriy Yastremskiy:

El movimiento puede comenzar desde cualquier segmento, pero está claro que no se necesitan puntos de segmentos largos. En tu algoritmo sólo tienes relaciones con los segmentos más cercanos, no con cualquier segmento, y si llegas a un punto con segmentos largos, y junto a puntos con sólo segmentos largos, no es el mejor resultado.

La "longitud" es relativa aquí, hasta que se llega a un punto en el que no se puede medir.

Otra cosa es la estimación en análogos compuestos, cuando un segmento está representado por dos, entonces sí, podemos dejar un segmento.

 
Aleksey Vyazmikin:

La "longitud" aquí es relativa, hasta que llegamos a un punto en el que no podemos medirla.

Otra cosa es la estimación en análogos compuestos, cuando un segmento está representado por dos, entonces sí, podemos dejar caer un segmento.

No lo entiendo. Si la longitud/precio sólo puede mirarse golpeando un punto, es una tarea mucho más difícil. Y sin una estimación suficientemente completa de la relación precio/longitud, el resultado no puede estimarse de forma fiable.

No está claro lo de los análogos compuestos.

 
Valeriy Yastremskiy:

No lo entiendo. Si la longitud/precio sólo se puede ver pulsando un punto, es una tarea mucho más difícil. Y sin una estimación suficientemente completa de la relación precio/longitud, el resultado no puede evaluarse de forma fiable.

Sí, lo es.

Valeriy Yastremskiy:

No está claro lo de los análogos compuestos.

En la figura siguiente tenemos dos segmentos grandes y 5 pequeños debajo de ellos, pero se puede ver que están en el mismo rango y, por lo tanto, describen esencialmente un área similar.

La única cuestión es qué es mejor, si las barras más pequeñas que dan la posibilidad de que cada una de ellas encuentre un predictor correlativo y tenga un corte más preciso, o la mayor capacidad de generalización de la barra más grande. Creo que los cortes superficiales son mejores, su mínimo está limitado en la selección.

 

Se me ocurrió otra idea, ¿por qué no tomar el mejor x% de los segmentos y utilizarlos para rellenar el espacio en el primer paso, y en el segundo paso identificar los huecos entre los segmentos y buscar segmentos para incrustar en estos huecos?

La figura muestra convencionalmente dos etapas.


 
Aleksey Vyazmikin:

Se me ocurrió otra idea, ¿por qué no tomar el mejor x% de los segmentos y utilizarlos para rellenar el espacio en el primer paso, y en el segundo paso identificar los huecos entre los segmentos y buscar segmentos para incrustar en estos huecos?

En la figura he mostrado las dos etapas de forma condicional.


Bueno, eso es lo que intento decir, primero estimar las longitudes/valores de los puntos, identificar múltiples segmentos valiosos y tóxicos y luego construir un camino basado en los valores de los segmentos y en la capacidad de llenar el camino de la forma más completa sin huecos.

Como mínimo, la solución no será la mejor, pero será mejor que la media.

 

La pregunta se sale del tema y es más bien filosófica. ¿Se da cuenta de que el planteamiento de la clasificación mediante la división de los atributos en segmentos implica una dependencia discontinua de los resultados con respecto a las entradas? Es decir, puede darse la situación de que una operación se abra en un conjunto de atributos y no se abra en otro muy, muy cercano al primero (están cerca de la frontera, pero en lados opuestos de la misma). No digo que sea un enfoque equivocado. Sólo quiero preguntar: ¿hay algún tipo de intuición de comerciante detrás de esto o es una elección arbitraria?

Como posible alternativa, se puede sugerir la clasificación mediante la regresión logística o el método del vecino más cercano. La salida puede contener la estimación de la probabilidad de pertenecer a una clase, que puede utilizarse, por ejemplo, para determinar el volumen de comercio. No insisto en ningún algoritmo en particular, sólo me interesa el aspecto comercial de la elección de un algoritmo de MO en particular.

 
Valeriy Yastremskiy:

Eso es lo que estoy tratando de decir, primero estimar las longitudes/valores de los puntos, identificar los muchos segmentos valiosos y tóxicos y luego construir un camino basado en el valor de los segmentos y la capacidad de llenar mejor el camino sin huecos.

Como mínimo, la solución no será la mejor, pero será mejor que la media.

La cuestión aquí es cómo identificar "muchos segmentos valiosos y tóxicos", es decir, hay que identificar su intercambiabilidad, o hacerlo en dos pasadas, como he sugerido antes. ¿O tiene otra opción?

Razón de la queja: