Discusión sobre el artículo "El problema del desacuerdo: profundizando en la explicabilidad de la complejidad en la IA"

 

Artículo publicado El problema del desacuerdo: profundizando en la explicabilidad de la complejidad en la IA:

En este artículo hablaremos de los problemas relacionados con los explicadores y la explicabilidad en la IA. Los modelos de IA suelen tomar decisiones difíciles de explicar. Además, el uso de múltiples explicadores suele provocar el llamado "problema del desacuerdo". Al fin y al cabo, la comprensión clara del funcionamiento de los modelos resulta fundamental para aumentar la confianza en la IA.

El desacuerdo es un área de investigación clave dentro de una esfera interdisciplinar conocida como inteligencia artificial explicable (Explainable Artificial Intelligence, XAI). La inteligencia artificial explicable intenta ayudarnos a entender cómo nuestros modelos llegan a sus decisiones. Desafortunadamente, en la práctica resulta más complicado que eso. 

Todos sabemos que los modelos de aprendizaje automático y los conjuntos de datos disponibles son cada vez mayores y más complejos. De hecho, los científicos de datos que desarrollan algoritmos de aprendizaje automático no pueden explicar de manera precisa el comportamiento de sus algoritmos en todos los conjuntos de datos posibles. La Inteligencia Artificial Explicable (XAI) debe ayudarnos a explicar la funcionalidad de los modelos y confirmar que estos están listos para su uso práctico. Por prometedor que suene, este artículo mostrará al lector por qué no podemos confiar ciegamente en ninguna explicación que podamos obtener de cualquier aplicación de la tecnología de inteligencia artificial explicable. 

Autor: Gamuchirai Zororo Ndawana

 
Por desgracia, las explicaciones sólo funcionan para dependencias estacionarias, cuando la importancia de los predictores no cambia con el tiempo. Tales predictores son fáciles de obtener para las flores, el número de pétalos, etc., pero difíciles de obtener para los mercados financieros.
Además, los modelos modernos son capaces de anular independientemente la participación de ciertos atributos.
 
Maxim Dmitrievsky anular independientemente la participación de ciertos atributos.
Efectivamente es muy difícil obtener predictores para un conjunto de datos financieros, de hecho la única solución viable que se me ocurre es utilizar los datos que tenemos a mano para crear un nuevo objetivo, y de esa forma tenemos todos los predictores para el nuevo objetivo. Como por ejemplo si aplicamos las Bandas de Bollinger a un gráfico, el precio puede estar en 4 estados. Completamente por encima de las bandas de Bollinger, entre la banda superior y la banda media, por encima de la banda inferior pero por debajo de la banda media o completamente por debajo de la banda. Si definimos estos estados como 1, 2, 3, 4, podemos predecir los estados futuros del mercado con más precisión de la que podemos predecir los cambios en el precio en sí.

Estados


De los modelos que he entrenado, incluso sólo el estado actual del mercado son datos suficientes, añadiendo el OHLC y las lecturas de la banda de Bollinger no mejora la precisión o la estabilidad por mucho. En la captura de pantalla de arriba he entrenado un clasificador LDA para predecir el siguiente estado del valor, el mayor inconveniente con este enfoque es que la intepretibailidad se puede perder en el camino, por ejemplo, si el modelo predice que el precio se mantendrá en el estado 1 no sabemos si el precio está subiendo o bajando, sólo sabemos a dónde va el precio si el sistema predice un cambio de estado, de 1 a 2. Esta es la única solución que puedo ofrecer.Esa es la única solución que se me ocurre hasta ahora, crear nuevos objetivos con los datos que tenemos para saber que la relación existe, la creamos nosotros.

 
Gamuchirai Zororo Ndawana #:
En efecto, es muy difícil obtener predictores para un conjunto de datos financieros, y la única solución que se me ocurre es utilizar los datos disponibles para crear un nuevo objetivo, y entonces tendremos todos los predictores para el nuevo objetivo. Por ejemplo, si aplicamos las Bandas de Bollinger a un gráfico, el precio puede estar en 4 estados. Completamente por encima de las Bandas de Bollinger, entre las bandas superior e intermedia, por encima de la banda inferior pero por debajo de la banda intermedia, o completamente por debajo de la banda. Si definimos estos estados como 1, 2, 3, 4, podemos predecir futuros estados del mercado con más precisión que los cambios en el precio en sí.


De los modelos que he entrenado, incluso sólo el estado actual del mercado es suficiente, añadiendo OHLC y las lecturas de las Bandas de Bollinger no mejora la precisión y la estabilidad mucho. En la captura de pantalla anterior, he entrenado un clasificador LDA para predecir el próximo estado del valor. El principal inconveniente de este enfoque es que la integridad se puede perder por el camino, por ejemplo, si el modelo predice que el precio se mantendrá en el estado 1, no sabemos si el precio está subiendo o bajando, sólo sabemos a dónde irá el precio si el sistema predice un cambio de estado, de 1 a 2.Esta es la única solución que puedo ofrecer en este momento, es crear nuevos objetivos basados en los datos que tenemos, así que sabemos que el vínculo existe, lo hemos creado nosotros mismos.

Deberias leer el codigo de estos miserables y prehistoricos BBs, aun los hay en \MQL5\Indicators\Examples\BB.mq5. Mouldy, máscaras lúgubres de nuevo, tratando de calcular algunos Standard Deviation....

 
Alexey Volchanskiy #:

Usted debe leer el código de estos miserables, prehistóricos BBs, sin embargo, hay en \MQL5\Indicators\Examples\BB.mq5. Mouldy, máscaras lúgubres de nuevo, tratando de calcular algunos Standard Deviation....

Una vez traté de leer el código para el indicador RSI en la ruta Ejemplos que especificó, y para ser honesto con usted, me pareció difícil de leer, y no estoy seguro de si he interiorizado plenamente lo que todo el código está haciendo.
¿Crees que los indicadores modernos como el Indicador Vortex pueden haber superado algunas de las limitaciones de los indicadores clásicos? ¿O tal vez el problema es inherente a los indicadores técnicos porque la mayoría de ellos dependen de algún parámetro que necesita ser calculado y optimizado bajo un ruido considerable?