ONNX(Open Neural Network Exchange) est un format de description et d'échange de modèles d'apprentissage automatique, qui permet de transférer des modèles entre différents modèles d'apprentissage automatique. Dans l'apprentissage profond et les réseaux neuronaux, des types de données comme float32 sont fréquemment utilisés. Ils sont largement appliqués car ils offrent généralement une précision et une efficacité acceptables pour la formation des modèles d'apprentissage profond.



Certains modèles classiques d'apprentissage automatique sont difficiles à représenter sous forme d’opérateurs ONNX. Des opérateurs ML (ai.onnx.ml) supplémentaires ont été introduits pour les mettre en œuvre dans ONNX. Il est intéressant de noter que selon la spécification ONNX, les opérateurs clés de cet ensemble (LinearRegressor, SVMRegressor, TreeEnsembleRegressor) peuvent accepter différents types de données d'entrée (tensor(float), tensor(double), tensor(int64), tensor(int32)), mais qu’ils renvoient toujours le type tensor(float) en sortie. Le paramétrage de ces opérateurs est également effectué à l'aide de nombres à virgule flottante, ce qui peut limiter la précision des calculs, en particulier si des nombres à double précision ont été utilisés pour définir les paramètres du modèle original.

Cela peut entraîner une perte de précision lors de la conversion de modèles ou de l'utilisation de différents types de données dans le processus de conversion et de traitement des données dans ONNX. Beaucoup dépend du convertisseur, comme nous le verrons plus loin ; certains modèles parviennent à contourner ces limitations et à assurer la portabilité totale des modèles ONNX, ce qui permet de travailler avec eux en double précision sans perdre en précision. Il est important de prendre en compte ces caractéristiques lorsque l'on travaille avec des modèles et leur représentation dans ONNX. En particulier dans les cas où la précision de la représentation des données est importante.

Scikit-learn est l'une des bibliothèques les plus populaires et les plus utilisées pour l'apprentissage automatique dans la communauté Python. Elle offre un large éventail d'algorithmes, une interface conviviale et une bonne documentation. L'article précédent, "Modèles de classification de la bibliothèque Scikit-learn et leur export vers ONNX", traitait des modèles de classification.

Dans cet article, nous allons explorer l'application des modèles de régression dans le package Scikit-learn, calculer leurs paramètres en double précision pour le jeu de données de test, tenter de les convertir au format ONNX pour la précision flottante et pour précision double, et utiliser les modèles obtenus dans des programmes MQL5. Nous comparerons également la précision des modèles originaux et de leurs versions ONNX pour la précision flottante et la précision double. Nous examinerons aussi la représentation ONNX des modèles de régression, ce qui permettra de mieux comprendre leur structure interne et leur fonctionnement.





Sommaire





Si cela vous dérange, vous pouvez apporter votre contribution

Sur le forum des développeurs du Runtime ONNX, l'un des utilisateurs a signalé une erreur "[ONNXRuntimeError] : 9 : NOT_IMPLEMENTED : Impossible de trouver une implémentation pour le nœud LinearRegressor:LinearRegressor(1)" lors de l'exécution d'un modèle via ONNX Runtime.



Bonjour à tous, j'obtiens cette erreur lorsque j'essaie de déduire un modèle de régression linéaire. Veuillez m'aider à résoudre ce problème.





"NOT_IMPLEMENTED : Impossible de trouver une implémentation pour le nœud LinearRegressor:LinearRegressor(1)" dans le forum des développeurs du Runtime ONNX



Réponse du développeur :



C'est parce que nous ne l'avons implémenté que pour float32, pas pour float64. Mais votre modèle a besoin de float64.



Voir :

https://github.com/microsoft/onnxruntime/blob/master/onnxruntime/core/providers/cpu/ml/linearregressor.cc#L16



Si cela vous dérange, n'hésitez pas à y contribuer.



Dans le modèle ONNX de l'utilisateur, l'opérateur est appelé avec un type de données double (float64), et le message d'erreur apparaît parce que le Runtime ONNX ne supporte pas l'opérateur LinearRegressor() avec une double précision.



Selon la spécification de l'opérateur ai.onnx.ml.LinearRegressor, le type de données d'entrée double est possible (T: tensor(float), tensor(double), tensor(int64), tensor(int32)). Cependant, les développeurs ont intentionnellement choisi de ne pas l'implémenter.



La raison en est que la sortie renvoie toujours la valeur Y: tensor(float). De plus, les paramètres de calcul sont aussi des nombres flottants (coefficients : liste de float, intercepts : liste de float).



Par conséquent, lorsque les calculs sont effectués en double précision, cet opérateur réduit la précision à un flottant, et sa mise en œuvre dans les calculs en double précision a une valeur discutable.











Description de l'opérateur ai.onnx.ml.LinearRegressor



Ainsi, la réduction de la précision à des valeurs flottantes dans les paramètres et la valeur de sortie empêche le ai.onnx.ml.LinearRegressor de fonctionner pleinement avec des nombres doubles (float64). C'est probablement pour cette raison que les développeurs du Runtime ONNX ont décidé de ne pas l'implémenter pour le type double



La méthode consistant à "ajouter le support du type double" a été démontrée par les développeurs dans les commentaires du code (surlignés en jaune).

Dans le Runtime ONNX, son calcul est effectué en utilisant la classe LinearRegressor (https://github.com/microsoft/onnxruntime/blob/main/onnxruntime/core/providers/cpu/ml/linearregressor.h).

Les paramètres de l'opérateur, coefficients_ et intercepts_, sont stockés sous forme de std::vector<float> :



#pragma once #include "core/common/common.h" #include "core/framework/op_kernel.h" #include "core/util/math_cpuonly.h" #include "ml_common.h" namespace onnxruntime { namespace ml { class LinearRegressor final : public OpKernel { public : LinearRegressor( const OpKernelInfo& info); Status Compute(OpKernelContext* context) const override ; private : int64_t num_targets_; std:: vector < float > coefficients_; std:: vector < float > intercepts_; bool use_intercepts_; POST_EVAL_TRANSFORM post_transform_; }; } }

#include "core/providers/cpu/ml/linearregressor.h" #include "core/common/narrow.h" #include "core/providers/cpu/math/gemm.h" namespace onnxruntime { namespace ml { ONNX_CPU_OPERATOR_ML_KERNEL( LinearRegressor, 1 , KernelDefBuilder().TypeConstraint( "T" , DataTypeImpl::GetTensorType< float >()), LinearRegressor); LinearRegressor::LinearRegressor( const OpKernelInfo& info) : OpKernel(info), intercepts_(info.GetAttrsOrDefault< float >( "intercepts" )), post_transform_(MakeTransform(info.GetAttrOrDefault<std:: string >( "post_transform" , "NONE" ))) { ORT_ENFORCE(info.GetAttr<int64_t>( "targets" , &num_targets_).IsOK()); ORT_ENFORCE(info.GetAttrs< float >( "coefficients" , coefficients_).IsOK()); use_intercepts_ = intercepts_.size() == static_cast<size_t>(num_targets_); } template < typename T> static Status ComputeImpl( const Tensor& input , ptrdiff_t num_batches, ptrdiff_t num_features, ptrdiff_t num_targets, const std:: vector < float >& coefficients, const std:: vector < float >* intercepts, Tensor& output, POST_EVAL_TRANSFORM post_transform, concurrency::ThreadPool* threadpool) { const T* input_data = input .Data<T>(); T* output_data = output.MutableData<T>(); if (intercepts != nullptr) { TensorShape intercepts_shape({num_targets}); onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, intercepts->data(), &intercepts_shape, output_data, threadpool); } else { onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, nullptr, nullptr, output_data, threadpool); } if (post_transform != POST_EVAL_TRANSFORM::NONE) { ml::batched_update_scores_inplace(gsl::make_span(output_data, SafeInt<size_t>(num_batches) * num_targets), num_batches, num_targets, post_transform, - 1 , false , threadpool); } return Status::OK(); } Status LinearRegressor::Compute(OpKernelContext* ctx) const { Status status = Status::OK(); const auto& X = *ctx->Input<Tensor>( 0 ); const auto& input_shape = X.Shape(); if (input_shape.NumDimensions() > 2 ) { return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Input shape had more than 2 dimension. Dims=" , input_shape.NumDimensions()); } ptrdiff_t num_batches = input_shape.NumDimensions() <= 1 ? 1 : narrow<ptrdiff_t>(input_shape[ 0 ]); ptrdiff_t num_features = input_shape.NumDimensions() <= 1 ? narrow<ptrdiff_t>(input_shape.Size()) : narrow<ptrdiff_t>(input_shape[ 1 ]); Tensor& Y = *ctx->Output( 0 , {num_batches, num_targets_}); concurrency::ThreadPool* tp = ctx->GetOperatorThreadPool(); auto element_type = X.GetElementType(); switch (element_type) { case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: { status = ComputeImpl< float >(X, num_batches, num_features, narrow<ptrdiff_t>(num_targets_), coefficients_, use_intercepts_ ? &intercepts_ : nullptr, Y, post_transform_, tp); break ; } case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: { } default : status = ORT_MAKE_STATUS(ONNXRUNTIME, FAIL, "Unsupported data type of " , element_type); } return status; } } }

Il s'avère qu'il existe une option permettant d'utiliser des nombres doubles comme valeurs d'entrée et d'effectuer le calcul de l'opérateur avec des paramètres flottants. Une autre possibilité serait de réduire la précision des données d'entrée à des valeurs flottantes. Mais aucune de ces options ne peut être considérée comme une solution adéquate.



La spécification de l'opérateur ai.onnx.ml.LinearRegressor limite la possibilité d'un fonctionnement complet avec des nombres doubles puisque les paramètres et la valeur de sortie sont limités au type flottant.

Une situation similaire se produit avec d'autres opérateurs ML d'ONNX, tels que ai.onnx.ml.SVMRegressor et ai.onnx.ml.TreeEnsembleRegressor.

Par conséquent, tous les développeurs utilisant l'exécution de modèles ONNX en double précision sont confrontés à cette limitation de la spécification. Une solution pourrait consister à étendre la spécification ONNX (ou à ajouter des opérateurs similaires tels que LinearRegressor64, SVMRegressor64 et TreeEnsembleRegressor64 avec des paramètres et des valeurs de sortie en double). Mais à l'heure actuelle, cette question n'est pas résolue.



Tout dépend du convertisseur ONNX. Pour les modèles calculés en double, il peut être préférable de ne pas utiliser ces opérateurs (bien que cela ne soit pas toujours possible). Dans ce cas particulier, le convertisseur vers ONNX n'a pas fonctionné de manière optimale avec le modèle de l'utilisateur.

Comme nous le verrons plus loin, le convertisseur sklearn-onnx parvient à contourner la limitation de LinearRegressor : pour les modèles ONNX double, il utilise les opérateurs ONNX MatMul() et Add() à la place. Grâce à cette méthode, de nombreux modèles de régression de la bibliothèque Scikit-learn sont convertis avec succès en modèles ONNX calculés en double, tout en préservant la précision des modèles doubles originaux.







1. Ensemble des Données de Test



Pour exécuter les exemples, vous devrez installer Python (nous avons utilisé la version 3.10.8), des bibliothèques supplémentaires (pip install -U scikit-learn numpy matplotlib onnx onnxruntime skl2onnx), et spécifier le chemin vers Python dans MetaEditor (dans le menu Outils->Options->Compilateurs->Python).



Comme ensemble de données de test, nous utiliserons les valeurs générées de la fonction y = 4X + 10sin(X*0.5).

Pour afficher le graphique d'une telle fonction, ouvrez MetaEditor, créez un fichier nommé RegressionData.py, copiez le texte du script et exécutez-le en cliquant sur le bouton "Compiler".



Le script d'affichage de l'ensemble des données de test

# RegressionData.py # The code plots the synthetic data, used for all regression models # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # import necessary libraries import numpy as np import matplotlib.pyplot as plt # generate synthetic data for regression X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 ) y = 4 *X + 10 *np.sin(X* 0.5 ) # set the figure size plt.figure(figsize=( 8 , 5 )) # plot the initial data for regression plt.scatter(X, y, label= 'Regression Data' , marker= 'o' ) plt.xlabel( 'X' ) plt.ylabel( 'y' ) plt.legend() plt.title( 'Regression data' ) plt.show()

Un graphique de la fonction sera ensuite affiché? Nous l’utiliserons pour tester les méthodes de régression.







Fig. 1. Fonction de test des modèles de régression







2. Modèles de Régression



L'objectif d'une tâche de régression est de trouver une fonction mathématique ou un modèle qui décrit au mieux la relation entre les caractéristiques et la variable cible afin de prédire les valeurs numériques des nouvelles données. Cela permet de faire des prévisions, d'optimiser les solutions et de prendre des décisions éclairées sur la base de ces données.

Considérons les principaux modèles de régression du paquet scikit-learn.

2.0. Liste des Modèles de Régression Scikit-learn

Pour afficher la liste des modèles de régression scikit-learn disponibles, vous pouvez utiliser le script suivant :

# ScikitLearnRegressors.py # The script lists all the regression algorithms available inb scikit-learn # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # print Python version from platform import python_version print ( "The Python version is " , python_version()) # print scikit-learn version import sklearn print ( 'The scikit-learn version is {}.' .format(sklearn.__version__)) # print scikit-learn regression models from sklearn.utils import all_estimators regressors = all_estimators(type_filter= 'regressor' ) for index, (name, RegressorClass) in enumerate(regressors, start= 1 ): print (f "Regressor {index}: {name}" )

Sortie :

The Python version is 3.10.8

The scikit-learn version is 1.3.2.

Regressor 1: ARDRegression

Regressor 2: AdaBoostRegressor

Regressor 3: BaggingRegressor

Regressor 4: BayesianRidge

Regressor 5: CCA

Regressor 6: DecisionTreeRegressor

Regressor 7: DummyRegressor

Regressor 8: ElasticNet

Regressor 9: ElasticNetCV

Regressor 10: ExtraTreeRegressor

Regressor 11: ExtraTreesRegressor

Regressor 12: GammaRegressor

Regressor 13: GaussianProcessRegressor

Regressor 14: GradientBoostingRegressor

Regressor 15: HistGradientBoostingRegressor

Regressor 16: HuberRegressor

Regressor 17: IsotonicRegression

Regressor 18: KNeighborsRegressor

Regressor 19: KernelRidge

Regressor 20: Lars

Regressor 21: LarsCV

Regressor 22: Lasso

Regressor 23: LassoCV

Regressor 24: LassoLars

Regressor 25: LassoLarsCV

Regressor 26: LassoLarsIC

Regressor 27: LinearRegression

Regressor 28: LinearSVR

Regressor 29: MLPRegressor

Regressor 30: MultiOutputRegressor

Regressor 31: MultiTaskElasticNet

Regressor 32: MultiTaskElasticNetCV

Regressor 33: MultiTaskLasso

Regressor 34: MultiTaskLassoCV

Regressor 35: NuSVR

Regressor 36: OrthogonalMatchingPursuit

Regressor 37: OrthogonalMatchingPursuitCV

Regressor 38: PLSCanonical

Regressor 39: PLSRegression

Regressor 40: PassiveAggressiveRegressor

Regressor 41: PoissonRegressor

Regressor 42: QuantileRegressor

Regressor 43: RANSACRegressor

Regressor 44: RadiusNeighborsRegressor

Regressor 45: RandomForestRegressor

Regressor 46: RegressorChain

Regressor 47: Ridge

Regressor 48: RidgeCV

Regressor 49: SGDRegressor

Regressor 50: SVR

Regressor 51: StackingRegressor

Regressor 52: TheilSenRegressor

Regressor 53: TransformedTargetRegressor

Regressor 54: TweedieRegressor

Regressor 55: VotingRegressor



Pour des raisons de commodité, les régresseurs sont mis en évidence dans des couleurs différentes. Les modèles qui nécessitent un modèle de régression de base sont surlignés en gris, alors que les autres modèles peuvent être utilisés indépendamment. Notez que les modèles exportés avec succès au format ONNX sont marqués en vert, les modèles qui rencontrent des erreurs lors de la conversion dans la version actuelle de scikit-learn 1.2.2 sont marqués en rouge. Les méthodes inadaptées à la tâche d'essai considérée sont surlignées en bleu.

L'analyse de la qualité de la régression utilise des mesures de régression, qui sont des fonctions des valeurs réelles et des valeurs prédites. Dans le langage MQL5, plusieurs métriques différentes sont disponibles. Elles sont détaillées dans l'article "Evaluation des modèles ONNX à l’aide de métriques de régression".



Dans cet article, 3 métriques seront utilisées pour comparer la qualité des différents modèles :

Le coefficient de détermination R-carré (R2) ; L’Erreur Absolue Moyenne (EAM) ; L’Erreur Quadratique Moyenne (EQM).





2.1. Modèles de régression Scikit-learn convertis en modèles ONNX float et double

Cette section présente les modèles de régression qui ont été convertis avec succès dans les formats ONNX en précision flottante et double.

Tous les modèles de régression examinés plus loin sont présentés sous la forme suivante :



Description du modèle, principe de fonctionnement, avantages et limites Script Python pour créer le modèle, l'exporter vers des fichiers ONNX aux formats float et double, et exécuter les modèles obtenus en utilisant le Runtime ONNX en Python. Des métriques telles que R^2, MAE, MSE, calculées à l'aide de sklearn.metrics, sont utilisées pour évaluer la qualité des modèles originaux et ONNX.

Script MQL5 pour l'exécution de modèles ONNX (float et double) via le Runtime ONNX, avec des métriques calculées en utilisant RegressionMetric().

Représentation du modèle ONNX dans Netron pour les précisions float et double.





2.1.1. sklearn.linear_model.ARDRegression

L’ARDRegression (Automatic Relevance Determination Regression) est une méthode de régression conçue pour résoudre les problèmes de régression en déterminant automatiquement l'importance (la pertinence) des caractéristiques et en établissant leurs poids au cours du processus d'apprentissage du modèle.



L’ARDRegression permet de détecter et d'utiliser uniquement les caractéristiques les plus importantes pour construire un modèle de régression, ce qui peut s'avérer utile lorsqu'on a affaire à un grand nombre de caractéristiques.



Principe de fonctionnement de l'ARDRegression :



Régression Linéaire : L’ARDRegression est basé sur la régression linéaire, en supposant une relation linéaire entre les variables indépendantes (caractéristiques) et la variable cible. Détermination Automatique de l'Importance des Caractéristiques : La principale caractéristique de l'ARDRegression est la détermination automatique des caractéristiques les plus importantes pour prédire la variable cible. Pour ce faire, on introduit des distributions préalables (régularisation) sur les poids, ce qui permet au modèle de fixer automatiquement des poids nuls pour les caractéristiques les moins significatives. Estimation des Probabilités Postérieures : L’ARDRegression calcule les probabilités postérieures pour chaque caractéristique, ce qui permet de déterminer leur importance. Les caractéristiques dont la probabilité a posteriori est élevée sont considérées comme pertinentes et reçoivent des poids non nuls, tandis que les caractéristiques dont la probabilité a posteriori est faible reçoivent des poids nuls. Réduction de la Dimensionnalité : Ainsi, l'ARDRegression peut conduire à une réduction de la dimensionnalité des données en supprimant les caractéristiques insignifiantes.

Avantages de l'ARDRegression :



Détermination Automatique des Caractéristiques Importantes : La méthode identifie et utilise automatiquement les caractéristiques les plus importantes, ce qui peut améliorer les performances du modèle et réduire le risque de sur-ajustement.

Résistance à la Multicolinéarité : L’ARDRegression gère bien la multicolinéarité, même lorsque les caractéristiques sont fortement corrélées.

Limites de l'ARDRegression :



Nécessite la Sélection de Distributions Préalables : Le choix de distributions préalables appropriées peut nécessiter une expérimentation.

Complexité de Calcul : L'apprentissage de l'ARDRegression peut être coûteux en termes de calcul, en particulier pour les grands ensembles de données.

L’ARDRegression est une méthode de régression qui détermine automatiquement l'importance des caractéristiques et établit leurs poids sur la base des probabilités a posteriori. Cette méthode est utile lorsque seules les caractéristiques significatives sont prises en compte pour construire un modèle de régression et qu'il est nécessaire de réduire la dimensionnalité des données.







2.1.1.1. Code pour créer le modèle ARDRegression et l'exporter vers ONNX pour float et double



Ce code crée le modèle sklearn.linear_model.ARDRegression, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée flottantes et doubles. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.



# ARDRegression.py

# Le code démontre le processus d'entraînement du modèle ARDRegressor, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == -1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min (decimal_places1, decimal_places2)



# initialise un compte pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ARDRegression

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name= "ARDRegression"

onnx_model_filename = data_path + "ard_regression"



# crée un modèle ARDRegression

regression_model = ARDRegression()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print (f "ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)



print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f "ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f"{ i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)



print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Le script crée et entraîne le modèle sklearn.linear_model.ARDRegression (le modèle original est considéré en type double), puis exporte le modèle vers ONNX pour les types float et double (ard_regression_float.onnx et ard_regression_double.onnx) et compare la précision de leurs fonctionnements.



Il génère également les fichiers ARDRegression_plot_float.png et ARDRegression_plot_double.png, permettant une évaluation visuelle des résultats des modèles ONNX pour float et double (Fig. 2-3).





Fig. 2. Résultats de ARDRegression.py (float)









Fig. 3. Résultats de ARDRegression.py (double)



Visuellement, les modèles ONNX pour les flottants et les doubles sont identiques (Fig. 2-3), des informations détaillées peuvent être trouvées dans l'onglet Journal :

Python ARDRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python Python ARDRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568 283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python ARDRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

Dans cet exemple, le modèle original a été considéré en double, puis il a été exporté dans les modèles ONNX ard_regression_float.onnx et ard_regression_double.onnx pour float et double, respectivement.



Si la précision du modèle est évaluée par l'Erreur Absolue Moyenne (MAE), la précision du modèle ONNX pour le flottant est de 6 décimales, alors que le modèle ONNX utilisant le type double a montré une rétention de précision jusqu'à 15 décimales, en ligne avec la précision du modèle original.



Les propriétés des modèles ONNX peuvent être visualisées dans MetaEditor (Fig. 4-5).









Fig. 4. Modèle ONNX ard_regression_float.onnx dans MetaEditor







Fig. 5. Modèle ONNX ard_regression_double.onnx dans MetaEditor





Une comparaison entre les modèles ONNX flottants et doubles montre que dans ce cas, le calcul des modèles ONNX pour ARDRegression se fait différemment : pour les nombres flottants, l'opérateur LinearRegressor() d'ONNX-ML est utilisé, alors que pour les nombres doubles, les opérateurs ONNX MatMul(), Add(), et Reshape() sont utilisés.

L'implémentation du modèle dans ONNX dépend du convertisseur ; dans les exemples d'export vers ONNX, la fonction skl2onnx.convert_sklearn() de la bibliothèque skl2onnx sera utilisée.







2.1.1.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles ONNX ard_regression_float.onnx et ard_regression_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ARDRegression" #define ONNXFilenameFloat "ard_regression_float.onnx" #define ONNXFilenameDouble "ard_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

ARDRegression (EURUSD,H1) Testing ONNX float : ARDRegression (ard_regression_float.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 ARDRegression (EURUSD,H1) ARDRegression (EURUSD,H1) Testing ONNX double : ARDRegression (ard_regression_double.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537597 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128795

Comparaison avec le modèle double original en Python :

Testing ONNX float : ARDRegression (ard_regression_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : ARDRegression (ard_regression_double.onnx) Python Mean Absolute Error: 6.34756801285375 8 MQL5: Mean Absolute Error: 6.34756801285375 97

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.







2.1.1.3. Les représentations ONNX des modèles ard_regression_float.onnx et ard_regression_double.onnx



Netron (version web) est un outil de visualisation des modèles et d'analyse des graphes de calcul, qui peut être utilisé pour les modèles au format ONNX (Open Neural Network Exchange).



Netron présente les graphes des modèles et leur architecture sous une forme claire et interactive, permettant l'exploration de la structure et des paramètres des modèles d'apprentissage profond, y compris ceux créés à l'aide d'ONNX.



Les principales caractéristiques de Netron sont les suivantes



Visualisation de graphiques : Netron affiche l'architecture du modèle sous forme de graphique, ce qui vous permet de voir les couches, les opérations et les connexions entre elles. Vous pouvez facilement comprendre la structure et le flux de données dans le modèle.

Exploration interactive : Vous pouvez sélectionner des nœuds dans le graphique pour obtenir des informations supplémentaires sur chaque opérateur et sur ses paramètres.

Prise en charge de différents formats : Netron prend en charge une variété de formats de modèles d'apprentissage profond, notamment ONNX, TensorFlow, PyTorch, CoreML, et d'autres.

Capacité d'analyse des paramètres : Vous pouvez visualiser les paramètres et les poids du modèle, ce qui est utile pour comprendre les valeurs utilisées dans les différentes parties du modèle.

Netron est pratique pour les développeurs et les chercheurs dans le domaine de l'apprentissage automatique et de l'apprentissage profond, car il simplifie la visualisation et l'analyse des modèles, aidant à la compréhension et au débogage des réseaux neuronaux complexes.

Cet outil permet d'inspecter rapidement les modèles, d'explorer leur structure et leurs paramètres, ce qui facilite le travail avec les réseaux neuronaux profonds.



Pour plus de détails sur Netron, consultez les articles : Visualisez votre réseau neuronal avec Netron et Visualize Keras Neural Networks with Netron.



Vidéo sur Netron :















Le modèle ard_regression_float.onnx est présenté à la figure 6 :

Fig. 6. Représentation du modèle ONNX ard_regression_float.onnx dans Netron

L'opérateur ONNX ai.onnx.ml LinearRegressor() fait partie de la norme ONNX, qui décrit un modèle pour les tâches de régression. Cet opérateur est utilisé pour la régression, il consiste à prédire des valeurs numériques (continues) sur la base de caractéristiques d'entrée.

Il prend en entrée les paramètres du modèle, tels que les poids et les biais, ainsi que les caractéristiques d'entrée, et exécute une régression linéaire. La régression linéaire estime les paramètres (poids) pour chaque caractéristique d'entrée et effectue ensuite une combinaison linéaire de ces caractéristiques avec les poids pour générer une prédiction.

Cet opérateur effectue les étapes suivantes :

Il prend les poids et les biais du modèle, ainsi que les caractéristiques d'entrée. Pour chaque exemple de données d'entrée, il effectue une combinaison linéaire des poids avec les caractéristiques correspondantes. Il ajoute le biais à la valeur obtenue. Le résultat est la prédiction de la variable cible dans la tâche de régression. Les paramètres de LinearRegressor() sont présentés à la figure 7.



Fig. 7. Les propriétés de l'opérateur LinearRegressor() du modèle ard_regression_float.onnx dans Netron

Le modèle ONNX ard_regression_double.onnx est présenté à la Fig. 8 : Le modèle ONNXest présenté à la Fig. 8 :

Fig. 8. Représentation ONNX du modèle ard_regression_double.onnx dans Netron

Les paramètres des opérateurs ONNX MatMul(), Add() et Reshape() sont présentés à la figure 9-11.

Fig. 9. Propriétés de l'opérateur MatMul dans le modèle ard_regression_double.onnx de Netron

L’opérateur ONNX MatMul (multiplication matricielle) effectue la multiplication de deux matrices.

Il prend deux entrées : deux matrices et renvoie leur produit matriciel. Si vous avez deux matrices, A et B, le résultat de Matmul(A, B) est une matrice C, où chaque élément C[i][j] est calculé comme la somme des produits des éléments de la ligne i de la matrice A par les éléments de la colonne j de la matrice B.



Fig. 10. Propriétés de l'opérateur Add dans le modèle ard_regression_double.onnx de Netron

L’opérateur ONNX Add() effectue l'addition par élément de deux tenseurs ou tableaux de même forme.

Il prend deux entrées et renvoie le résultat, où chaque élément du tenseur résultant est égal à la somme des éléments correspondants des tenseurs d'entrée.



Fig. 11. Propriétés de l'opérateur Reshape dans le modèle ard_regression_double.onnx de Netron

L’opérateur ONNX Reshape(-1,1) est utilisé pour modifier la forme (ou la dimension) des données d'entrée. Dans cet opérateur, la valeur -1 pour la dimension indique que la taille de cette dimension doit être automatiquement calculée sur la base des autres dimensions afin de garantir la cohérence des données.

La valeur 1 dans la deuxième dimension indique qu'après la transformation de la forme, chaque élément aura une seule sous-dimension.



2.1.2. sklearn.linear_model.BayesianRidge BayesianRidge est une méthode de régression qui utilise une approche bayésienne pour estimer les paramètres du modèle. Cette méthode permet de modéliser la distribution préalable des paramètres et de la mettre à jour en fonction des données pour obtenir la distribution postérieure des paramètres.

BayesianRidge est une méthode de régression bayésienne conçue pour prédire la variable dépendante en fonction d'une ou plusieurs variables indépendantes.



Principe de fonctionnement de BayesianRidge :

Distribution préalable des paramètres : Elle commence par la définition de la distribution préalable des paramètres du modèle. Cette distribution représente les connaissances préalables ou les hypothèses sur les paramètres du modèle avant l'examen des données. Dans le cas de BayesianRidge, des distributions préalables de forme gaussienne sont utilisées. Mise à jour de la distribution des paramètres : Une fois que la distribution préalable des paramètres est définie, elle est mise à jour en fonction des données. Pour ce faire, on utilise la théorie bayésienne, dans laquelle la distribution postérieure des paramètres est calculée à partir des données. Un aspect essentiel est l'estimation des hyper-paramètres, qui influencent la forme de la distribution postérieure. Prédiction : Après avoir estimé la distribution postérieure des paramètres, des prédictions peuvent être faites pour de nouvelles observations. Il en résulte une distribution des prévisions plutôt qu'une valeur ponctuelle unique, ce qui permet de prendre en compte l'incertitude des prévisions. Avantages de BayesianRidge :

Prise en compte de l'incertitude : BayesianRidge tient compte de l'incertitude des paramètres du modèle et des prévisions. Au lieu de prédictions ponctuelles, des intervalles de confiance sont fournis.

Régularisation : La méthode de régression bayésienne peut être utile pour la régularisation du modèle, en aidant à prévenir l'ajustement excessif.

Sélection automatique des caractéristiques : BayesianRidge peut déterminer automatiquement l'importance des caractéristiques en réduisant les poids des caractéristiques non significatives. Limites de BayesianRidge :

Complexité de calcul : La méthode nécessite des ressources de calcul pour estimer les paramètres et calculer la distribution postérieure.

Niveau d'abstraction élevé : Une connaissance plus approfondie des statistiques bayésiennes peut être nécessaire pour comprendre et utiliser BayesianRidge.

Ce n'est pas toujours le meilleur choix : La méthode BayesianRidge peut ne pas être la plus appropriée pour certaines tâches de régression, en particulier lorsqu'il s'agit de données limitées. BayesianRidge est utile dans les tâches de régression où l'incertitude des paramètres et des prédictions est importante et dans les cas où la régularisation du modèle est nécessaire.



2.1.2.1. Code pour créer le modèle BayesianRidge et l'exporter vers ONNX pour float et double Ce code crée le modèle sklearn.linear_model.BayesianRidge, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# BayesianRidge.py

# Le code démontre le processus d'entraînement du modèle BayesianRidge, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import BayesianRidge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "BayesianRidge"

onnx_model_filename = data_path + "bayesian_ridge"



# crée un modèle de régression bayésienne de type Ridge

regression_model = BayesianRidge()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ("

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places: " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )





# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' ) Sortie : Python BayesianRidge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python Python BayesianRidge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python BayesianRidge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

Fig. 12. Résultats de BayesianRidge.py (ONNX float)



2.1.2.2. Code MQL5 pour l'exécution des modèles ONNX Ce code exécute les modèles ONNX bayesian_ridge_float.onnx et bayesian_ridge_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5. #property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "BayesianRidge" #define ONNXFilenameFloat "bayesian_ridge_float.onnx" #define ONNXFilenameDouble "bayesian_ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); } Sortie : BayesianRidge (EURUSD,H1) Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 BayesianRidge (EURUSD,H1) BayesianRidge (EURUSD,H1) Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537624 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128866 Comparaison avec le modèle double original en Python : Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) Python Mean Absolute Error: 6.3475680128537 58 MQL5: Mean Absolute Error: 6.3475680128537 624 Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 13 décimales.



2.1.2.3. Représentation ONNX de bayesian_ridge_float.onnx et bayesian_ridge_double.onnx





Fig. 13. Représentation ONNX du bayesian_ridge_float.onnx dans Netron





Fig. 14. Représentation ONNX de bayesian_ridge_double.onnx dans Netron





Note sur les méthodes ElasticNet et ElasticNetCV

ElasticNet et ElasticNetCV sont deux méthodes d'apprentissage automatique apparentées utilisées pour régulariser les modèles de régression, en particulier la régression linéaire. Ils partagent des fonctionnalités communes mais diffèrent dans leur mode d'utilisation et dans leur mode d'application.



ElasticNet (Elastic Net Regression) :

Principe de Fonctionnement : ElasticNet est une méthode de régression qui combine Lasso (régularisation L1) et Ridge (régularisation L2). Il ajoute deux composantes de régularisation à la fonction de perte : l'une pénalise le modèle pour les grandes valeurs absolues des coefficients (comme Lasso), et l'autre pénalise le modèle pour les grands carrés des coefficients (comme Ridge).

ElasticNet est couramment utilisé en cas de multicolinéarité dans les données (lorsque les caractéristiques sont fortement corrélées) et lorsqu'une réduction de la dimensionnalité est nécessaire, ainsi que pour contrôler les valeurs des coefficients. ElasticNetCV (Elastic Net Cross-Validation) :

Principe de Fonctionnement : ElasticNetCV est une extension d'ElasticNet qui consiste à sélectionner automatiquement les hyper-paramètres optimaux alpha (le coefficient de mélange entre les régularisations L1 et L2) et lambda (la force de régularisation) en utilisant la validation croisée. Il passe par différentes valeurs alpha et lambda, en choisissant la combinaison la plus performante lors de la validation croisée.

Avantages : ElasticNetCV ajuste automatiquement les paramètres du modèle sur la base de la validation croisée, ce qui permet de sélectionner les valeurs optimales des hyper-paramètres sans qu'il soit nécessaire de procéder à un réglage manuel. Cela le rend plus pratique à utiliser et permet d'éviter l'ajustement excessif du modèle. Ainsi, la principale différence entre ElasticNet et ElasticNetCV est qu'ElasticNet est la méthode de régression appliquée aux données, alors qu'ElasticNetCV est un outil qui trouve automatiquement les valeurs optimales des hyper-paramètres pour le modèle ElasticNet à l'aide de la validation croisée. ElasticNetCV est utile lorsque vous avez besoin de trouver les meilleurs paramètres du modèle et de rendre le processus de réglage plus automatisé.





2.1.3. sklearn.linear_model.ElasticNet

ElasticNet est une méthode de régression qui représente une combinaison des régularisations L1 (Lasso) et L2 (Ridge).

Cette méthode est utilisée pour la régression, qui consiste à prédire les valeurs numériques d'une variable cible sur la base d'un ensemble de caractéristiques. ElasticNet aide à contrôler le sur-ajustement et prend en compte les pénalités L1 et L2 sur les coefficients du modèle.



Principe de fonctionnement d'ElasticNet :



Données d'Entrée : Il commence par l'ensemble de données original où se trouvent les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Fonction Objective : ElasticNet minimise la fonction de perte qui comprend deux composantes : l'erreur quadratique moyenne (MSE) et deux régularisations : L1 (Lasso) et L2 (Ridge). Cela signifie que la fonction objective se présente comme suit :

Fonction Objective = MSE + α * L1 + β * L2

Où α et β sont des hyper-paramètres qui contrôlent les poids des régularisations L1 et L2, respectivement. Recherche des Valeurs α et β Optimales : La méthode de validation croisée est généralement utilisée pour trouver les meilleures valeurs de α et β. Cela permet de sélectionner des valeurs qui établissent un équilibre entre la réduction de l'ajustement excessif et la préservation des caractéristiques essentielles. Modèle d’Entraînement : ElasticNet entraîne le modèle en considérant les α et β optimaux en minimisant la fonction objective. Prédiction : Une fois le modèle formé, ElasticNet peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages d'ElasticNet :



Capacité de Sélection des Caractéristiques : ElasticNet peut sélectionner automatiquement les caractéristiques les plus importantes en fixant les poids à zéro pour les caractéristiques non significatives (comme Lasso).

Contrôle du Sur-Ajustement : ElasticNet permet de contrôler le sur-ajustement grâce à la régularisation L1 et L2.

Traitement de la Multicolinéarité : Cette méthode est utile en cas de multicolinéarité (forte corrélation entre les caractéristiques), car la régularisation L2 peut réduire l'influence des caractéristiques multicolinéaires.

Limites d'ElasticNet :



Nécessite l'ajustement des hyper-paramètres α et β, ce qui peut être une tâche non triviale.

En fonction du choix des paramètres, ElasticNet peut retenir trop ou trop peu de caractéristiques, ce qui affecte la qualité du modèle.

ElasticNet est une méthode de régression puissante qui peut s'avérer utile dans les tâches où la sélection des caractéristiques et le contrôle de l'ajustement excessif sont cruciaux.



2.1.3.1. Code pour créer le modèle ElasticNet et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.ElasticNet, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# ElasticNet.py

# Le code démontre le processus d'entraînement d'un modèle ElasticNet, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNet

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0 . 5 )



model_name = "ElasticNet"

onnx_model_filename = data_path + "elastic_net"



# crée un modèle ElasticNet

regression_model = ElasticNet()



# ajuste le modèle aux données

regression_model.fit(X, y)



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print( "

" +model_name+ " Original model (double)" )

print( "R-carré (Coefficient de Détermination):" , r2)

print( "Erreur Absolue Moyenne :" , mae)

print( "Erreur Quadratique Moyenne :" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1 } . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python ElasticNet Original model ( double ) Python R-squared (Coefficient of determination): 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python Python ElasticNet ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377032416807 Python Mean Absolute Error: 6.344395027824294 Python Mean Squared Error: 49.78556400887057 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 5 Python MSE matching decimal places: 6 Python float ONNX model precision: 5 Python Python ElasticNet ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 15. Résultats de ElasticNet.py (ONNX float)

2.1.3.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles elastic_net_double.onnx et elastic_net_float.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNet" #define ONNXFilenameFloat "elastic_net_float.onnx" #define ONNXFilenameDouble "elastic_net_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

ElasticNet (EURUSD,H1) Testing ONNX float : ElasticNet (elastic_net_float.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377032416807 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443950278242944 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855640088705869 ElasticNet (EURUSD,H1) ElasticNet (EURUSD,H1) Testing ONNX double : ElasticNet (elastic_net_double.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377031744798 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443946628765220 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855648981241217

Comparaison avec le modèle double original en Python :

Testing ONNX float : ElasticNet (elastic_net_float.onnx) Python Mean Absolute Error: 6.34439 4662876524 MQL5: Mean Absolute Error: 6.34439 50278242944 Testing ONNX double : ElasticNet (elastic_net_double.onnx) Python Mean Absolute Error: 6.34439466287652 4 MQL5: Mean Absolute Error: 6.34439466287652 20

Précision de la MAE ONNX float : 5 décimales, Précision de la MAX ONNX double : 14 décimales.





2.1.3.3. Représentation ONNX de elastic_net_float.onnx et elastic_net_double.onnx







Fig. 16. Représentation ONNX de elastic_net_float.onnx dans Netron









Fig. 17. Représentation ONNX de elastic_net_double.onnx dans Netron







2.1.4. sklearn.linear_model.ElasticNetCV

ElasticNetCV est une extension de la méthode ElasticNet conçue pour sélectionner automatiquement les valeurs optimales des hyper-paramètres α et β (régularisation L1 et L2) en utilisant la validation croisée.



Cela permet de trouver la meilleure combinaison de régularisations pour le modèle ElasticNet sans qu'il soit nécessaire de régler manuellement les paramètres.



Principe de fonctionnement d'ElasticNetCV :



Données d'Entrée : Il commence par l'ensemble de données original contenant des caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Définition de l’Intervalle α et β : L'utilisateur spécifie la plage de valeurs pour α et β à prendre en compte lors de l'optimisation. Ces valeurs sont généralement choisies sur une échelle logarithmique. Fractionnement des Données : L'ensemble de données est divisé en plusieurs plis pour la validation croisée. Chaque pli est utilisé comme un ensemble de données de test, et les autres sont utilisés pour l’entraînement. Validation Croisée : Pour chaque combinaison de α et β dans l’intervalle spécifié, une validation croisée est effectuée. Le modèle ElasticNet est entraîné sur les données d'entraînement, puis évalué sur les données de test. Évaluation des Performances : L'erreur moyenne sur les ensembles de données de test dans la validation croisée est calculée pour chaque combinaison α et β. Sélection des Paramètres Optimaux : Les valeurs de α et β correspondant à l'erreur moyenne minimale obtenue lors de la validation croisée sont déterminées. Entraînement de Modèles avec des Paramètres Optimaux : Le modèle ElasticNetCV est formé en utilisant les valeurs optimales trouvées de α et β. Prédiction : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages d'ElasticNetCV :



Sélection automatique des hyper-paramètres : ElasticNetCV trouve automatiquement les valeurs optimales de α et β, ce qui simplifie la mise au point du modèle.

Prévention du Sur-Ajustement : La validation croisée permet de sélectionner un modèle ayant une bonne capacité de généralisation.

Résistance au Bruit : Cette méthode est robuste face au bruit des données et permet d'identifier la meilleure combinaison de régularisations tout en tenant compte du bruit.

Limites d'ElasticNetCV :



Complexité de Calcul : La validation croisée sur une large gamme de paramètres peut prendre beaucoup de temps.

Les Paramètres Optimaux Dépendent du Choix de l’Intervalle : Les résultats peuvent dépendre du choix de la plage α et β. Il est donc important d'ajuster soigneusement cet intervalle.

ElasticNetCV est un outil puissant permettant de régler automatiquement la régularisation dans le modèle ElasticNet et d'améliorer ses performances.



2.1.4.1. Code pour créer le modèle ElasticNetCV et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.ElasticNetCV, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.



# ElasticNetCV.py

# Le code démontre le processus d'entraînement du modèle ElasticNetCV, son export au format ONNX (à la fois float et double), et la réalisation de prédictions en utilisant les modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places(value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str(value1)

str_value2 = str(value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find(".")

dot_position2 = str_value2.find(".")



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcule le nombre de décimales

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else:

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNetCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[0]

last_index = data_path.rfind("\\") + 1

data_path = data_path[0:last_index]



# génère des données synthétiques pour la régression

X = np.arange(0,100,1).reshape(-1,1)

y = 4*X + 10*np.sin(X*0.5)



model_name = "ElasticNetCV"

onnx_model_filename = data_path + "elastic_net_cv"



# crée un modèle ElasticNetCV

regression_model = ElasticNetCV()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print("

"+model_name+" Original model (double)")

print("R-squared (Coefficient of determination):", r2)

print("Mean Absolute Error:", mae)

print("Mean Squared Error:", mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [('float_input', FloatTensorType([None, X.shape[1]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset=12)



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print("

"+model_name+" ONNX model (float)")

# affiche le chemin du modèle

print(f"ONNX model saved to {onnx_filename}")



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# affiche les informations sur les tenseurs de sortie dans ONNX

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[0]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print("R-carré (Coefficient de Détermination)", r2_onnx_float)

print("Erreur Absolue Moyenne :", mae_onnx_float)

print("Erreur Quadratique Moyenne :", mse_onnx_float)

print("R^2 matching decimal places : ", compare_decimal_places(r2, r2_onnx_float))

print("MAE matching decimal places : ", compare_decimal_places(mae, mae_onnx_float))

print("MSE matching decimal places : ", compare_decimal_places(mse, mse_onnx_float))

print("Précision du modèle ONNX float : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparaison (avec ONNX float)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_float.png')



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [('double_input', DoubleTensorType([None, X.shape[1]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+"_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print("

"+model_name+" Modèle ONNX (double)")

# affiche le chemin du modèle

print(f"ONNX model saved to {onnx_filename}")



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# affiche les informations sur les tenseurs de sortie dans ONNX

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print("R-carré (Coefficient de Détermination)", r2_onnx_double)

print("Erreur Absolue Moyenne :", mae_onnx_double)

print("Erreur Quadratique Moyenne :", mse_onnx_double)

print("R^2 matching decimal places : ", compare_decimal_places(r2, r2_onnx_double))

print("MAE matching decimal places : ", compare_decimal_places(mae, mae_onnx_double))

print("MSE matching decimal places : ", compare_decimal_places(mse, mse_onnx_double))

print("Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8,5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparaison (avec ONNX double)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_double.png')

Sortie :

Python ElasticNetCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python Python ElasticNetCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137770260989 Python Mean Absolute Error: 6.334486542922601 Python Mean Squared Error: 50.10217383894468 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python ElasticNetCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 18. Résultats de ElasticNetCV.py (ONNX float)

2.1.4.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles ONNX elastic_net_cv_float.onnx et elastic_net_cv_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNetCV" #define ONNXFilenameFloat "elastic_net_cv_float.onnx" #define ONNXFilenameDouble "elastic_net_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

ElasticNetCV (EURUSD,H1) Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137770260989 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344865429226038 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021738389446938 ElasticNetCV (EURUSD,H1) ElasticNetCV (EURUSD,H1) Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137763338385 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344871044232205 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021829994599983

Comparaison avec le modèle double original en Python :

Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) Python Mean Absolute Error: 6.33448 7104423225 MQL5: Mean Absolute Error: 6.33448 65429226038 Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) Python Mean Absolute Error: 6.33448710442322 5 MQL5: Mean Absolute Error: 6.33448710442322 05

Précision de la MAE ONNX float : 5 décimales, Précision de la MAX ONNX double : 14 décimales.



2.1.4.3. Représentation ONNX de elastic_net_cv_float.onnx et elastic_net_cv_double.onnx









Fig. 19. Représentation ONNX de elastic_net_cv_float.onnx dans Netron









Fig. 20. Représentation ONNX de elastic_net_cv_double.onnx dans Netron









2.1.5. sklearn.linear_model.HuberRegressor

HuberRegressor - est une méthode d'apprentissage automatique utilisée pour les tâches de régression, qui est une modification de la méthode des Moindres Carrés Ordinaires (MCO) et qui est conçue pour résister aux valeurs aberrantes dans les données.



Contrairement à OLS, qui minimise le carré des erreurs, HuberRegressor minimise une combinaison d'erreurs au carré et d'erreurs absolues. Cela permet à la méthode de fonctionner de manière plus robuste en présence de valeurs aberrantes dans les données.



Principe de Fonctionnement de HuberRegressor :



Données d'Entrée : Il commence par l'ensemble de données original, qui contient des caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Fonction de Perte de Huber : HuberRegressor utilise la fonction de perte de Huber, qui combine une fonction de perte quadratique pour les petites erreurs et une fonction de perte linéaire pour les grandes erreurs. La méthode est ainsi plus résistante aux valeurs aberrantes. Entraînement du Modèle : Le modèle est entraîné sur des données à l'aide de la fonction de perte de Huber. Pendant l'entraînement, il ajuste les poids (coefficients) de chaque caractéristique et le biais. Prédiction : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de HuberRegressor :



Robustesse face aux valeurs aberrantes : HuberRegressor est plus résistant aux valeurs aberrantes des données que OLS, ce qui le rend utile dans les tâches où les données peuvent contenir des valeurs anormales.

Estimation de l'Erreur : La fonction de perte de Huber contribue à l'estimation des erreurs de prédiction, ce qui peut être utile pour analyser les résultats du modèle.

Niveau de Régularisation : HuberRegressor peut également intégrer un niveau de régularisation, qui peut réduire l'ajustement excessif.

Limites de HuberRegressor :



Pas aussi précis que OLS en l'absence de valeurs aberrantes : Dans les cas où il n'y a pas de valeurs aberrantes dans les données, OLS peut fournir des résultats plus précis.

Réglage des Paramètres : HuberRegressor a un paramètre qui définit le seuil de ce qui est considéré comme "grand" pour passer à la fonction de perte linéaire. Ce paramètre doit être ajusté.

HuberRegressor est très utile dans les tâches de régression où les données peuvent contenir des valeurs aberrantes et où un modèle robuste à ces anomalies est nécessaire.





2.1.5.1. Code pour créer le modèle HuberRegressor et l'exporter vers ONNX pour float et double

Ce code crée le modèlesklearn.linear_model.HuberRegressor, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# HuberRegressor.py

# Le code démontre le processus d'entraînement du modèle HuberRegressor, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import HuberRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "HuberRegressor"

onnx_model_filename = data_path + "huber_regressor"



# crée un modèle de Régresseur de Huber

huber_regressor_model = HuberRegressor()



# ajuste le modèle aux données

huber_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = huber_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

"+model_name+" Original model (double)" )

print ( "R-carré (Coefficient de Détermination) :", r 2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(huber_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print( "Erreur Absolue Moyenne :" , mae_onnx_float)

print( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print( "R^2 matching decimal places: " , compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print( "MSE correspondant aux décimales : " , compare_decimal_places(mse, mse_onnx_float))

print( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(huber_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print( "

" +model_name +" ONNX model (double)" )

# affiche le chemin du modèle

print( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python HuberRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python Python HuberRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363944236795 Python Mean Absolute Error: 6.341633300252807 Python Mean Squared Error: 49.80288328126165 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python HuberRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 21. Résultats de HuberRegressor.py (ONNX float)







2.1.5.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles ONNX huber_regressor_float.onnx et huber_regressor_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "HuberRegressor" #define ONNXFilenameFloat "huber_regressor_float.onnx" #define ONNXFilenameDouble "huber_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

HuberRegressor (EURUSD,H1) Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363944236795 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416333002528074 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028832812616571 HuberRegressor (EURUSD,H1) HuberRegressor (EURUSD,H1) Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363935647066 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416337085696410 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028946478433525

Comparaison avec le modèle double original en Python :

Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) Python Mean Absolute Error: 6.341633 708569641 MQL5: Mean Absolute Error: 6.341633 3002528074 Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) Python Mean Absolute Error: 6.34163370856964 1 MQL5: Mean Absolute Error: 6.34163370856964 10

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.





2.1.5.3. Représentation ONNX de huber_regressor_float.onnx et huber_regressor_double.onnx











Fig. 22. Représentation ONNX de huber_regressor_float.onnx dans Netron









Fig. 23. Représentation ONNX de huber_regressor_double.onnx dans Netron









2.1.6. sklearn.linear_model.Lars

LARS (Least Angle Regression) est une méthode d'apprentissage automatique utilisée pour les tâches de régression. Il s'agit d'un algorithme qui construit un modèle de régression linéaire en sélectionnant des caractéristiques actives (variables) au cours du processus d'apprentissage.



LARS tente de trouver le moins de caractéristiques possibles qui fournissent la meilleure approximation de la variable cible.



Principe de Fonctionnement de LARS :



Données d'Entrée : Il commence par l'ensemble de données original, qui comprend des caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : Il commence par un modèle nul, ce qui signifie qu'il n'y a pas de caractéristiques actives. Tous les coefficients sont fixés à zéro. Sélection des Caractéristiques : A chaque étape, LARS sélectionne la caractéristique la plus corrélée avec les résidus du modèle. Cette caractéristique est ensuite ajoutée au modèle et son coefficient correspondant est ajusté par la méthode des moindres carrés. Régression le long des caractéristiques actives : Après avoir ajouté la caractéristique au modèle, LARS met à jour les coefficients de toutes les caractéristiques actives pour tenir compte des changements dans le nouveau modèle. Étapes Répétitives : Ce processus se poursuit jusqu'à ce que toutes les caractéristiques soient sélectionnées ou qu'un critère d'arrêt spécifié soit rempli. Prédiction : Après l'apprentissage du modèle, il peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LARS :



Efficacité : LARS peut être une méthode efficace, en particulier lorsqu'il existe de nombreuses caractéristiques, mais que seules quelques-unes d'entre elles ont une incidence significative sur la variable cible.

Interprétabilité : Étant donné que LARS vise à sélectionner uniquement les caractéristiques les plus informatives, le modèle reste relativement interprétable.

Limites de LARS :



Modèle Linéaire : LARS construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Incapacité à gérer la multicolinéarité : Si les caractéristiques sont fortement corrélées, LARS peut rencontrer des problèmes de multicolinéarité.

LARS est utile dans les tâches de régression où la sélection des caractéristiques les plus informatives et la construction d'un modèle linéaire avec un nombre minimal de caractéristiques sont essentielles.





2.1.6.1. Code pour créer le modèle Lars et l'exporter vers ONNX pour les float et pour les double

Ce code crée le modèle sklearn.linear_model.Lars, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# Lars.py

# Le code démontre le processus d'entraînement du modèle Lars, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Lars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = " Lars"

onnx_model_filename = data_path + "lars"



# crée un modèle Lars Regressor

lars_regressor_model = Lars()



# ajuste le modèle aux données

lars_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lars_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-carré (Coefficient de Détermination) :", r 2)

print ( "Erreur Absolue Moyenne :" , mae)

print ( "Erreur Quadratique Moyenne :" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print( "Erreur Absolue Moyenne :" , mae_onnx_double)

print( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print( "Précision du modèle ONNX double : " , compare_decimal_places(mae, mae_onnx_double))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python Lars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python Lars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python Lars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





Fig. 24. Résultats de Lars.py (float ONNX)







2.1.6.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles sauvegardés lars_cv_float.onnx et lars_cv_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lars" #define ONNXFilenameFloat "lars_float.onnx" #define ONNXFilenameDouble "lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

Lars (EURUSD,H1) Testing ONNX float : Lars (lars_float.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 Lars (EURUSD,H1) Lars (EURUSD,H1) Testing ONNX double : Lars (lars_double.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Comparaison avec le modèle double original en Python :

Testing ONNX float : Lars (lars_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : Lars (lars_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 13 décimales.





2.1.6.3. Représentation ONNX de lars_float.onnx et lars_double.onnx









Fig. 25. Représentation ONNX de lars_float.onnx dans Netron









Fig. 26. Représentation ONNX de lars_double.onnx dans Netron





2.1.7. sklearn.linear_model.LarsCV

LarsCV est une variante de la méthode LARS (Least Angle Regression) qui sélectionne automatiquement le nombre optimal de caractéristiques à inclure dans le modèle à l'aide de la validation croisée.



Cette méthode permet de trouver un équilibre entre un modèle qui généralise efficacement les données et un modèle qui utilise un nombre minimal de caractéristiques.



Principe de Fonctionnement de LarsCV :



Données d'Entrée : Il commence par l'ensemble de données original, qui comprend des caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : Il commence par un modèle nul, ce qui signifie qu'il n'y a pas de caractéristiques actives. Tous les coefficients sont fixés à zéro. Validation Croisée : LarsCV effectue une validation croisée pour différentes quantités de caractéristiques incluses. Cela permet d'évaluer les performances du modèle avec différents ensembles de caractéristiques. Sélection du nombre optimal de caractéristiques : LarsCV choisit le nombre de caractéristiques qui donne la meilleure performance du modèle, déterminée par validation croisée. Entraînement du Modèle : Le modèle est formé en utilisant le nombre choisi de caractéristiques et leurs coefficients respectifs. Prédiction : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LarsCV :



Sélection Automatique des Caractéristiques : LarsCV choisit automatiquement le nombre optimal de caractéristiques, ce qui simplifie le processus de configuration du modèle.

Interprétabilité : Tout comme LARS, LarsCV maintient une interprétabilité relativement élevée du modèle.

Efficacité : La méthode peut être efficace, en particulier lorsque les ensembles de données comportent de nombreuses caractéristiques, mais que seules quelques-unes sont significatives.

Limites de LarsCV :



Modèle Linéaire : LarsCV construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Incapacité à gérer la multicolinéarité : Si les caractéristiques sont fortement corrélées, LarsCV peut rencontrer des problèmes de multicolinéarité.

LarsCV est utile dans les tâches de régression où le choix automatique du meilleur ensemble de caractéristiques utilisées dans le modèle et le maintien de l'interprétabilité du modèle sont importants.





2.1.7.1. Code pour créer le modèle LarsCV et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LarsCV, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LarsCV.py

# Le code démontre le processus d'entraînement du modèle LarsCV, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LarsCV"

onnx_model_filename = data_path + "lars_cv"



# crée un modèle de Régresseur LarsCV

larscv_regressor_model = LarsCV()



# ajuste le modèle aux données

larscv_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = larscv_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(larscv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Informations sur les tenseurs d'entrée dans ONNX :")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(larscv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python LarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





Fig. 27. Résultats de LarsCV.py (float ONNX)





2.1.7.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles sauvegardés lars_cv_float.onnx et lars_cv_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LarsCV" #define ONNXFilenameFloat "lars_cv_float.onnx" #define ONNXFilenameDouble "lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

LarsCV (EURUSD,H1) Testing ONNX float : LarsCV (lars_cv_float.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LarsCV (EURUSD,H1) LarsCV (EURUSD,H1) Testing ONNX double : LarsCV (lars_cv_double.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : LarsCV (lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LarsCV (lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 16 décimales.





2.1.7.3. Représentation ONNX de lars_cv_float.onnx et lars_cv_double.onnx





Fig. 28. Représentation ONNX de lars_cv_float.onnx dans Netron









Fig. 29. Représentation ONNX de lars_cv_double.onnx dans Netron







2.1.8. sklearn.linear_model.Lasso

Lasso (Least Absolute Shrinkage and Selection Operator) est une méthode de régression utilisée pour sélectionner les caractéristiques les plus importantes et réduire la dimensionnalité du modèle.



Elle y parvient en ajoutant une pénalité pour la somme des valeurs absolues des coefficients (régularisation L1) dans le problème d'optimisation de la régression linéaire.



Principe de Fonctionnement du Lasso :



Données d'Entrée : Il commence par l'ensemble de données original, y compris les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Fonction Objective : La fonction objective du Lasso comprend la somme des carrés des erreurs de régression et une pénalité sur la somme des valeurs absolues des coefficients associés aux caractéristiques. Optimisation : Le modèle Lasso est formé en minimisant la fonction objective, ce qui a pour effet de rendre certains coefficients nuls, excluant ainsi les caractéristiques correspondantes du modèle. Sélection de la Valeur Optimale de la Pénalité : Lasso inclut un hyper-paramètre qui détermine l'intensité de la régularisation. Le choix de la valeur optimale de cet hyper-paramètre peut nécessiter une validation croisée. Générer des Prédictions : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de Lasso :



Sélection des Caractéristiques : Lasso sélectionne automatiquement les caractéristiques les plus importantes, en excluant les moins significatives du modèle. Cela permet de réduire la dimensionnalité des données et de simplifier le modèle.

Régularisation : La pénalité sur la somme des valeurs absolues des coefficients permet d'éviter l'ajustement excessif du modèle et d'améliorer sa généralisation.

Interprétabilité : Comme Lasso exclut certaines caractéristiques, le modèle reste relativement interprétable.

Limites de Lasso :



Modèle Linéaire : Lasso construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Incapacité à gérer la multicolinéarité : Si les caractéristiques sont fortement corrélées, le Lasso peut rencontrer des problèmes de multicolinéarité.

Lasso est utile dans les tâches de régression où la sélection des caractéristiques les plus importantes et la réduction de la dimensionnalité du modèle tout en maintenant l'interprétabilité sont essentielles.





2.1.8.1. Code pour créer le modèle Lasso et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.Lasso, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# Lasso.py

# Le code démontre le processus d'entraînement du modèle Lasso, son export au format ONNX (à la fois float et double), et la réalisation de prédictions en utilisant les modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range ( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Lasso

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "Lasso"

onnx_model_filename = data_path + "lasso"



# crée un modèle Lasso

lasso_model = Lasso()



# ajuste le modèle aux données

lasso_model.fit(X, y)



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lasso_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Erreur Absolue Moyenne :" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lasso_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lasso_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python Lasso Original model ( double ) Python R-squared (Coefficient of determination): 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python Python Lasso ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381720269486 Python Mean Absolute Error: 6.346395056911361 Python Mean Squared Error: 49.77936068668213 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python Lasso ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15









Fig. 30. Résultats de Lasso.py (ONNX float)





2.1.8.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles sauvegardés lasso_float.onnx et lasso_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lasso" #define ONNXFilenameFloat "lasso_float.onnx" #define ONNXFilenameDouble "lasso_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

Lasso (EURUSD,H1) Testing ONNX float : Lasso (lasso_float.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381720269486 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463950569113612 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793606866821037 Lasso (EURUSD,H1) Lasso (EURUSD,H1) Testing ONNX double : Lasso (lasso_double.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381735682287 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463937919229840 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793402912937850

Comparaison avec le modèle double original en Python :

Testing ONNX float : Lasso (lasso_float.onnx) Python Mean Absolute Error: 6.34639 3791922984 MQL5: Mean Absolute Error: 6.34639 50569113612 Testing ONNX double : Lasso (lasso_double.onnx) Python Mean Absolute Error: 6.346393791922984 MQL5: Mean Absolute Error: 6.346393791922984 0

Précision de la MAE ONNX float : 5 décimales, Précision de la MAX ONNX double : 15 décimales.





2.1.8.3. Représentation ONNX de lasso_float.onnx et lasso_double.onnx









Fig. 31. Représentation ONNX de lasso_float.onnx dans Netron













Fig. 32. Représentation ONNX de lasso_double.onnx dans Netron







2.1.9. sklearn.linear_model.LassoCV

LassoCV est une variante de la méthode Lasso (Least Absolute Shrinkage and Selection Operator) qui sélectionne automatiquement la valeur optimale de l'hyper-paramètre de régularisation (alpha) à l'aide de la validation croisée.



Cette méthode permet de trouver un équilibre entre la réduction de la dimensionnalité du modèle (sélection des caractéristiques importantes) et la prévention de l'ajustement excessif, ce qui la rend utile pour les tâches de régression.



Principe de fonctionnement de LassoCV :



Données d'Entrée : Il commence par l'ensemble de données original, y compris les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : LassoCV initialise plusieurs valeurs différentes de l'hyper-paramètre de régularisation (alpha) qui couvrent une plage allant de faible à élevée. Validation Croisée : Pour chaque valeur alpha, LassoCV effectue une validation croisée afin d'évaluer les performances du modèle. Des mesures telles que l'erreur quadratique moyenne (MSE) ou le coefficient de détermination (R^2) sont couramment utilisées. Sélection de l'Alpha Optimal : LassoCV sélectionne la valeur alpha pour laquelle le modèle obtient la meilleure performance déterminée par validation croisée. Entraînement du Modèle : Le modèle Lasso est formé en utilisant la valeur alpha choisie, en excluant les caractéristiques moins importantes et en appliquant la régularisation L1. Générer des Prédictions : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LassoCV :



Sélection Automatique de l'Alpha : LassoCV sélectionne automatiquement la valeur alpha optimale à l'aide de la validation croisée, ce qui simplifie la mise au point du modèle.

Sélection des Caractéristiques : LassoCV sélectionne automatiquement les caractéristiques les plus importantes, réduisant ainsi la dimensionnalité du modèle et simplifiant son interprétation.

Régularisation : La méthode empêche le sur-ajustement du modèle grâce à la régularisation L1.

Limites de LassoCV :



Modèle Linéaire : LassoCV construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Incapacité à gérer la multicolinéarité : Lorsque les caractéristiques sont fortement corrélées, le modèle LassoCV peut être confronté à des problèmes de multicolinéarité.

LassoCV est utile dans les tâches de régression où il est important de sélectionner les caractéristiques les plus importantes et de réduire la dimensionnalité du modèle tout en maintenant l'interprétabilité et en évitant le sur-ajustement.





2.1.9.1. Code pour créer le modèle LassoCV et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LassoCV, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LassoCV.py

# Le code démontre le processus d'entraînement du modèle LassoCV, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(-1,1)

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoCV"

onnx_model_filename = data_path + "lasso_cv"



# crée un modèle de Régresseur LassoCV

lassocv_regressor_model = LassoCV()



# ajuste le modèle aux données

lassocv_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lassocv_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python LassoCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python Python LassoCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.996224142876629 Python Mean Absolute Error: 6.335673221332177 Python Mean Squared Error: 49.96500504333324 Python R^ 2 matching decimal places: 10 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 6 Python float ONNX model precision: 6 Python Python LassoCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig. 33. Résultats de LassoCV.py (float ONNX)



2.1.9.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles lasso_cv_float.onnx et lasso_cv_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoCV" #define ONNXFilenameFloat "lasso_cv_float.onnx" #define ONNXFilenameDouble "lasso_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

2023.10 . 26 22 : 14 : 00.736 LassoCV (EURUSD,H1) Testing ONNX float : LassoCV (lasso_cv_float.onnx) 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428766290 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356732213321800 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650050433332211 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) Testing ONNX double : LassoCV (lasso_cv_double.onnx) 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428413416 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356733445381899 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650055102816992

Comparaison avec le modèle double original en Python :

Testing ONNX float : LassoCV (lasso_cv_float.onnx) Python Mean Absolute Error: 6.335673 34453819 MQL5: Mean Absolute Error: 6.335673 2213321800 Testing ONNX double : LassoCV (lasso_cv_double.onnx) Python Mean Absolute Error: 6.3356733445381 9 MQL5: Mean Absolute Error: 6.3356733445381 899

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 13 décimales.





2.1.9.3. Représentation ONNX de lasso_cv_float.onnx et lasso_cv_double.onnx





Fig. 34. Représentation ONNX de lasso_cv_float.onnx dans Netron









Fig. 35. Représentation ONNX de lasso_cv_double.onnx dans Netron







2.1.10. sklearn.linear_model.LassoLars

LassoLars est une combinaison de deux méthodes : Lasso (Least Absolute Shrinkage and Selection Operator) et LARS (Least Angle Regression).



Cette méthode est utilisée pour les tâches de régression et combine les avantages des deux algorithmes, permettant une sélection simultanée des caractéristiques et une réduction de la dimensionnalité du modèle.



Principe de Fonctionnement de LassoLars :



Données d'Entrée : Il commence par l'ensemble de données original, y compris les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : LassoLars commence avec un modèle nul, ce qui signifie qu'il n'y a pas de caractéristiques actives. Tous les coefficients sont fixés à zéro. Sélection Progressive des Caractéristiques : Comme la méthode LARS, LassoLars sélectionne, à chaque étape, la caractéristique la plus corrélée avec les résidus du modèle et l'ajoute au modèle. Le coefficient de cette caractéristique est ensuite ajusté en utilisant la méthode des moindres carrés. Application de la Régularisation L1 : Parallèlement à la sélection progressive des caractéristiques, LassoLars applique la régularisation L1, en ajoutant une pénalité pour la somme des valeurs absolues des coefficients. Cela permet de modéliser des relations complexes et de choisir les caractéristiques les plus importantes. Faire des Prédictions : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LassoLars :



Sélection des Caractéristiques : LassoLars sélectionne automatiquement les caractéristiques les plus importantes et réduit la dimensionnalité du modèle, ce qui permet d'éviter l'ajustement excessif et de simplifier l'interprétation.

Interprétabilité : La méthode maintient l'interprétabilité du modèle, ce qui permet de déterminer facilement quelles caractéristiques sont incluses et comment elles influencent la variable cible.

Régularisation : LassoLars applique la régularisation L1, empêchant l'ajustement excessif et améliorant la généralisation du modèle.

Limites de LassoLars :



Modèle Linéaire : LassoLars construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Complexité de Calcul : La sélection des caractéristiques à chaque étape et l'application d'une régularisation peuvent nécessiter davantage de ressources informatiques qu'une simple régression linéaire.

LassoLars est utile dans les tâches de régression où il est important de choisir les caractéristiques les plus importantes, de réduire la dimensionnalité du modèle et de maintenir l'interprétabilité.





2.1.10.1. Code pour créer le modèle LassoLars et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LassoLars, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LassoLars.py

# Le code démontre le processus d'entraînement du modèle LassoLars, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLars"

onnx_model_filename = data_path + "lasso_lars"



# crée un modèle Régresseur LassoLars

lassolars_regressor_model = LassoLars(alpha= 0.1 )



# ajuste le modèle aux données

lassolars_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lassolars_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )



Sortie :

Python LassoLars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python Python LassoLars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382635045889 Python Mean Absolute Error: 6.3476034814795375 Python Mean Squared Error: 49.77815018516975 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





Fig. 36. Résultat de LassoLars.py (float)





2.1.10.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les fichiers sauvegardés lasso_lars_float.onnx et lasso_lars_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLars" #define ONNXFilenameFloat "lasso_lars_float.onnx" #define ONNXFilenameDouble "lasso_lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

LassoLars (EURUSD,H1) Testing ONNX float : LassoLars (lasso_lars_float.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382635045889 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476034814795375 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781501851697357 LassoLars (EURUSD,H1) LassoLars (EURUSD,H1) Testing ONNX double : LassoLars (lasso_lars_double.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382633544077 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476035128950858 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781521724819029

Comparaison avec le modèle double original en Python :

Testing ONNX float : LassoLars (lasso_lars_float.onnx) Python Mean Absolute Error: 6.347603 5128950805 MQL5: Mean Absolute Error: 6.347603 4814795375 Testing ONNX double : LassoLars (lasso_lars_double.onnx) Python Mean Absolute Error: 6.34760351289508 05 MQL5: Mean Absolute Error: 6.34760351289508 58

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.





2.1.10.3. Représentation ONNX de lasso_lars_float.onnx et lasso_lars_double.onnx









Fig. 37. Représentation ONNX de lasso_lars_float.onnx dans Netron













Fig. 38. Représentation ONNX de lasso_lars_double.onnx dans Netron





2.1.11. sklearn.linear_model.LassoLarsCV

LassoLarsCV est une méthode qui combine Lasso (Least Absolute Shrinkage and Selection Operator) et LARS (Least Angle Regression) avec une sélection automatique de l'hyper-paramètre de régularisation optimal (alpha) à l'aide de la validation croisée.



Cette méthode combine les avantages des deux algorithmes et permet de déterminer la valeur alpha optimale pour le modèle, en tenant compte de la sélection des caractéristiques et de la régularisation.



Principe de Fonctionnement de LassoLarsCV :



Données d'Entrée : Il commence par l'ensemble de données original, y compris les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : LassoLarsCV commence par un modèle nul, dans lequel tous les coefficients sont fixés à 0. Définition de l’Intervalle Alpha : Un intervalle de valeurs pour l'hyper-paramètre alpha est déterminé, et sera pris en compte lors du processus de sélection. En général, on utilise une échelle logarithmique des valeurs alpha. Validation Croisée : Pour chaque valeur alpha de l'intervalle choisi, LassoLarsCV effectue une validation croisée afin d'évaluer les performances du modèle avec cette valeur alpha. On utilise généralement des mesures telles que l'erreur quadratique moyenne (MSE) ou le coefficient de détermination (R^2). Sélection de l'Alpha Optimal : LassoLarsCV choisit la valeur alpha pour laquelle le modèle obtient les meilleures performances sur la base des résultats de la validation croisée. Entraînement du Modèle : Le modèle LassoLars est entraîné en utilisant la valeur alpha sélectionnée, en excluant les caractéristiques moins importantes et en appliquant la régularisation L1. Faire des Prédictions : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LassoLarsCV :

Sélection Automatique de l'Alpha : LassoLarsCV sélectionne automatiquement l'hyper-paramètre alpha optimal à l'aide de la validation croisée, ce qui simplifie la mise au point du modèle.

Sélection des Caractéristiques : LassoLarsCV choisit automatiquement les caractéristiques les plus importantes et réduit la dimensionnalité du modèle.

Régularisation : La méthode applique la régularisation L1, qui empêche l'ajustement excessif et améliore la généralisation du modèle.

Limites de LassoLarsCV :



Modèle Linéaire : LassoLarsCV construit un modèle linéaire, qui peut s'avérer insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Complexité de Calcul : La sélection des caractéristiques à chaque étape et l'application d'une régularisation peuvent nécessiter davantage de ressources informatiques qu'une simple régression linéaire.

LassoLarsCV est utile dans les tâches de régression où il est essentiel de choisir les caractéristiques les plus importantes, de réduire la dimensionnalité du modèle, d'empêcher le sur-ajustement et d'ajuster automatiquement les hyper-paramètres du modèle.





2.1.11.1. Code pour créer le modèle LassoLarsCV et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LassoLarsCV, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LassoLarsCV.py

# Le code démontre le processus d'entraînement du modèle LassoLars, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 ,1).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLarsCV"

onnx_model_filename = data_path + "lasso_lars_cv"



# crée un modèle de Régresseur LassoLarsCV

lassolars_cv_regressor_model = LassoLarsCV(cv= 5 )



# ajuste le modèle aux données

lassolars_cv_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lassolars_cv_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ("

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python LassoLarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LassoLarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





Fig. 39. Résultats de LassoLarsCV.py (ONNX float)





2.1.11.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles lasso_lars_cv_float.onnx et lasso_lars_cv_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsCV" #define ONNXFilenameFloat "lasso_lars_cv_float.onnx" #define ONNXFilenameDouble "lasso_lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

LassoLarsCV (EURUSD,H1) Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LassoLarsCV (EURUSD,H1) LassoLarsCV (EURUSD,H1) Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

Comparaison avec le modèle double original en Python :

Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 16 décimales.





2.1.11.3. Représentation ONNX de lasso_lars_cv_float.onnx et lasso_lars_cv_double.onnx









Fig. 40. Représentation ONNX de lasso_lars_cv_float.onnx dans Netron









Fig. 41. Représentation ONNX de lasso_lars_cv_double.onnx dans Netron







2.1.12. sklearn.linear_model.LassoLarsIC

LassoLarsIC est une méthode de régression qui combine Lasso (Least Absolute Shrinkage and Selection Operator) et le Critère d'Information (IC) pour sélectionner automatiquement l'ensemble optimal de caractéristiques.



Il utilise des critères d'information tels que l'AIC (Critère d'Information d'Akaike) et le BIC (Critère d'Information Bayésien) pour déterminer les caractéristiques à inclure dans le modèle et applique la régularisation L1 pour estimer les coefficients du modèle.



Principe de Fonctionnement de LassoLarsIC :



Données d'Entrée : Il commence par l'ensemble de données original, y compris les caractéristiques (variables indépendantes) et les valeurs correspondantes de la variable cible. Initialisation : LassoLarsIC commence par un modèle nul, c'est-à-dire sans caractéristiques actives. Tous les coefficients sont fixés à zéro. Sélection de Caractéristiques à l'aide du Critère d'Information : La méthode évalue le critère d'information (par exemple, AIC ou BIC) pour différents ensembles de caractéristiques, en partant d'un modèle vide et en incorporant progressivement des caractéristiques dans le modèle. Le critère d'information évalue la qualité du modèle, en tenant compte du compromis entre l'adaptation aux données et la complexité du modèle. Sélection de l'Ensemble Optimal de Caractéristiques : LassoLarsIC choisit l'ensemble de caractéristiques pour lequel le critère d'information atteint la meilleure valeur. Cet ensemble de caractéristiques sera inclus dans le modèle. Application de la Régularisation L1 : La régularisation L1 est appliquée aux caractéristiques sélectionnées, ce qui facilite l'estimation des coefficients du modèle. Faire des Prédictions : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs des variables cibles pour de nouvelles données.

Avantages de LassoLarsIC :



Sélection Automatique des Caractéristiques : LassoLarsIC choisit automatiquement l'ensemble de caractéristiques optimal, réduisant la dimensionnalité du modèle et évitant l'ajustement excessif.

Critères d'Information : L'utilisation de critères d'information permet d'équilibrer la qualité et la complexité du modèle.

Régularisation : La méthode applique la régularisation L1, qui empêche l'ajustement excessif et améliore la généralisation du modèle.

Limites de LassoLarsIC :



Modèle Linéaire : LassoLarsIC construit un modèle linéaire, qui peut être insuffisant pour modéliser des relations non linéaires complexes.

Sensibilité au Bruit : La méthode peut être sensible aux valeurs aberrantes des données.

Complexité de Calcul : L'évaluation des critères d'information pour divers ensembles de caractéristiques pourrait nécessiter des ressources informatiques supplémentaires.

LassoLarsIC est utile dans les tâches de régression où la sélection automatique du meilleur ensemble de caractéristiques et la réduction de la dimensionnalité du modèle sur la base de critères d'information sont cruciales.





2.1.12.1. Code pour créer le modèle LassoLarsIC et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LassoLarsIC, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LassoLarsIC.py

# Le code démontre le processus d'entraînement du modèle LassoLarsIC, son export au format ONNX (à la fois float et double), et la réalisation de prédictions en utilisant les modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLarsIC

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name= "LassoLarsIC"

onnx_model_filename = data_path + "lasso_lars_ic "



# crée un modèle de Régresseur LassoLarsIC

lasso_lars_ic_regressor_model = LassoLarsIC(criterion= 'aic' )



# ajuste le modèle aux données

lasso_lars_ic_regressor_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = lasso_lars_ic_regressor_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python LassoLarsIC Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python LassoLarsIC ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsIC ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





Fig. 42. Résultats de LassoLarsIC.py (ONNX float)





2.1.12.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles lasso_lars_ic_float.onnx et lasso_lars_ic_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsIC" #define ONNXFilenameFloat "lasso_lars_ic_float.onnx" #define ONNXFilenameDouble "lasso_lars_ic_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

LassoLarsIC (EURUSD,H1) Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LassoLarsIC (EURUSD,H1) LassoLarsIC (EURUSD,H1) Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 13 décimales.





2.1.12.3. Représentation ONNX de lasso_lars_ic_float.onnx et lasso_lars_ic_double.onnx









Fig. 43. Représentation ONNX de lasso_lars_ic_float.onnx dans Netron





Fig. 44. Représentation ONNX de lasso_lars_ic_double.onnx dans Netron













2.1.13. sklearn.linear_model.LinearRegression

LinearRegression est l'une des méthodes les plus simples et les plus utilisées dans l'apprentissage automatique pour les tâches de régression.



Elle est utilisée pour construire des modèles linéaires qui prédisent des valeurs numériques (continues) de la variable cible sur la base d'une combinaison linéaire de caractéristiques d'entrée.



Principe de Fonctionnement de la Régression Linéaire :



Modèle Linéaire : Le LinearRegression suppose qu'il existe une relation linéaire entre les variables indépendantes (caractéristiques) et la variable cible. Cette relation peut être exprimée par l'équation de régression linéaire:y = β₀ + β₁x₁ + β₂x₂ + .... + βₚxₚ, où y est la variable cible, β₀ est le coefficient d'interception, β₁, β₂, ... βₚ sont les coefficients des caractéristiques et x₁, x₂, ... xₚ sont les valeurs des caractéristiques. Estimation des Paramètres : L'objectif de la régression linéaire est d'estimer les coefficients β₀, β₁, β₂, ... βₚ, qui correspondent le mieux aux données. Pour cela, on utilise généralement la méthode des Moindres Carrés Ordinaires (Ordinary Least Squares - OLS), qui minimise la somme des différences quadratiques entre les valeurs réelles et les valeurs prédites. Évaluation du Modèle : Diverses mesures telles que l'Erreur Quadratique Moyenne (Mean Squared Error, MSE), le Coefficient de Détermination (R²), entre autres, sont utilisées pour évaluer la qualité du modèle de régression linéaire.

Avantages de LinearRegression :



Simplicité et Interprétabilité : La régression linéaire est une méthode simple et facile à interpréter, qui permet d'analyser l'influence de chaque caractéristique sur la variable cible.

Vitesse Elevée d'Entraînement et de Prédiction : Le modèle de régression linéaire présente des vitesses d'apprentissage et de prédiction élevées, ce qui en fait un bon choix pour les grands ensembles de données.

Applicabilité : LinearRegression peut être appliqué avec succès à diverses tâches de régression.

Limites de LinearRegression :



Linéarité : Cette méthode suppose la linéarité de la relation entre les caractéristiques et la variable cible, ce qui peut s'avérer insuffisant pour modéliser des dépendances non linéaires complexes.

Sensibilité aux Valeurs Aberrantes : LinearRegression est sensible aux valeurs aberrantes des données, qui peuvent affecter la qualité du modèle.

LinearRegression est une méthode de régression simple et largement utilisée qui construit un modèle linéaire pour prédire les valeurs numériques de la variable cible sur la base d'une combinaison linéaire de caractéristiques d'entrée. Elle est bien adaptée aux problèmes présentant une relation linéaire et lorsque l'interprétabilité du modèle est importante.





2.1.13.1. Code pour créer le modèle LinearRegression et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.LinearRegression, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# LinearRegression.py

# Le code démontre le processus d'apprentissage du modèle de régression linéaire, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LinearRegression"

onnx_model_filename = data_path + "linear_regression"



# crée un modèle de régression linéaire

linear_model = LinearRegression()



# ajuste le modèle aux données

linear_model.fit(X, y)



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = linear_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(linear_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data ', marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(linear_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name +' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python LinearRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python LinearRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LinearRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 45. Résultats de LinearRegression.py (ONNX float)





2.1.13.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les fichiers linear_regression_float.onnx et linear_regression_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LinearRegression" #define ONNXFilenameFloat "linear_regression_float.onnx" #define ONNXFilenameDouble "linear_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

LinearRegression (EURUSD,H1) Testing ONNX float : LinearRegression (linear_regression_float.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LinearRegression (EURUSD,H1) LinearRegression (EURUSD,H1) Testing ONNX double : LinearRegression (linear_regression_double.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : LinearRegression (linear_regression_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LinearRegression (linear_regression_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.





2.1.13.3. Représentation ONNX de linear_regression_float.onnx et linear_regression_double.onnx









Fig. 46. Représentation ONNX de linear_regression_float.onnx dans Netron













Fig. 47. Représentation ONNX de linear_regression_double.onnx dans Netron









Note sur les méthodes Ridge et RidgeCV



Ridge et RidgeCV sont deux méthodes apparentées d'apprentissage automatique utilisées pour la régularisation dans la régression Ridge. Elles ont des fonctionnalités similaires mais diffèrent dans leur utilisation et dans le réglage des paramètres.



Principe de Fonctionnement de Ridge (Ridge Regression) :

Ridge est une méthode de régression impliquant une régularisation L2. Cela signifie qu'elle ajoute la somme des coefficients carrés (norme L2) à la fonction de perte minimisée par le modèle. Ce terme de régularisation supplémentaire permet de réduire l'ampleur des coefficients du modèle, évitant ainsi un sur-ajustement.

Utilisation du paramètre alpha : Dans la méthode Ridge, le paramètre alpha (également connu sous le nom de force de régularisation) est prédéfini et n'est pas modifié automatiquement. Les utilisateurs doivent choisir une valeur alpha appropriée en fonction de leur connaissance des données et des expériences. Principe de Fonctionnement de RidgeCV (Ridge Cross-Validation) :

RidgeCV est une extension de la méthode Ridge, qui consiste à sélectionner automatiquement la valeur optimale du paramètre alpha à l'aide de la validation croisée. Au lieu de définir manuellement l'alpha, RidgeCV itère entre différentes valeurs d'alpha et choisit celle qui fournit les meilleures performances en validation croisée.

Avantage du réglage automatique : Le principal avantage de RidgeCV est la détermination automatique de la valeur alpha optimale, sans qu'il soit nécessaire de procéder à un ajustement manuel. Cela rend le processus de réglage plus pratique et évite les erreurs potentielles dans la sélection de l'alpha. La principale différence entre Ridge et RidgeCV est que Ridge demande aux utilisateurs de spécifier explicitement la valeur du paramètre alpha, alors que RidgeCV trouve automatiquement la valeur alpha optimale à l'aide de la validation croisée. RidgeCV est généralement un choix plus judicieux lorsque l'on traite un grand nombre de données et que l'on souhaite éviter un réglage manuel des paramètres.







2.1.14. sklearn.linear_model.Ridge

Ridge est une méthode de régression utilisée dans l'apprentissage automatique pour résoudre les problèmes de régression. Il fait partie de la famille des modèles linéaires et représente une régression linéaire régularisée.



La principale caractéristique de la régression Ridge est l'ajout d'une régularisation L2 à la méthode standard des moindres carrés ordinaires (MCO).



Comment Fonctionne la Régression Ridge :



Régression Linéaire : Comme la régression linéaire classique, la régression Ridge vise à trouver une relation linéaire entre les variables indépendantes (caractéristiques) et la variable cible. Régularisation L2 : La principale distinction de la régression Ridge est l'ajout d'une régularisation L2 à la fonction de perte. Cela signifie qu'une pénalité pour les valeurs élevées des coefficients de régression est ajoutée à la somme des carrés des différences entre les valeurs réelles et les valeurs prédites. Coefficients de pénalisation : La régularisation L2 impose une pénalité sur les valeurs des coefficients de régression. Par conséquent, certains coefficients tendent à être plus proches de 0, ce qui réduit l'ajustement excessif et améliore la stabilité du modèle. Hyper-paramètre α : L'un des paramètres essentiels de la régression Ridge est l'hyper-paramètre α (alpha), qui détermine le degré de régularisation. Des valeurs α plus élevées conduisent à une régularisation plus forte, ce qui se traduit par des modèles plus simples avec des valeurs de coefficient plus faibles.

Avantages de la régression Ridge :



Réduction de l'ajustement excessif : La régularisation L2 dans Ridge permet de réduire le sur-ajustement et de rendre le modèle plus robuste face au bruit des données.

Traitement de la multicolinéarité : La régression Ridge permet de résoudre les problèmes de multicolinéarité, en particulier lorsque les caractéristiques sont fortement corrélées.

La malédiction de la dimensionnalité : Ridge est utile dans les scénarios comportant de nombreuses caractéristiques, où les MCO peuvent être instables.

Limites de la régression Ridge :



Il n'élimine pas les caractéristiques : La régression Ridge n'annule pas les coefficients des caractéristiques, mais les réduit, ce qui signifie que certaines caractéristiques peuvent subsister dans le modèle.

Choix de la valeur optimale de α : La sélection de la valeur correcte de l'hyper-paramètre α peut nécessiter une validation croisée.

La régression Ridge est une méthode de régression qui introduit une régularisation L2 dans la régression linéaire standard afin de réduire l'ajustement excessif, d'améliorer la stabilité et de résoudre les problèmes de multicolinéarité. Cette méthode est utile lorsqu'il s'agit de trouver un équilibre entre la précision et la stabilité du modèle.





2.1.14.1. Code pour créer le modèle Ridge et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.Ridge, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# Ridge.py

# Le code démontre le processus d'entraînement du modèle Ridge, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Ridge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "Ridge"

onnx_model_filename = data_path + "ridge"



# crée un modèle Ridge

regression_model = Ridge()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print( "Erreur Absolue Moyenne :" , mae_onnx_float)

print( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print( "R^2 matching decimal places: " , compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print( "MSE correspondant aux décimales : " , compare_decimal_places(mse, mse_onnx_float))

print( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python Ridge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python Python Ridge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382634837793 Python Mean Absolute Error: 6.347684915729416 Python Mean Squared Error: 49.77815046053819 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python Ridge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 49. Résultats du Ridge.py (ONNX float)

2.1.14.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles ridge_float.onnx et ridge_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Ridge" #define ONNXFilenameFloat "ridge_float.onnx" #define ONNXFilenameDouble "ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

Ridge (EURUSD,H1) Testing ONNX float : Ridge (ridge_float.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382634837793 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476849157294160 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781504605381784 Ridge (EURUSD,H1) Ridge (EURUSD,H1) Testing ONNX double : Ridge (ridge_double.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641178552 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476844629298235 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781420699652131

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : Ridge (ridge_float.onnx) Python Mean Absolute Error: 6.347684 462929819 MQL5: Mean Absolute Error: 6.347684 9157294160 Testing ONNX double : Ridge (ridge_double.onnx) Python Mean Absolute Error: 6.3476844629298 19 MQL5: Mean Absolute Error: 6.3476844629298 235

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 13 décimales.







2.1.14.3. Représentation ONNX de ridge_float.onnx et ridge_double.onnx





Fig. 50. Représentation ONNX de ridge_float.onnx dans Netron













Fig. 51. Représentation ONNX de ridge_double.onnx dans Netron









2.1.15. sklearn.linear_model.RidgeCV

RidgeCV est une extension de la régression Ridge qui inclut la sélection automatique du meilleur hyper-paramètre α (alpha), qui détermine le degré de régularisation dans la régression Ridge. L'hyper-paramètre α contrôle l'équilibre entre la minimisation de la somme des erreurs quadratiques (comme dans la régression linéaire ordinaire) et la minimisation de la valeur des coefficients de régression (régularisation). RidgeCV sélectionne automatiquement la valeur optimale de α en fonction des paramètres et critères spécifiés.



Comment fonctionne RidgeCV :



Données d'Entrée : RidgeCV utilise des données d'entrée composées de caractéristiques (variables indépendantes) et de la variable cible (continue). Choix de α : La régression Ridge nécessite la sélection de l'hyper-paramètre α, qui détermine le degré de régularisation. RidgeCV sélectionne automatiquement la valeur optimale de α dans l'intervalle donné. Validation croisée : RidgeCV utilise la validation croisée, telle que la validation croisée k-fold, pour évaluer quelle valeur α fournit la meilleure généralisation du modèle sur des données indépendantes. α Optimal: À l'issue du processus d'apprentissage, RidgeCV choisit la valeur α qui offre les meilleures performances en validation croisée et utilise cette valeur pour former le modèle de régression Ridge final.

Avantages de RidgeCV :



Sélection automatique de α : RidgeCV permet de sélectionner automatiquement la valeur optimale de l'hyper-paramètre α, ce qui simplifie le processus de réglage du modèle.

Équilibre entre régularisation et performance : Cette méthode permet de trouver l'équilibre optimal entre la régularisation (réduction de l'ajustement excessif) et la performance du modèle.

Limites de RidgeCV :



Complexité de calcul : La validation croisée peut nécessiter des ressources de calcul importantes, en particulier lors de l'utilisation d'un large éventail de valeurs α.

RidgeCV est une méthode de régression Ridge avec sélection automatique de l'hyper-paramètre optimal α par validation croisée. Cette méthode rationalise le processus de sélection des hyper-paramètres et permet de trouver le meilleur équilibre entre la régularisation et la performance du modèle.





2.1.15.1. Code pour créer le modèle RidgeCV et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.RidgeCV, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# RidgeCV.py

# Le code démontre le processus d'entraînement du modèle RidgeCV, son export au format ONNX (à la fois float et double), et la réalisation de prédictions en utilisant les modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import RidgeCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RidgeCV"

onnx_model_filename = data_path + "ridge_cv"



# crée un modèle RidgeCV

regression_model = RidgeCV()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print (f"{i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python RidgeCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python Python RidgeCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499108485 Python Mean Absolute Error: 6.3472036427935485 Python Mean Squared Error: 49.77833006785168 Python R^ 2 matching decimal places: 11 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python RidgeCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig. 52. Résultats de RidgeCV.py (ONNX float)





2.1.15.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles ridge_cv_float.onnx et ridge_cv_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RidgeCV" #define ONNXFilenameFloat "ridge_cv_float.onnx" #define ONNXFilenameDouble "ridge_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

RidgeCV (EURUSD,H1) Testing ONNX float : RidgeCV (ridge_cv_float.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499108485 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472036427935485 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783300678516909 RidgeCV (EURUSD,H1) RidgeCV (EURUSD,H1) Testing ONNX double : RidgeCV (ridge_cv_double.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499160807 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472033499935216 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783299986157246

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : RidgeCV (ridge_cv_float.onnx) Python Mean Absolute Error: 6.347203 34999352 MQL5: Mean Absolute Error: 6.347203 6427935485 Testing ONNX double : RidgeCV (ridge_cv_double.onnx) Python Mean Absolute Error: 6.34720334999352 MQL5: Mean Absolute Error: 6.34720334999352 16

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.





2.1.15.3. Représentation ONNX de ridge_cv_float.onnx et ridge_cv_double.onnx









Fig. 53. Représentation ONNX de ridge_cv_float.onnx dans Netron









Fig. 54. Représentation ONNX de ridge_cv_double.onnx dans Netron







2.1.16. sklearn.linear_model.OrthogonalMatchingPursuit

OrthogonalMatchingPursuit (OMP) est un algorithme utilisé pour résoudre les problèmes de sélection de caractéristiques et de régression linéaire.



Il s'agit d'une des méthodes permettant de sélectionner les caractéristiques les plus significatives, ce qui peut contribuer à réduire la dimensionnalité des données et à améliorer la capacité de généralisation du modèle.



Fonctionnement de l'OrthogonalMatchingPursuit :



Données d'Entrée : Elle commence par un ensemble de données contenant des caractéristiques (variables indépendantes) et des valeurs de la variable cible (continue). Sélection du nombre de caractéristiques : L'une des premières étapes de l'utilisation de l'OrthogonalMatchingPursuit consiste à déterminer le nombre de caractéristiques à inclure dans le modèle. Ce nombre peut être prédéfini ou choisi en fonction de critères tels que le Critère d'Information d'Akaike (AIC) ou le critère d'erreur minimale. Ajout itératif de fonctionnalités : L'algorithme part d'un modèle vide et ajoute itérativement les caractéristiques qui expliquent le mieux les résidus du modèle. À chaque itération, une nouvelle caractéristique est choisie pour être orthogonale aux caractéristiques précédemment sélectionnées. La caractéristique optimale est sélectionnée sur la base de sa corrélation avec les résidus du modèle. Entraînement du modèle : Après avoir ajouté le nombre spécifié de caractéristiques, le modèle est entraîné sur les données en tenant compte uniquement des caractéristiques sélectionnées. Générer des prédictions : Après l'entraînement, le modèle peut prédire les valeurs de la variable cible sur de nouvelles données.

Avantages de l’OrthogonalMatchingPursuit :



Réduction de la dimensionnalité : L'OMP peut réduire la dimension des données en ne sélectionnant que les caractéristiques les plus informatives.

Interprétabilité : Comme l'OMP ne sélectionne qu'un petit nombre de caractéristiques, les modèles créés à l'aide de cette méthode peuvent être plus faciles à interpréter.

Limites de l’OrthogonalMatchingPursuit :



Sensibilité au nombre de caractéristiques sélectionnées : Le nombre de caractéristiques sélectionnées doit être correctement ajusté, et des choix incorrects peuvent conduire à un sur-ajustement ou à un sous-ajustement.

Ne tient pas compte de la multicolinéarité : L'OMP peut ne pas tenir compte de la multicolinéarité entre les caractéristiques, ce qui pourrait avoir une incidence sur la sélection des caractéristiques optimales.

Complexité de calcul : La méthode OMP est coûteuse en termes de calcul, en particulier pour les grands ensembles de données.

L’OrthogonalMatchingPursuit est un algorithme de sélection des caractéristiques et de régression linéaire, qui permet de sélectionner les caractéristiques les plus informatives pour le modèle. Cette méthode peut s'avérer précieuse pour réduire la dimensionnalité des données et améliorer l'interprétabilité des modèles.





2.1.16.1. Code pour créer le modèle OrthogonalMatchingPursuit et l'exporter vers ONNX pour les float et les double

Ce code crée le modèle sklearn.linear_model.OrthogonalMatchingPursuit, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# OrthogonalMatchingPursuit.py

# Le code démontre le processus d'entraînement du modèle OrthogonalMatchingPursuit, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str(value1)

str_value2 = str(value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import OrthogonalMatchingPursuit

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "OrthogonalMatchingPursuit"

onnx_model_filename = data_path + "orthogonal_matching_pursuit"



# crée un modèle OrthogonalMatchingPursuit

regression_model = OrthogonalMatchingPursuit()



# ajuste le modèle aux données

regression_model.fit(X, y)



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python OrthogonalMatchingPursuit Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python Python OrthogonalMatchingPursuit ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python OrthogonalMatchingPursuit ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





Fig. 55. Résultats de OrthogonalMatchingPursuit.py (ONNX float)



2.1.16.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles orthogonal_matching_pursuit_float.onnx et orthogonal_matching_pursuit_double.onnx sauvegardés et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "OrthogonalMatchingPursuit" #define ONNXFilenameFloat "orthogonal_matching_pursuit_float.onnx" #define ONNXFilenameDouble "orthogonal_matching_pursuit_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 OrthogonalMatchingPursuit (EURUSD,H1) OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364275 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) Python Mean Absolute Error: 6.347737 9263364275 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) Python Mean Absolute Error: 6.3477379263364275 MQL5: Mean Absolute Error: 6.3477379263364275

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 16 décimales.





2.1.16.3. Représentation ONNX de l'orthogonal_matching_pursuit_float.onnx et de l'orthogonal_matching_pursuit_double.onnx









Fig. 56. Représentation ONNX de orthogonal_matching_pursuit_float.onnx dans Netron













Fig. 57. Représentation ONNX de orthogonal_matching_pursuit_double.onnx dans Netron





2.1.17. sklearn.linear_model.PassiveAggressiveRegressor

PassiveAggressiveRegressor est une méthode d'apprentissage automatique utilisée pour les tâches de régression.



Cette méthode est une variante de l'algorithme passif-agressif (PA) qui peut être utilisée pour former un modèle capable de prédire des valeurs continues de la variable cible.



Comment fonctionne PassiveAggressiveRegressor :



Données d'Entrée : Elle commence par un ensemble de données comprenant des caractéristiques (variables indépendantes) et des valeurs de la variable cible (continue). Apprentissage supervisé : PassiveAggressiveRegressor est une méthode d'apprentissage supervisé entraînée sur des paires (X, y), où X représente les caractéristiques et y correspond aux valeurs de la variable cible. Apprentissage adaptatif : L'idée principale qui sous-tend la méthode Passive-Agressive est l'approche de l'apprentissage adaptatif. Le modèle apprend en minimisant l'erreur de prédiction sur chaque exemple d'apprentissage. Il se met à jour en corrigeant les poids afin de réduire l'erreur de prédiction. Paramètre C : PassiveAggressiveRegressor possède un hyper-paramètre C, qui contrôle la force d'adaptation du modèle aux erreurs. Une valeur C plus élevée signifie des mises à jour de poids plus agressives, tandis qu'une valeur C plus faible rend le modèle moins agressif. Prédiction : Une fois entraîné, le modèle peut prédire les valeurs des variables cibles pour de nouvelles données.

Avantages du PassiveAggressiveRegressor :



Capacité d'Adaptation : La méthode peut s'adapter aux changements de données et mettre à jour le modèle afin de minimiser les erreurs de prédiction.

Efficacité pour les grands ensembles de données : PassiveAggressiveRegressor peut être une méthode efficace pour la régression, en particulier lorsqu'elle est entraînée sur des volumes de données importants.

Limites du PassiveAggressiveRegressor :



Sensibilité au choix du paramètre C : Le choix de la valeur de C peut nécessiter des ajustements et de l'expérimentation.

Des caractéristiques supplémentaires peuvent être nécessaires : Dans certains cas, des caractéristiques techniques supplémentaires peuvent être nécessaires à la réussite de l'apprentissage du modèle.

PassiveAggressiveRegressor est une méthode d'apprentissage automatique pour les tâches de régression qui apprend de manière adaptative en minimisant les erreurs de prédiction sur les données d'apprentissage. Cette méthode peut s'avérer utile pour traiter de grands ensembles de données et nécessite d'ajuster le paramètre C pour obtenir des performances optimales.





2.1.17.1. Code pour créer le modèle PassiveAggressiveRegressor et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.PassiveAggressiveRegressor, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# PassiveAggressiveRegressor.py

# Le code démontre le processus d'entraînement du modèle PassiveAggressiveRegressor, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import PassiveAggressiveRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[0:last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "PassiveAggressiveRegressor"

onnx_model_filename = data_path + "passive_aggressive_regressor"



# crée un modèle PassiveAggressiveRegressor

regression_model = PassiveAggressiveRegressor()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red ', label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python PassiveAggressiveRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python Python PassiveAggressiveRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376801868329 Python Mean Absolute Error: 9.645248834431873 Python Mean Squared Error: 139.76862616640122 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 3 Python float ONNX model precision: 5 Python Python PassiveAggressiveRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig. 58. Résultats de PassiveAggressiveRegressor.py (ONNX double)



2.1.17.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles enregistrés passive_aggressive_regressor_float.onnx et passive_aggressive_regressor_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "PassiveAggressiveRegressor" #define ONNXFilenameFloat "passive_aggressive_regressor_float.onnx" #define ONNXFilenameDouble "passive_aggressive_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376801868329 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452488344318716 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7686261664012761 PassiveAggressiveRegressor (EURUSD,H1) PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376841493092 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452466950654419 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7685737319100667

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) Python Mean Absolute Error: 9.64524 669506544 MQL5: Mean Absolute Error: 9.64524 88344318716 Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) Python Mean Absolute Error: 9.64524669506544 MQL5: Mean Absolute Error: 9.64524669506544 19

Précision de la MAE ONNX float : 5 décimales, Précision de la MAX ONNX double : 14 décimales.





2.1.17.3. Représentation ONNX de passive_aggressive_regressor_float.onnx et passive_aggressive_regressor_double.onnx









Fig. 59. Représentation ONNX de passive_aggressive_regressor_float.onnx dans Netron













Fig. 60. Représentation ONNX de passive_aggressive_regressor_double.onnx dans Netron







2.1.18. sklearn.linear_model.QuantileRegressor

QuantileRegressor est une méthode d'apprentissage automatique utilisée pour estimer les quantiles (percentiles spécifiques) de la variable cible dans les tâches de régression.



Au lieu de prédire la valeur moyenne de la variable cible, comme c'est généralement le cas dans les tâches de régression, QuantileRegressor prédit les valeurs correspondant aux quantiles spécifiés, tels que la médiane (50e percentile) ou les 25e et 75e percentiles.



Comment fonctionne QuantileRegressor :



Données d'Entrée : Il commence par un ensemble de données contenant des caractéristiques (variables indépendantes) et la variable cible (continue). Concentration sur le quantile : Au lieu de prédire les valeurs exactes de la variable cible, QuantileRegressor modélise la distribution conditionnelle de la variable cible et prédit les valeurs de certains quantiles de cette distribution. Entraînement pour différents quantiles : L’entraînement d'un modèle QuantileRegressor implique la formation de modèles distincts pour chaque quantile souhaité. Chacun de ces modèles prédit une valeur correspondant à son quantile. Paramètre du quantile : Le paramètre principal de cette méthode est le choix des quantiles souhaités pour lesquels vous voulez obtenir des prédictions. Par exemple, si vous avez besoin de prédictions pour la médiane, vous devrez entraîner le modèle sur le 50e centile. Prédiction par quantile : Après l'entraînement, le modèle peut être utilisé pour prédire les valeurs correspondant aux quantiles spécifiés sur de nouvelles données.

Avantages de QuantileRegressor :



Flexibilité : QuantileRegressor permet de prédire différents quantiles, ce qui peut s'avérer utile dans les tâches où différents centiles de la distribution sont importants.

Robustesse face aux valeurs aberrantes : Une approche axée sur les quantiles peut être robuste face aux valeurs aberrantes, car elle ne tient pas compte de la moyenne, qui peut être fortement influencée par les valeurs extrêmes.

Limites de QuantileRegressor :



Nécessité d'une sélection par quantile : Le choix des quantiles optimaux peut nécessiter une certaine connaissance de la tâche.

Augmentation de la complexité des calculs : L'apprentissage de modèles distincts pour différents quantiles peut accroître la complexité de calcul de la tâche.

QuantileRegressor est une méthode d'apprentissage automatique conçue pour prédire les valeurs correspondant aux quantiles spécifiés de la variable cible. Cette méthode peut s'avérer utile dans les tâches où les différents centiles de la distribution sont intéressants et dans les cas où les données peuvent contenir des valeurs aberrantes.





2.1.18.1. Code pour créer le modèle QuantileRegressor et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.QuantileRegressor, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# QuantileRegressor.py

# Le code démontre le processus d'apprentissage du modèle QuantileRegressor, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import QuantileRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[0]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# génère des données synthétiques pour la régression

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "QuantileRegressor"

onnx_model_filename = data_path + "quantile_regressor"



# crée un modèle QuantileRegressor

regression_model = QuantileRegressor(solver= 'highs' )



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float) ")

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_float)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=( 8 , 5 ))

# trace les données originales et les données de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python QuantileRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python Python QuantileRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915739158818 Python Mean Absolute Error: 6.3693091422201125 Python Mean Squared Error: 53.042533910812814 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 7 Python MSE matching decimal places: 5 Python float ONNX model precision: 7 Python Python QuantileRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 13 Python double ONNX model precision: 16





Fig. 61. Résultats de QuantileRegressor.py (ONNX float)





2.1.18.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les fichiers quantile_regressor_float.onnx et quantile_regressor_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "QuantileRegressor" #define ONNXFilenameFloat "quantile_regressor_float.onnx" #define ONNXFilenameDouble "quantile_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

QuantileRegressor (EURUSD,H1) Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915739158818 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091422201169 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425339108128071 QuantileRegressor (EURUSD,H1) QuantileRegressor (EURUSD,H1) Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915738839231 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091850025185 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425343337142721

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) Python Mean Absolute Error: 6.3693091 850025185 MQL5: Mean Absolute Error: 6.3693091 422201169 Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) Python Mean Absolute Error: 6.3693091850025185 MQL5: Mean Absolute Error: 6.3693091850025185

Précision de la MAE ONNX float : 7 décimales, Précision de la MAE ONNX double : 16 décimales.





2.1.18.3. Représentation ONNX du quantile_regressor_float.onnx et du quantile_regressor_double.onnx









Fig. 62. Représentation ONNX du quantile_regressor_float.onnx dans Netron





Fig. 63. Représentation ONNX du quantile_regressor_double.onnx dans Netron







2.1.19. sklearn.linear_model.RANSACRegressor

RANSACRegressor est une méthode d'apprentissage automatique utilisée pour résoudre les problèmes de régression à l'aide de la méthode RANSAC (Random Sample Consensus).



La méthode RANSAC est conçue pour traiter des données contenant des valeurs aberrantes ou des imperfections, ce qui permet d'obtenir un modèle de régression plus robuste en excluant l'influence des valeurs aberrantes.



Fonctionnement de RANSACRegressor :



Données d'Entrée : Il commence par un ensemble de données contenant des caractéristiques (variables indépendantes) et la variable cible (continue). Sélection de sous-ensembles aléatoires : RANSAC commence par choisir des sous-ensembles aléatoires de données utilisés pour former le modèle de régression. Ces sous-ensembles sont appelés "hypothèses". Adaptation du modèle aux hypothèses : Pour chaque hypothèse choisie, un modèle de régression est formé. Dans le cas de RANSACRegressor, la régression linéaire est généralement utilisée et le modèle est ajusté au sous-ensemble de données. Évaluation des valeurs aberrantes : Après l'entraînement du modèle, son adaptation à toutes les données est évaluée. L'erreur entre les valeurs prédites et réelles est calculée pour chaque point de données. Identification des valeurs aberrantes : Les points de données dont les erreurs dépassent un seuil spécifié sont considérés comme aberrants. Ces valeurs aberrantes peuvent influencer l'apprentissage du modèle et fausser les résultats. Mise à jour du modèle : Tous les points de données qui ne sont pas considérés comme aberrants sont utilisés pour mettre à jour le modèle de régression. Ce processus peut être répété plusieurs fois avec différentes hypothèses aléatoires. Modèle final : Après plusieurs itérations, RANSACRegressor sélectionne le meilleur modèle formé sur le sous-ensemble de données et le renvoie comme modèle de régression final.

Avantages de RANSACRegressor :



Robustesse des valeurs aberrantes : RANSACRegressor est une méthode robuste contre les valeurs aberrantes, car elle les exclut de la formation.

Régression robuste : Cette méthode permet de créer un modèle de régression plus fiable lorsque les données contiennent des valeurs aberrantes ou des imperfections.

Limites de RANSACRegressor :



Sensibilité au seuil d'erreur : Le choix d'un seuil d'erreur pour déterminer quels points sont considérés comme aberrants peut nécessiter une expérimentation.

Complexité de la sélection des hypothèses : Le choix de bonnes hypothèses au stade initial n'est pas toujours évident.

RANSACRegressor est une méthode d'apprentissage automatique utilisée pour les problèmes de régression basés sur la méthode RANSAC. Cette méthode permet de créer un modèle de régression plus robuste lorsque les données contiennent des valeurs aberrantes ou des imperfections en excluant leur influence sur le modèle.





2.1.19.1. Code pour créer le modèle RANSACRegressor et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.RANSACRegressor, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.

# RANSACRegressor.py

# Le code démontre le processus d'entraînement du modèle RANSACRegressor, son export au format ONNX (à la fois float et double), et la réalisation de prédictions à l'aide des modèles ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# fonction de comparaison des décimales correspondantes

def compare_decimal_places (value1, value2):

# convertit les deux valeurs en chaînes de caractères

str_value1 = str (value1)

str_value2 = str (value2)



# trouve les positions des points décimaux dans les chaînes de caractères

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# si l'une des valeurs n'a pas de point décimal, retourne 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcule le nombre de décimales

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# trouve le minimum du nombre de décimales

min_decimal_places = min(decimal_places1, decimal_places2)



# initialise un compteur pour les décimales correspondantes

matching_count = 0



# compare les caractères après la virgule

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importe les bibliothèques nécessaires

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import RANSACRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# définit le chemin d'accès pour l'enregistrement du modèle

data_path = argv[0]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[0:last_index]



# génère des données synthétiques pour la régression

X = np.arange(0,100,1).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RANSACRegressor"

onnx_model_filename = data_path + "ransac_regressor"



# crée un modèle RANSACRegressor

regression_model = RANSACRegressor()



# ajuste le modèle aux données

regression_model.fit(X, y.ravel())



# prédit les valeurs pour l'ensemble du jeu de données

y_pred = regression_model.predict(X)



# évalue la performance du modèle

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# convertit en modèle ONNX (float)

# définit le type de données d'entrée comme FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme FloatTensorType

initial_type_float = X.astype(np.float32)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_float)

print ( "Erreur Absolue Moyenne :" , mae_onnx_f loat)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_float)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_float))

print ( "ONNX: MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_float))

print ( "Précision du modèle ONNX float : " , compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX float)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertit en modèle ONNX (double)

# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# exporte le modèle au format ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# enregistre le modèle dans un fichier

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " Modèle ONNX (double)" )

# affiche le chemin du modèle

print ( f"ONNX model saved to {onnx_filename} " )



# charge le modèle ONNX et fait des prédictions

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# affiche les informations sur les tenseurs d'entrée dans ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# affiche les informations sur les tenseurs de sortie dans ONNX

print ("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1}. Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# définit le type de données d'entrée comme DoubleTensorType

initial_type_double = X.astype(np.float64)



# prédit les valeurs pour l'ensemble du jeu de données en utilisant ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcule et affiche les erreurs pour les modèles originaux et ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-carré (Coefficient de Détermination)" , r2_onnx_double)

print ( "Erreur Absolue Moyenne :" , mae_onnx_double)

print ( "Erreur Quadratique Moyenne :" , mse_onnx_double)

print ( "R^2 matching decimal places : " , compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places : " , compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places : " , compare_decimal_places(mse, mse_onnx_double))

print ( "Précision du modèle ONNX double : ", compare_decimal_places(mae, mae_onnx_float))



# définit la taille de la figure

plt.figure(figsize=(8, 5))

# trace les données originales et la ligne de régression

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparaison (avec ONNX double)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Sortie :

Python RANSACRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python RANSACRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python RANSACRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig. 64. Résultats de RANSACRegressor.py (ONNX float)





2.1.19.2. Code MQL5 pour l'exécution des modèles ONNX

Ce code exécute les modèles enregistrés ransac_regressor_float.onnx et ransac_regressor_double.onnx et démontre l'utilisation des métriques de régression dans MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RANSACRegressor" #define ONNXFilenameFloat "ransac_regressor_float.onnx" #define ONNXFilenameDouble "ransac_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Sortie :

RANSACRegressor (EURUSD,H1) Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 RANSACRegressor (EURUSD,H1) RANSACRegressor (EURUSD,H1) Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Comparaison avec le modèle original de double précision en Python :

Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

Précision de la MAE ONNX float : 6 décimales, Précision de la MAE ONNX double : 14 décimales.





2.1.19.3. Représentation ONNX du ransac_regressor_float.onnx et du ransac_regressor_double.onnx









Fig. 65. Représentation ONNX de ransac_regressor_float.onnx dans Netron





Fig. 66. Représentation ONNX de ransac_regressor_double.onnx dans Netron











2.1.20. sklearn.linear_model.TheilSenRegressor

La Régression de Theil-Sen (estimateur de Theil-Sen) est une méthode d'estimation de la régression utilisée pour approximer les relations linéaires entre les variables indépendantes et la variable cible.



Elle offre une estimation plus robuste que la régression linéaire ordinaire en présence de valeurs aberrantes et de bruit dans les données.



Comment fonctionne la régression Theil-Sen :



Sélection des points : Dans un premier temps, Theil-Sen sélectionne des paires aléatoires de points de données dans l'ensemble de données d'apprentissage. Calcul de la pente : Pour chaque paire de points de données, la méthode calcule la pente de la ligne passant par ces points, créant ainsi un ensemble de pentes. Pente médiane : La méthode permet ensuite de trouver la pente médiane dans l'ensemble des pentes. Cette pente médiane est utilisée comme estimation de la pente de la régression linéaire. Écarts médians : Pour chaque point de données, la méthode calcule l'écart (différence entre la valeur réelle et la valeur prédite sur la base de la pente médiane) et trouve la médiane de ces écarts. On obtient ainsi une estimation du coefficient de l'ordonnée à l'origine de la régression linéaire. Estimation finale : Les estimations finales des coefficients de pente et d'interception sont utilisées pour construire le modèle de régression linéaire.

Avantages de la régression Theil-Sen :



Résilience des valeurs aberrantes : La régression Theil-Sen est plus résistante aux valeurs aberrantes et au bruit des données que la régression linéaire classique.

Hypothèses moins strictes : La méthode ne nécessite pas d'hypothèses strictes sur la distribution des données ou la forme de dépendance, ce qui la rend plus polyvalente.

Convient aux données multi-colinéaires : La régression de Theil-Sen donne de bons résultats avec des données où les variables indépendantes sont fortement corrélées (problème de multicolinéarité).

Limites de la régression Theil-Sen :



Complexité de calcul : Le calcul des pentes médianes pour toutes les paires de points de données peut prendre beaucoup de temps, en particulier pour les grands ensembles de données.

Estimation du coefficient d'interception : Les écarts médians sont utilisés pour estimer le coefficient d'interception, ce qui peut entraîner un biais en présence de valeurs aberrantes.

La régression Theil-Sen est une méthode d'estimation pour la régression qui fournit une évaluation stable de la relation linéaire entre les variables indépendantes et la variable cible, en particulier en présence de valeurs aberrantes et de bruit de données. Cette méthode est utile lorsqu'une estimation stable est nécessaire dans des conditions de données réelles.





2.1.20.1. Code pour créer le TheilSenRegressor et l'exporter vers ONNX pour float et double

Ce code crée le modèle sklearn.linear_model.TheilSenRegressor, l'entraîne sur des données synthétiques, enregistre le modèle au format ONNX et effectue des prédictions en utilisant des données d'entrée float et double. Il évalue également la précision du modèle original et des modèles exportés vers ONNX.