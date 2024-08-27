ONNX (Open Neural Network Exchange) è un formato per la descrizione e lo scambio di modelli di apprendimento automatico, che offre la possibilità di trasferire modelli tra diversi framework di apprendimento automatico. Nell'apprendimento profondo e nelle reti neurali, si utilizzano spesso tipi di dati come float32. Sono ampiamente utilizzati perché di solito forniscono un'accuratezza e un'efficienza accettabili per l'addestramento dei modelli di deep learning.



Alcuni modelli classici di apprendimento automatico sono difficili da rappresentare come operatori ONNX. Per questo motivo, sono stati introdotti ulteriori operatori ML (ai.onnx.ml) per implementarli in ONNX. Vale la pena notare che, secondo le specifiche ONNX, gli operatori chiave di questo set (LinearRegressor, SVMRegressor, TreeEnsembleRegressor) possono accettare vari tipi di dati in ingresso (tensore(float), tensore(double), tensore(int64), tensore(int32)), ma restituiscono sempre il tipo tensore(float) in uscita. Anche la parametrizzazione di questi operatori viene eseguita utilizzando numeri in virgola mobile, il che può limitare l'accuratezza dei calcoli, soprattutto se sono stati utilizzati numeri a doppia precisione per definire i parametri del modello originale.

Ciò può comportare una perdita di precisione quando si convertono i modelli o si utilizzano tipi di dati differenti nel processo di conversione ed elaborazione dei dati in ONNX. Molto dipende dal convertitore, come vedremo più avanti; alcuni modelli riescono a bypassare queste limitazioni e a garantire la piena portabilità dei modelli ONNX, consentendo di lavorare con essi in doppia precisione senza perdere in accuratezza. È importante considerare queste caratteristiche quando si lavora con i modelli e la loro rappresentazione in ONNX, soprattutto nei casi in cui la precisione della rappresentazione dei dati è importante.

Scikit-learn è una delle librerie per l'apprendimento automatico più popolare e utilizzata dalla comunità Python. Offre un'ampia gamma di algoritmi, un'interfaccia facile da usare e una buona documentazione. L'articolo precedente, "Modelli di Classificazione della Libreria Scikit-learn e Loro Esportazione in ONNX", copriva i modelli di classificazione.

In questo articolo esploreremo l'applicazione dei modelli di regressione nel pacchetto Scikit-learn, calcoleremo i loro parametri con doppia precisione per il set di dati di prova, proveremo a convertirli nel formato ONNX con precisione double e float e utilizzeremo i modelli ottenuti in programmi MQL5. Inoltre, confronteremo l'accuratezza dei modelli originali e delle loro versioni ONNX per la precisione float e double. Inoltre, esamineremo la rappresentazione ONNX dei modelli di regressione, che ci forniranno una migliore comprensione della loro struttura interna e il loro funzionamento.





Contenuto





Se ti dà fastidio, ben venga il tuo contributo

Sul forum degli sviluppatori di ONNX Runtime, uno degli utenti ha segnalato un errore "[ONNXRuntimeError] : 9 : NOT_IMPLEMENTED : Impossibile trovare un'implementazione per il nodo LinearRegressor:LinearRegressor(1)" durante l'esecuzione di un modello tramite ONNX Runtime.



Ciao a tutti, ricevo questo errore quando provo a dedurre un modello di regressione lineare. Vi prego di aiutarmi a risolvere questo problema.





"NOT_IMPLEMENTED : Impossibile trovare un'implementazione per il nodo LinearRegressor:LinearRegressor(1)" errore dal forum degli sviluppatori di ONNX Runtime



Risposta dello sviluppatore:



È perché l'abbiamo implementato solo per float32 e non per float64. Ma il tuo modello ha bisogno di float64.



Vedi:

https://github.com/microsoft/onnxruntime/blob/master/onnxruntime/core/providers/cpu/ml/linearregressor.cc#L16



Se ti dà fastidio, ben venga il tuo contributo.



Nel modello ONNX dell'utente, l'operatore ai.onnx.ml.LinearRegressor è chiamato con il tipo di dati double (float64) e il messaggio di errore si verifica perché il Runtime ONNX non supporta l'operatore LinearRegressor() con precisione double.



Secondo le specifiche dell'operatore ai.onnx.ml.LinearRegressor, il tipo di dati di ingresso double è possibile (T: tensor(float), tensor(double), tensor(int64), tensor(int32)); tuttavia, gli sviluppatori hanno scelto intenzionalmente di non implementarlo.



Il motivo è che l'uscita restituisce sempre il valore Y: tensor(float). Inoltre, i parametri di calcolo sono numeri float (coefficienti: lista di float, intercette: lista di float).



Di conseguenza, quando i calcoli vengono eseguiti in precisione double, questo operatore riduce la precisione a float e la sua implementazione nei calcoli in precisione double ha un valore discutibile.











Descrizione dell'operatore ai.onnx.ml.LinearRegressor



Pertanto, la riduzione della precisione a float nei parametri e nel valore di uscita rende impossibile il pieno funzionamento di ai.onnx.ml.LinearRegressor con numeri double (float64). Presumibilmente, per questo motivo, gli sviluppatori del Runtime ONNX hanno deciso di non implementarlo per il tipo double



Il metodo di "aggiunta del supporto double" è stato dimostrato dagli sviluppatori nei commenti al codice (evidenziati in giallo).

In ONNX Runtime, il suo calcolo viene eseguito utilizzando la classe LinearRegressor (https://github.com/microsoft/onnxruntime/blob/main/onnxruntime/core/providers/cpu/ml/linearregressor.h).

I parametri dell'operatore, coefficienti_ e intercette_, sono memorizzati come std::vector<float>:



#pragma once #include "core/common/common.h" #include "core/framework/op_kernel.h" #include "core/util/math_cpuonly.h" #include "ml_common.h" namespace onnxruntime { namespace ml { class LinearRegressor final : public OpKernel { public : LinearRegressor( const OpKernelInfo& info); Status Compute(OpKernelContext* context) const override ; private : int64_t num_targets_; std:: vector < float > coefficients_; std:: vector < float > intercepts_; bool use_intercepts_; POST_EVAL_TRANSFORM post_transform_; }; } }

#include "core/providers/cpu/ml/linearregressor.h" #include "core/common/narrow.h" #include "core/providers/cpu/math/gemm.h" namespace onnxruntime { namespace ml { ONNX_CPU_OPERATOR_ML_KERNEL( LinearRegressor, 1 , KernelDefBuilder().TypeConstraint( "T" , DataTypeImpl::GetTensorType< float >()), LinearRegressor); LinearRegressor::LinearRegressor( const OpKernelInfo& info) : OpKernel(info), intercepts_(info.GetAttrsOrDefault< float >( "intercepts" )), post_transform_(MakeTransform(info.GetAttrOrDefault<std:: string >( "post_transform" , "NONE" ))) { ORT_ENFORCE(info.GetAttr<int64_t>( "targets" , &num_targets_).IsOK()); ORT_ENFORCE(info.GetAttrs< float >( "coefficients" , coefficients_).IsOK()); use_intercepts_ = intercepts_.size() == static_cast<size_t>(num_targets_); } template < typename T> static Status ComputeImpl( const Tensor& input , ptrdiff_t num_batches, ptrdiff_t num_features, ptrdiff_t num_targets, const std:: vector < float >& coefficients, const std:: vector < float >* intercepts, Tensor& output, POST_EVAL_TRANSFORM post_transform, concurrency::ThreadPool* threadpool) { const T* input_data = input .Data<T>(); T* output_data = output.MutableData<T>(); if (intercepts != nullptr) { TensorShape intercepts_shape({num_targets}); onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, intercepts->data(), &intercepts_shape, output_data, threadpool); } else { onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, nullptr, nullptr, output_data, threadpool); } if (post_transform != POST_EVAL_TRANSFORM::NONE) { ml::batched_update_scores_inplace(gsl::make_span(output_data, SafeInt<size_t>(num_batches) * num_targets), num_batches, num_targets, post_transform, - 1 , false , threadpool); } return Status::OK(); } Status LinearRegressor::Compute(OpKernelContext* ctx) const { Status status = Status::OK(); const auto& X = *ctx->Input<Tensor>( 0 ); const auto& input_shape = X.Shape(); if (input_shape.NumDimensions() > 2 ) { return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Input shape had more than 2 dimension. Dims=" , input_shape.NumDimensions()); } ptrdiff_t num_batches = input_shape.NumDimensions() <= 1 ? 1 : narrow<ptrdiff_t>(input_shape[ 0 ]); ptrdiff_t num_features = input_shape.NumDimensions() <= 1 ? narrow<ptrdiff_t>(input_shape.Size()) : narrow<ptrdiff_t>(input_shape[ 1 ]); Tensor& Y = *ctx->Output( 0 , {num_batches, num_targets_}); concurrency::ThreadPool* tp = ctx->GetOperatorThreadPool(); auto element_type = X.GetElementType(); switch (element_type) { case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: { status = ComputeImpl< float >(X, num_batches, num_features, narrow<ptrdiff_t>(num_targets_), coefficients_, use_intercepts_ ? &intercepts_ : nullptr, Y, post_transform_, tp); break ; } case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: { } default : status = ORT_MAKE_STATUS(ONNXRUNTIME, FAIL, "Unsupported data type of " , element_type); } return status; } } }

Si è scoperto che esiste un'opzione per utilizzare i numeri double come valori di ingresso ed eseguire il calcolo dell'operatore con parametri float. Un'altra possibilità potrebbe essere quella di ridurre la precisione dei dati di ingresso a float. Tuttavia, nessuna di queste opzioni può essere considerata una soluzione adeguata.



La specifica dell'operatore ai.onnx.ml.LinearRegressor limita la possibilità di operare completamente con i numeri double, poiché i parametri e il valore di uscita sono limitati al tipo float.

Una situazione simile si verifica con altri operatori ONNX ML, come ai.onnx.ml.SVMRegressor e ai.onnx.ml.TreeEnsembleRegressor.

Di conseguenza, tutti gli sviluppatori che utilizzano l'esecuzione di modelli ONNX in doppia precisione devono affrontare questa limitazione delle specifiche. Una soluzione potrebbe comportare l'estensione delle specifiche ONNX (o l'aggiunta di operatori simili come LinearRegressor64, SVMRegressor64 e TreeEnsembleRegressor64 con parametri e valori di uscita double). Tuttavia, al momento la questione rimane irrisolta.



Molto dipende dal convertitore ONNX. Per i modelli calcolati in double, potrebbe essere preferibile evitare l'uso di questi operatori (anche se ciò non è sempre possibile). In questo caso particolare, il convertitore ONNX non ha funzionato in modo ottimale con il modello dell'utente.

Come vedremo in seguito, il convertitore sklearn-onnx riesce ad aggirare la limitazione di LinearRegressor: per i modelli ONNX double, utilizza invece gli operatori ONNX MatMul() e Add(). Grazie a questo metodo, numerosi modelli di regressione della libreria Scikit-learn vengono convertiti con successo in modelli ONNX calcolati in double, conservando l'accuratezza dei modelli double originali.







1. Set dei dati di prova



Per eseguire gli esempi, è necessario installare Python (noi abbiamo usato la versione 3.10.8), le librerie aggiuntive (pip install -U scikit-learn numpy matplotlib onnx onnxruntime skl2onnx) e specificare il percorso di Python nel MetaEditor (nel menu Strumenti->Opzioni->Compilatori->Python).



Come set di dati di prova, utilizzeremo i valori generati della funzione y = 4X + 10sin(X*0,5).

Per visualizzare il grafico di una funzione di questo tipo, aprire MetaEditor, creare un file chiamato RegressionData.py, copiare il testo dello script ed eseguirlo facendo clic sul pulsante "Compilare".



Lo script per la visualizzazione del set di dati di prova

# RegressionData.py # The code plots the synthetic data, used for all regression models # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # import necessary libraries import numpy as np import matplotlib.pyplot as plt # generate synthetic data for regression X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 ) y = 4 *X + 10 *np.sin(X* 0.5 ) # set the figure size plt.figure(figsize=( 8 , 5 )) # plot the initial data for regression plt.scatter(X, y, label= 'Regression Data' , marker= 'o' ) plt.xlabel( 'X' ) plt.ylabel( 'y' ) plt.legend() plt.title( 'Regression data' ) plt.show()

Di conseguenza, verrà visualizzato un grafico della funzione, che verrà utilizzato per testare i metodi di regressione.







Fig.1. Funzione per testare i modelli di regressione







2. Modelli di regressione



L'obiettivo di un compito di regressione è trovare una funzione matematica o un modello che descriva al meglio la relazione tra le caratteristiche e la variabile target per prevedere i valori numerici di nuovi dati. Ciò consente di fare previsioni, ottimizzare soluzioni e prendere decisioni informate sulla base dei dati.

Consideriamo i principali modelli di regressione del pacchetto scikit-learn.

2.0. Elenco dei Modelli di Regressione di Scikit-learn

Per visualizzare un elenco dei modelli di regressione scikit-learn disponibili, è possibile utilizzare lo script:

# ScikitLearnRegressors.py # The script lists all the regression algorithms available inb scikit-learn # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # print Python version from platform import python_version print ( "The Python version is " , python_version()) # print scikit-learn version import sklearn print ( 'The scikit-learn version is {}.' .format(sklearn.__version__)) # print scikit-learn regression models from sklearn.utils import all_estimators regressors = all_estimators(type_filter= 'regressor' ) for index, (name, RegressorClass) in enumerate(regressors, start= 1 ): print (f "Regressor {index}: {name}" )

Output:

La versione di Python è la 3.10.8

La versione di scikit-learn è la 1.3.2.

Regressore 1: ARDRegression

Regressore 2: AdaBoostRegressor

Regressore 3: BaggingRegressor

Regressore 4: BayesianRidge

Regressore 5: CCA

Regressore 6: DecisionTreeRegressor

Regressore 7: DummyRegressor

Regressore 8: ElasticNet

Regressore 9: ElasticNetCV

Regressore 10: ExtraTreeRegressor

Regressore 11: ExtraTreesRegressor

Regressore 12: GammaRegressor

Regressore 13: GaussianProcessRegressor

Regressore 14: GradientBoostingRegressor

Regressore 15: HistGradientBoostingRegressor

Regressore 16: HuberRegressor

Regressore 17: IsotonicRegression

Regressore 18: KNeighborsRegressor

Regressore 19: KernelRidge

Regressore 20: Lars

Regressore 21: LarsCV

Regressore 22: Lasso

Regressore 23: LassoCV

Regressore 24: LassoLars

Regressore 25: LassoLarsCV

Regressore 26: LassoLarsIC

Regressore 27: LinearRegression

Regressore 28: LinearSVR

Regressore 29: MLPRegressor

Regressore 30: MultiOutputRegressor

Regressore 31: MultiTaskElasticNet

Regressore 32: MultiTaskElasticNetCV

Regressore 33: MultiTaskLasso

Regressore 34: MultiTaskLassoCV

Regressore 35: NuSVR

Regressore 36: OrthogonalMatchingPursuit

Regressore 37: OrthogonalMatchingPursuitCV

Regressore 38: PLSCanonical

Regressore 39: PLSRegression

Regressore 40: PassiveAggressiveRegressor

Regressore 41: PoissonRegressor

Regressore 42: QuantileRegressor

Regressore 43: RANSACRegressor

Regressore 44: RadiusNeighborsRegressor

Regressore 45: RandomForestRegressor

Regressore 46: RegressorChain

Regressore 47: Ridge

Regressore 48: RidgeCV

Regressore 49: SGDRegressor

Regressore 50: SVR

Regressore 51: StackingRegressor

Regressore 52: TeilSenRegressor

Regressore 53: TransformedTargetRegressor

Regressore 54: TweedieRegressor

Regressore 55: VotingRegressor



Per comodità, in questo elenco i regressori sono evidenziati con colori diversi. I modelli che richiedono un modello di regressione base sono evidenziati in grigio, mentre gli altri modelli possono essere utilizzati indipendentemente. Notare che i modelli esportati con successo nel formato ONNX sono contrassegnati in verde, mentre i modelli che incontrano errori durante la conversione nella versione corrente di scikit-learn 1.2.2 sono contrassegnati in rosso. I metodi non adatti al compito del test considerato sono evidenziati in blu.

L'analisi della qualità della regressione utilizza metriche di regressione, che sono funzioni dei valori veri e previsti. Nel linguaggio MQL5 sono disponibili diverse metriche, descritte nell'articolo "Valutazione dei modelli ONNX utilizzando metriche di regressione".



In questo articolo verranno utilizzate tre metriche per confrontare la qualità dei diversi modelli:

Coefficiente di determinazione R-quadro (R2); Errore Assoluto Medio (MAE); Errore Quadratico Medio (MSE).





2.1. I Modelli di Regressione Scikit-learn che convertono in modelli ONNX float e double

In questa sezione vengono presentati i modelli di regressione convertiti con successo nei formati ONNX sia con precisione float che double.

Tutti i modelli di regressione discussi in seguito sono presentati nel seguente formato:



Descrizione del modello, principio di funzionamento, vantaggi e limitazioni Script Python per la creazione del modello, esportazione nel file ONNX nei formati float e double ed esecuzione dei modelli ottenuti utilizzando ONNX Runtime in Python. Metriche come R^2, MAE, MSE, calcolate con sklearn.metrics, sono utilizzate per valutare la qualità dei modelli originali e ONNX.

Script MQL5 per l'esecuzione dei modelli ONNX (float e double) tramite ONNX Runtime, con metriche calcolate tramite RegressionMetric().

Rappresentazione del modello ONNX in Netron per i modelli con precisione float e double.





2.1.1. sklearn.linear_model.ARDRegression

ARDRegression (Automatic Relevance Determination Regression) è un metodo di regressione progettato per risolvere i problemi di regressione determinando automaticamente l'importanza (rilevanza) delle caratteristiche e stabilendo i loro pesi durante il processo di addestramento del modello.



ARDRegression consente di individuare e utilizzare solo le caratteristiche più importanti per costruire un modello di regressione, il che può essere vantaggioso quando si ha a che fare con un ampio numero di caratteristiche.



Principio di funzionamento di ARDRegression:



Regressione lineare: ARDRegression si basa sulla regressione lineare, ipotizzando una relazione lineare tra le variabili indipendenti (caratteristiche) e la variabile target. Determinazione Automatica delle Caratteristiche Importanti: La principale caratteristica di ARDRegression è la determinazione automatica di quali caratteristiche sono più importanti per la previsione della variabile target. Ciò si ottiene introducendo distribuzioni prioritarie (regolarizzazione) sui pesi, consentendo al modello di impostare automaticamente i pesi su zero per le caratteristiche meno significative. Stima delle Probabilità Posteriori: ARDRegression calcola le probabilità posteriori per ogni caratteristica, consentendo di determinarne l'importanza. Le caratteristiche con alte probabilità posteriori sono considerate rilevanti e ricevono pesi diversi da zero, mentre le caratteristiche con basse probabilità posteriori ricevono pesi pari a zero. Riduzione della Dimensionalità: Pertanto, ARDRegression può portare alla riduzione della dimensionalità dei dati eliminando le caratteristiche non significative.

Vantaggi di ARDRegression:



Determinazione Automatica delle Caratteristiche Importanti: Il metodo identifica e utilizza automaticamente solo le caratteristiche più importanti, potenzialmente migliorando le prestazioni del modello e riducendo il rischio di overfitting.

Resilienza alla Multicollinearità: ARDRegression gestisce bene la multicollinearità, anche quando le caratteristiche sono altamente correlate.

Limitazioni di ARDRegression:



Richiede la Selezione delle Distribuzioni Prioritarie: La scelta di distribuzioni prioritarie adeguate potrebbe richiedere una sperimentazione.

Complessità Computazionale: L'addestramento di ARDRegression può essere computazionalmente costoso, in particolare per i dataset di grandi dimensioni.

ARDRegression è un metodo di regressione che determina automaticamente l'importanza delle caratteristiche e stabilisce i loro pesi in base alle probabilità posteriori. Questo metodo è utile quando si considerano solo le caratteristiche significative per costruire un modello di regressione ed è necessario ridurre la dimensionalità dei dati.







2.1.1.1. Codice per la creazione del modello ARDRegression ed esportazione in ONNX per float e double



Questo codice crea il modello sklearn.linear_model.ARDRegression, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di ingresso sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.



# ARDRegression.py

# Il codice dimostra il processo di addestramento del modello ARDRegressor, la sua esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min (decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range ( 1 , min_decimal_places + 1 ):

if str_valore1[dot_position1 + i] == str_valore2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ARDRegressione

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name= "ARDRegression"

onnx_model_filename = data_path + "ard_regression"



# creare un modello ARDRegression

regression_model = ARDRegression()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print (f "ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# predire i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)



print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: ",compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f "ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f"{ i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# predire i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)



print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Lo script crea e addestra il modello sklearn.linear_model.ARDRegression (il modello originale è considerato double), quindi esporta il modello in ONNX per float e double (ard_regression_float.onnx e ard_regression_double.onnx) e confronta l'accuratezza del suo funzionamento.



Genera anche i file ARDRegression_plot_float.png e ARDRegression_plot_double.png, che consentono una valutazione visiva dei risultati dei modelli ONNX per float e double (Fig. 2-3).





Fig.2. Risultati di ARDRegression.py (float)









Fig.3. Risultati di ARDRegression.py (double)



Visivamente, i modelli ONNX per float e double sembrano uguali (Fig. 2-3); informazioni dettagliate sono disponibili nella scheda Journal:

Python ARDRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python Python ARDRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568 283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python ARDRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

In questo esempio, il modello originale è stato considerato double, quindi è stato esportato nei modelli ONNX ard_regression_float.onnx e ard_regression_double.onnx rispettivamente per float e double.



Se l'accuratezza del modello viene valutata in base al Mean Absolute Error (MAE), l'accuratezza del modello ONNX per float è fino a 6 cifre decimali, mentre il modello ONNX che utilizza double ha mostrato un mantenimento di precisione fino a 15 cifre decimali, in linea con la precisione del modello originale.



Le proprietà dei modelli ONNX possono essere visualizzate in MetaEditor (Fig. 4-5).









Fig.4. modello ONNX ard_regression_float.onnx in MetaEditor







Fig.5. modello ONNX ard_regression_double.onnx in MetaEditor





Un confronto tra modelli ONNX float e double mostra che in questo caso il calcolo dei modelli ONNX per ARDRegression avviene in modo diverso: per i numeri float si utilizza l'operatore LinearRegressor() da ONNX-ML, mentre per i numeri double si utilizzano gli operatori ONNX MatMul(), Add() e Reshape().

L'implementazione del modello in ONNX dipende dal convertitore; negli esempi per l'esportazione in ONNX, verrà utilizzata la funzione skl2onnx.convert_sklearn() della libreria skl2onnx.







2.1.1.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati ONNX ard_regression_float.onnx e ard_regression_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ARDRegression" #define ONNXFilenameFloat "ard_regression_float.onnx" #define ONNXFilenameDouble "ard_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

ARDRegression (EURUSD,H1) Testing ONNX float : ARDRegression (ard_regression_float.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 ARDRegression (EURUSD,H1) ARDRegression (EURUSD,H1) Testing ONNX double : ARDRegression (ard_regression_double.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537597 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128795

Confronto con il modello double originale in Python:

Testing ONNX float : ARDRegression (ard_regression_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : ARDRegression (ard_regression_double.onnx) Python Mean Absolute Error: 6.34756801285375 8 MQL5: Mean Absolute Error: 6.34756801285375 97

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.







2.1.1.3. Le rappresentazioni ONNX dei modelli ard_regression_float.onnx e ard_regression_double.onnx



Netron (versione web) è uno strumento per la visualizzazione dei modelli e l'analisi dei grafici di calcolo, che può essere utilizzato per i modelli in formato ONNX (Open Neural Network Exchange).



Netron presenta i grafici dei modelli e la loro architettura in forma chiara e interattiva, consentendo l'esplorazione della struttura e dei parametri dei modelli di deep learning, compresi quelli creati con ONNX.



Le caratteristiche principali di Netron includono:



Visualizzazione dei Grafici: Netron visualizza l'architettura del modello come grafico, consentendo di vedere gli strati, le operazioni e le connessioni tra loro. È possibile comprendere facilmente la struttura e il flusso di dati all'interno del modello.

Esplorazione Interattiva: È possibile selezionare i nodi del grafico per ottenere ulteriori informazioni su ciascun operatore e sui suoi parametri.

Supporto per Diversi Formati: Netron supporta diversi formati di modelli di deep learning, tra cui ONNX, TensorFlow, PyTorch, CoreML e altri.

Capacità di Analisi dei Parametri: È possibile visualizzare i parametri e i pesi del modello, utili per comprendere i valori utilizzati nelle diverse parti del modello.

Netron è comodo per gli sviluppatori e i ricercatori nel campo dell'apprendimento automatico e del deep learning, in quanto semplifica la visualizzazione e l'analisi dei modelli, favorendo la comprensione e il debug di reti neurali complesse.

Questo strumento consente una rapida ispezione del modello, esplorandone la struttura e i parametri, facilitando il lavoro con le reti neurali profonde.



Per ulteriori dettagli su Netron, consultare gli articoli: Visualizzazione della rete neurale con Netron e Visualizzare Le Reti Neurali Keras con Netron.



Video su Netron::















Il modello ard_regression_float.onnx è mostrato nella Fig.6:

Fig.6. Rappresentazione ONNX del modello ard_regression_float.onnx in Netron

L'operatore ONNX ai.onnx.ml LinearRegressor() fa parte dello standard ONNX e descrive un modello per compiti di regressione. Questo operatore viene utilizzato per la regressione, che prevede la previsione di valori numerici (continua) sulla base delle caratteristiche di input.

Prende in input i parametri del modello, come i pesi e il bias, insieme alle caratteristiche in ingresso, ed esegue una regressione lineare. La regressione lineare stima i parametri (pesi) per ogni caratteristica in ingresso e poi esegue una combinazione lineare di queste caratteristiche con i pesi per generare una previsione.

Questo operatore esegue le seguenti operazioni:

Prende i pesi e i bias del modello, insieme alle caratteristiche di input. Per ogni esempio di dati di input, esegue una combinazione lineare dei pesi con le caratteristiche corrispondenti. Aggiunge il bias al valore risultante. Il risultato è la previsione della variabile target nel compito di regressione. I parametri di LinearRegressor() sono mostrati nella Fig.7.



Fig.7. Le proprietà dell'operatore LinearRegressor() del modello ard_regression_float.onnx in Netron

Il modello ONNX ard_regression_double.onnx è mostrato nella Fig.8: Il modello ONNXè mostrato nella Fig.8:

Fig.8. Rappresentazione ONNX del modello ard_regression_double.onnx in Netron

I parametri degli operatori ONNX MatMul(), Add() e Reshape() sono illustrati nella Fig.9-11.

Fig.9. Proprietà dell'operatore MatMul nel modello ard_regression_double.onnx in Netron

L’operatore ONNX MatMul (moltiplicazione matriciale) esegue la moltiplicazione di due matrici.

Richiede due input: due matrici e restituisce il loro prodotto matriciale. Se si hanno due matrici, A e B, il risultato di Matmul(A, B) è una matrice C, in cui ogni elemento C[i][j] è calcolato come la somma dei prodotti degli elementi della riga i della matrice A per gli elementi della colonna j della matrice B.



Fig.10. Proprietà dell'operatore Add nel modello ard_regression_double.onnx in Netron

L'operatore ONNX Add() esegue l'addizione elementare di due tensori o matrici della stessa forma.

Prende due input e restituisce il risultato, dove ogni elemento del tensore risultante è uguale alla somma degli elementi corrispondenti dei tensori di input.



Fig.11. Proprietà dell'operatore Reshape nel modello ard_regression_double.onnx in Netron

L’operatore ONNX Reshape(-1,1) viene utilizzato per modificare la forma (o dimensione) dei dati di input. In questo operatore, il valore -1 per la dimensione indica che la grandezza di quella dimensione deve essere calcolata automaticamente in base alle altre dimensioni per garantire la coerenza dei dati.

Il valore 1 nella seconda dimensione specifica che, dopo la trasformazione della forma, ogni elemento avrà una singola sottodimensione.



2.1.2. sklearn.linear_model.BayesianRidge BayesianRidge è un metodo di regressione che utilizza un approccio Bayesiano per stimare i parametri del modello. Questo metodo consente di modellare la distribuzione precedente dei parametri e di aggiornarla in base ai dati per ottenere la distribuzione posteriore dei parametri.

BayesianRidge è un metodo di regressione Bayesiano progettato per prevedere la variabile dipendente in base a una o più variabili indipendenti.



Principio di Funzionamento di BayesianRidge:

Distribuzione prioritaria dei parametri: Si inizia con la definizione della distribuzione prioritaria dei parametri del modello. Questa distribuzione rappresenta la conoscenza preliminare o le ipotesi sui parametri del modello prima di considerare i dati. Nel caso di BayesianRidge, si utilizzano distribuzioni prioritarie di forma Gaussiana. Aggiornamento della distribuzione dei parametri: Una volta impostata la distribuzione prioritaria dei parametri, questa viene aggiornata in base ai dati. Questo viene fatto utilizzando la teoria Bayesiana, dove la distribuzione posteriore dei parametri viene calcolata considerando i dati. Un aspetto essenziale è la stima degli iperparametri, che influenzano la forma della distribuzione posteriore. Previsione: Dopo aver stimato la distribuzione posteriore dei parametri, è possibile fare previsioni per nuove osservazioni. In questo modo si ottiene una distribuzione delle previsioni piuttosto che un singolo valore puntuale, tenendo conto dell'incertezza nelle previsioni. Vantaggi di BayesianRidge:

Considerazione dell'incertezza: BayesianRidge tiene conto dell'incertezza dei parametri del modello e delle previsioni. Invece di previsioni puntuali, vengono forniti intervalli di affidabilità.

Regolarizzazione: Il metodo di regressione Bayesiano può essere utile per la regolarizzazione del modello, aiutando a prevenire l'overfitting.

Selezione automatica delle caratteristiche: BayesianRidge può determinare automaticamente le caratteristiche importanti riducendo i pesi delle caratteristiche non significative. Limitazioni di BayesianRidge:

Complessità computazionale: Il metodo richiede risorse computazionali per stimare i parametri e calcolare la distribuzione posteriore.

Livello di astrazione elevato: Per comprendere e utilizzare BayesianRidge potrebbe essere necessaria una conoscenza più approfondita della statistica bayesiana.

Non sempre è la scelta migliore: Il metodo BayesianRidge può non essere il più adatto in alcuni compiti di regressione, in particolare quando si tratta di dati limitati. BayesianRidge è utile nei compiti di regressione in cui l'incertezza dei parametri e delle previsioni è importante e nei casi in cui è necessaria la regolarizzazione del modello.



2.1.2.1. Codice per la creazione del modello BayesianRidge ed esportazione in ONNX per float e double Questo codice crea il modello sklearn.linear_model.BayesianRidge, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# BayesianRidge.py

# Il codice dimostra il processo di addestramento del modello BayesianRidge, l'esportazione in formato ONNX (sia float che double) e l'elaborazione di previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import BayesianRidge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "BayesianRidge"

onnx_model_filename = data_path + "bayesian_ridge"



# creare un modello di regressione Bayesian Ridge

regression_model = BayesianRidge()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ("

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )





# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' ) Output: Python BayesianRidge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python Python BayesianRidge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python BayesianRidge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

Fig.12. Risultati di BayesianRidge.py (float ONNX)



2.1.2.2. Codice MQL5 per l'esecuzione dei Modelli ONNX Questo codice esegue i modelli ONNX bayesian_ridge_float.onnx e bayesian_ridge_double.onnx salvati e dimostra l'uso delle metriche di regressione in MQL5. #property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "BayesianRidge" #define ONNXFilenameFloat "bayesian_ridge_float.onnx" #define ONNXFilenameDouble "bayesian_ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); } Output: BayesianRidge (EURUSD,H1) Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 BayesianRidge (EURUSD,H1) BayesianRidge (EURUSD,H1) Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537624 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128866 Confronto con il modello double originale in Python: Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) Python Mean Absolute Error: 6.3475680128537 58 MQL5: Mean Absolute Error: 6.3475680128537 624 Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 13 cifre decimali.



2.1.2.3. Rappresentazione ONNX di bayesian_ridge_float.onnx e bayesian_ridge_double.onnx





Fig.13. Rappresentazione ONNX di bayesian_ridge_float.onnx in Netron





Fig.14. Rappresentazione ONNX di bayesian_ridge_double.onnx in Netron





Nota sui Metodi ElasticNet ed ElasticNetCV

ElasticNet ed ElasticNetCV sono due metodi di apprendimento automatico correlati utilizzati per regolarizzare i modelli di regressione, in particolare la regressione lineare. Condividono funzionalità comuni, ma si differenziano per le modalità di utilizzo e applicazione.



ElasticNet (Elastic Net Regression):

Principio di funzionamento: ElasticNet è un metodo di regressione che combina Lasso (regolarizzazione L1) e Ridge (regolarizzazione L2). Aggiunge due componenti di regolarizzazione alla funzione di perdita: una penalizza il modello per i grandi valori assoluti dei coefficienti (come Lasso) e l'altra penalizza il modello per i grandi quadrati dei coefficienti (come Ridge).

ElasticNet viene comunemente utilizzato in presenza di multicollinearità nei dati (quando le caratteristiche sono altamente correlate) e quando è necessaria la riduzione della dimensionalità, nonché il controllo dei valori dei coefficienti. ElasticNetCV (Elastic Net Cross-Validation):

Principio di funzionamento: ElasticNetCV è un'estensione di ElasticNet che prevede la selezione automatica degli iperparametri ottimali alfa (il coefficiente di miscelazione tra la regolarizzazione L1 e L2) e lambda (la forza di regolarizzazione) utilizzando la convalida incrociata. Esegue un'analisi dei vari valori alfa e lambda, scegliendo la combinazione che si comporta meglio nella convalida incrociata.

Vantaggi: ElasticNetCV regola automaticamente i parametri del modello in base alla convalida incrociata, consentendo di selezionare i valori ottimali degli iperparametri senza doverli regolare manualmente. Questo rende più comodo l'utilizzo e aiuta a prevenire l'overfitting del modello. Pertanto, la differenza principale tra ElasticNet ed ElasticNetCV è che ElasticNet è il metodo di regressione applicato ai dati, mentre ElasticNetCV è uno strumento che trova automaticamente i valori ottimali degli iperparametri per il modello ElasticNet utilizzando la convalida incrociata. ElasticNetCV è utile quando è necessario trovare i migliori parametri del modello e rendere il processo di messa a punto automatizzato.





2.1.3. sklearn.linear_model.ElasticNet

ElasticNet è un metodo di regressione che rappresenta una combinazione di regolarizzazione L1 (Lasso) e L2 (Ridge).

Questo metodo viene utilizzato per la regressione, che significa prevedere i valori numerici di una variabile target sulla base di un insieme di caratteristiche. ElasticNet aiuta a controllare l'overfitting e considera le penalizzazioni L1 e L2 sui coefficienti del modello.



Principio di funzionamento di ElasticNet:



Dati di input: Si parte dal set di dati originale in cui sono presenti le caratteristiche (variabili indipendenti) e i valori corrispondenti della variabile target. Funzione Obiettivo: ElasticNet minimizza la funzione di perdita che comprende due componenti - l’errore quadratico medio (mean squared error MSE) e due regolarizzazioni: L1 (Lasso) e L2 (Ridge). Ciò significa che la funzione obiettivo appare così:

Funzione obiettivo = MSE + α * L1 + β * L2

Dove α e β sono rispettivamente gli iperparametri che controllano i pesi della regolarizzazione L1 e L2. Trovare i valori ottimali di α e β: Il metodo della convalida incrociata viene solitamente utilizzato per trovare i valori migliori di α e β. In questo modo è possibile selezionare valori che raggiungono un equilibrio tra la riduzione dell'overfitting e la conservazione delle caratteristiche essenziali. Addestramento dei Modelli: ElasticNet addestra il modello considerando i valori ottimali di α e β, minimizzando la funzione obiettivo. Previsione: Dopo l'addestramento del modello, ElasticNet può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di ElasticNet:



Capacità di Selezione delle Caratteristiche: ElasticNet è in grado di selezionare automaticamente le caratteristiche più importanti, impostando i pesi a zero per le caratteristiche non significative (in modo simile a Lasso).

Controllo dell'Overfitting: ElasticNet consente di controllare l'overfitting grazie alla regolarizzazione L1 e L2.

Gestire la Multicollinearità: Questo metodo è utile quando esiste la multicollinearità (elevata correlazione tra le caratteristiche), poiché la regolarizzazione L2 può ridurre l'influenza delle caratteristiche multicollineari.

Limitazioni di ElasticNet:



Richiede la regolazione degli iperparametri α e β, che può essere un compito non banale.

A seconda della scelta dei parametri, ElasticNet può conservare un numero insufficiente o eccessivo di caratteristiche, con ripercussioni sulla qualità del modello.

ElasticNet è un potente metodo di regressione che può essere utile in compiti in cui la selezione delle caratteristiche e il controllo dell'overfitting sono cruciali.



2.1.3.1. Codice per la creazione del modello ElasticNet ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.ElasticNet, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# ElasticNet.py

# Il codice dimostra il processo di addestramento del modello ElasticNet, la sua esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range (1, min_decimal_places + 1 ):

if str_valore1[dot_position1 + i] == str_valore2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNet

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0 . 5 )



model_name = "ElasticNet"

onnx_model_filename = data_path + "elastic_net"



# creare un modello ElasticNet

regression_model = ElasticNet()



# Adattare il modello ai dati

regression_model.fit(X,y)



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print( "

" +model_name+ " Original model (double)" )

print( "R-squared (Coefficient of determination):" , r2)

print( "Mean Absolute Error:" , mae)

print( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1 } . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python ElasticNet Original model ( double ) Python R-squared (Coefficient of determination): 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python Python ElasticNet ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377032416807 Python Mean Absolute Error: 6.344395027824294 Python Mean Squared Error: 49.78556400887057 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 5 Python MSE matching decimal places: 6 Python float ONNX model precision: 5 Python Python ElasticNet ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig.15. Risultati di ElasticNet.py (float ONNX)

2.1.3.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati elastic_net_double.onnx ed elastic_net_float.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNet" #define ONNXFilenameFloat "elastic_net_float.onnx" #define ONNXFilenameDouble "elastic_net_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

ElasticNet (EURUSD,H1) Testing ONNX float : ElasticNet (elastic_net_float.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377032416807 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443950278242944 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855640088705869 ElasticNet (EURUSD,H1) ElasticNet (EURUSD,H1) Testing ONNX double : ElasticNet (elastic_net_double.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377031744798 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443946628765220 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855648981241217

Confronto con il modello double originale in Python:

Testing ONNX float : ElasticNet (elastic_net_float.onnx) Python Mean Absolute Error: 6.34439 4662876524 MQL5: Mean Absolute Error: 6.34439 50278242944 Testing ONNX double : ElasticNet (elastic_net_double.onnx) Python Mean Absolute Error: 6.34439466287652 4 MQL5: Mean Absolute Error: 6.34439466287652 20

Precisione di ONNX float MAE: 5 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.3.3. Rappresentazione ONNX di elastic_net_float.onnx e elastic_net_double.onnx







Fig.16. Rappresentazione ONNX di elastic_net_float.onnx in Netron









Fig.17. Rappresentazione ONNX di elastic_net_double.onnx in Netron







2.1.4. sklearn.linear_model.ElasticNetCV

ElasticNetCV è un'estensione del metodo ElasticNet progettato per selezionare automaticamente i valori ottimali degli iperparametri α e β (regolarizzazione L1 e L2) utilizzando la convalida incrociata.



Ciò consente di trovare la migliore combinazione di regolarizzazioni per il modello ElasticNet senza la necessità di regolare manualmente i parametri.



Principio di Funzionamento di ElasticNetCV:



Dati di input: Si parte dal dataset originale contenente le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Definizione dell'Intervallo α e β: L'utente specifica l'intervallo di valori di α e β da considerare durante l'ottimizzazione. Questi valori sono tipicamente scelti su una scala logaritmica. Suddivisione dei Dati: Il set di dati viene suddiviso in più passaggi per la convalida incrociata. Ciascun passaggio viene utilizzato come dataset di prova, mentre le altre vengono utilizzate per l'addestramento. Convalida Incrociata: Per ogni combinazione di α e β all'interno dell'intervallo specificato, viene eseguita una convalida incrociata. Il modello ElasticNet viene addestrato sui dati di addestramento e poi valutato sui dati di test. Valutazione delle Prestazioni: L'errore medio sui set di dati di prova nella convalida incrociata viene calcolato per ogni combinazione α e β. Selezione dei Parametri Ottimali: Vengono determinati i valori di α e β corrispondenti all'errore medio minimo ottenuto durante la convalida incrociata. Addestramento del modello con i Parametri Ottimali: Il modello ElasticNetCV viene addestrato utilizzando i valori ottimali trovati di α e β. Previsione: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di ElasticNetCV:



Selezione Automatica degli Iperparametri: ElasticNetCV trova automaticamente i valori ottimali di α e β, semplificando la messa a punto del modello.

Prevenzione dell'Overfitting: La convalida incrociata aiuta a selezionare un modello con una buona capacità di generalizzazione.

Robustezza al Rumore: Questo metodo è robusto contro il rumore dei dati e può identificare la migliore combinazione di regolarizzazione tenendo conto del rumore.

Limitazioni di ElasticNetCV:



Complessità Computazionale: L'esecuzione della convalida incrociata su un ampio intervallo di parametri può richiedere molto tempo.

I Parametri Ottimali Dipendono dalla Scelta dell'Intervallo: I risultati possono dipendere dalla scelta dell'intervallo di α e β, quindi è importante regolare attentamente questo intervallo.

ElasticNetCV è un potente strumento per regolare automaticamente la regolarizzazione del modello ElasticNet e migliorarne le prestazioni.



2.1.4.1. Codice per la creazione del modello ElasticNetCV ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.ElasticNetCV, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.



# ElasticNetCV.py

# Il codice dimostra il processo di addestramento del modello ElasticNetCV, la sua esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places(valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str(value1)

str_value2 = str(value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find(".")

dot_position2 = str_value2.find(".")



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else:

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNetCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[0]

last_index = data_path.rfind("\\") + 1

data_path = data_path[0:last_index]



# generare dati sintetici per la regressione

X = np.arange(0,100,1).reshape(-1,1)

y = 4*X + 10*np.sin(X*0.5)



model_name = "ElasticNetCV"

onnx_model_filename = data_path + "elastic_net_cv"



# creare un modello ElasticNetCV

regression_model = ElasticNetCV()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print("

"+model_name+" Original model (double)")

print("R-squared (Coefficient of determination):", r2)

print("Mean Absolute Error:", mae)

print("Mean Squared Error:", mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [('float_input', FloatTensorType([None, X.shape[1]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset=12)



# salvare il modello in un file

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print("

"+model_name+" ONNX model (float)")

# stampare il percorso del modello

print(f"ONNX model saved to {onnx_filename}")



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# visualizzare le informazioni sui tensori di output in ONNX

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[0]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print("R-squared (Coefficient of determination)", r2_onnx_float)

print("Mean Absolute Error:", mae_onnx_float)

print("Mean Squared Error:", mse_onnx_float)

print("R^2 matching decimal places: ",compare_decimal_places(r2, r2_onnx_float))

print("MAE matching decimal places: ",compare_decimal_places(mae, mae_onnx_float))

print("MSE matching decimal places: ",compare_decimal_places(mse, mse_onnx_float))

print("float ONNX model precision: ",compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparison (with float ONNX)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_float.png')



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [('double_input', DoubleTensorType([None, X.shape[1]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# salvare il modello in un file

onnx_filename=onnx_model_filename+"_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print("

"+model_name+" ONNX model (double)")

# stampare il percorso del modello

print(f"ONNX model saved to {onnx_filename}")



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# visualizzare le informazioni sui tensori di output in ONNX

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print("R-squared (Coefficient of determination)", r2_onnx_double)

print("Mean Absolute Error:", mae_onnx_double)

print("Mean Squared Error:", mse_onnx_double)

print("R^2 matching decimal places: ",compare_decimal_places(r2, r2_onnx_double))

print("MAE matching decimal places: ",compare_decimal_places(mae, mae_onnx_double))

print("MSE matching decimal places: ",compare_decimal_places(mse, mse_onnx_double))

print("double ONNX model precision: ",compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=(8,5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparison (with double ONNX)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_double.png')

Output:

Python ElasticNetCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python Python ElasticNetCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137770260989 Python Mean Absolute Error: 6.334486542922601 Python Mean Squared Error: 50.10217383894468 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python ElasticNetCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

<



Fig.18. Risultati di ElasticNetCV.py (float ONNX)

2.1.4.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli ONNX salvati elastic_net_cv_float.onnx e elastic_net_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNetCV" #define ONNXFilenameFloat "elastic_net_cv_float.onnx" #define ONNXFilenameDouble "elastic_net_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

ElasticNetCV (EURUSD,H1) Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137770260989 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344865429226038 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021738389446938 ElasticNetCV (EURUSD,H1) ElasticNetCV (EURUSD,H1) Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137763338385 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344871044232205 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021829994599983

Confronto con il modello double originale in Python:

Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) Python Mean Absolute Error: 6.33448 7104423225 MQL5: Mean Absolute Error: 6.33448 65429226038 Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) Python Mean Absolute Error: 6.33448710442322 5 MQL5: Mean Absolute Error: 6.33448710442322 05

Precisione di ONNX float MAE: 5 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.



2.1.4.3. Rappresentazione ONNX di elastic_net_cv_float.onnx e elastic_net_cv_double.onnx









Fig.19. Rappresentazione ONNX di elastic_net_cv_float.onnx in Netron









Fig.20. Rappresentazione ONNX di elastic_net_cv_double.onnx in Netron









2.1.5. sklearn.linear_model.HuberRegressor

HuberRegressor - è un metodo di apprendimento automatico utilizzato per compiti di regressione, che è una modifica del metodo dei Minimi Quadrati Ordinari (Ordinary Least Squares OLS) ed è progettato per essere robusto ai valori anomali nei dati.



A differenza di OLS, che minimizza i quadrati degli errori, HuberRegressor minimizza una combinazione di errori quadrati ed errori assoluti. Ciò consente al metodo di funzionare in modo più robusto in presenza di valori anomali nei dati.



Principio di funzionamento di HuberRegressor:



Dati di input: Si parte dal set di dati originale, dove sono presenti le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Funzione di Perdita di Huber: HuberRegressor utilizza la funzione di perdita di Huber, che combina una funzione di perdita quadratica per errori piccoli e una funzione di perdita lineare per errori grandi. Questo rende il metodo più resistente ai valori anomali. Addestramento dei Modelli: Il modello viene addestrato sui dati utilizzando la funzione di perdita di Huber. Durante l'addestramento, regola i pesi (coefficienti) per ogni caratteristica e il bias. Previsione: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di HuberRegressor:



Robustezza ai Valori Anomali: Rispetto a OLS, HuberRegressor è più robusto nei confronti dei valori anomali nei dati, il che lo rende utile nelle attività in cui i dati potrebbero contenere valori anomali.

Stima degli Errori: La funzione di perdita di Huber contribuisce alla stima degli errori di previsione, che può essere utile per analizzare i risultati del modello.

Livello di Regolarizzazione: HuberRegressor può anche incorporare un livello di regolarizzazione, che può ridurre l'overfitting.

Limitazioni di HuberRegressor:



Non così Accurata come OLS in Assenza di Valori Anomali: Nei casi in cui non vi siano valori anomali nei dati, OLS potrebbe fornire risultati più accurati.

Regolazione dei Parametri: HuberRegressor ha un parametro che definisce la soglia di ciò che è considerato "grande" per passare alla funzione di perdita lineare. Questo parametro richiede una messa a punto.

HuberRegressor è utile nelle attività di regressione in cui i dati possono contenere valori anomali ed è necessario un modello robusto a tali anomalie.





2.1.5.1. Codice per creare il modello HuberRegressor ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.HuberRegressor, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza sia del modello originale che dei modelli esportati in ONNX.

# HuberRegressor.py

# Il codice dimostra il processo di addestramento del modello HuberRegressor, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1 ):

if str_valore1[dot_position1 + i] == str_valore2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import HuberRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "HuberRegressor"

onnx_model_filename = data_path + "huber_regressor"



# creare un modello Huber Regressor

huber_regressor_model = HuberRegressor()



# Adattare il modello ai dati

huber_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = huber_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

"+model_name+" Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(huber_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print( "R-squared (Coefficient of determination)" , r2_onnx_float)

print( "Mean Absolute Error:" , mae_onnx_float)

print( "Mean Squared Error:" , mse_onnx_float)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(huber_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print( "

" +model_name +" ONNX model (double)" )

# stampare il percorso del modello

print( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python HuberRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python Python HuberRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363944236795 Python Mean Absolute Error: 6.341633300252807 Python Mean Squared Error: 49.80288328126165 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python HuberRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig.21. Risultati di HuberRegressor.py (float ONNX)







2.1.5.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli ONNX salvati huber_regressor_float.onnx e huber_regressor_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "HuberRegressor" #define ONNXFilenameFloat "huber_regressor_float.onnx" #define ONNXFilenameDouble "huber_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

HuberRegressor (EURUSD,H1) Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363944236795 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416333002528074 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028832812616571 HuberRegressor (EURUSD,H1) HuberRegressor (EURUSD,H1) Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363935647066 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416337085696410 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028946478433525

Confronto con il modello double originale in Python:

Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) Python Mean Absolute Error: 6.341633 708569641 MQL5: Mean Absolute Error: 6.341633 3002528074 Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) Python Mean Absolute Error: 6.34163370856964 1 MQL5: Mean Absolute Error: 6.34163370856964 10

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.5.3. Rappresentazione ONNX di huber_regressor_float.onnx e huber_regressor_double.onnx











Fig.22. Rappresentazione ONNX di huber_regressor_float.onnx in Netron









Fig.23. Rappresentazione ONNX di huber_regressor_double.onnx in Netron









2.1.6. sklearn.linear_model.Lars

LARS (Least Angle Regression) è un metodo di apprendimento automatico utilizzato per compiti di regressione. È un algoritmo che costruisce un modello di regressione lineare selezionando le caratteristiche attive (variabili) durante il processo di apprendimento.



LARS cerca di trovare il minor numero di caratteristiche che forniscono la migliore approssimazione alla variabile target.



Principio di Funzionamento di LARS:



Dati di input: Si parte dal dataset originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: Si inizia con un modello nullo, cioè senza caratteristiche attive. Tutti i coefficienti sono impostati a zero. Selezione delle Caratteristiche: Ad ogni passo, LARS seleziona la caratteristica più correlata con i residui del modello. Questa caratteristica viene quindi aggiunta al modello e il suo coefficiente corrispondente viene regolato con il metodo dei minimi quadrati. Regressione Lungo le Caratteristiche Attive: Dopo aver aggiunto la caratteristica al modello, LARS aggiorna i coefficienti di tutte le caratteristiche attive per adattarli alle modifiche del nuovo modello. Passi Ripetitivi: Questo processo continua finché non vengono selezionate tutte le caratteristiche o finché non viene soddisfatto un criterio di arresto specificato. Previsione: Dopo l'addestramento del modello, può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LARS:



Efficienza: LARS può essere un metodo efficiente, soprattutto quando ci sono molte caratteristiche, ma solo alcune influenzano significativamente la variabile target.

Interpretabilità: Poiché LARS mira a selezionare solo le caratteristiche più informative, il modello rimane relativamente interpretabile.

Limitazioni di LARS:



Modello Lineare: LARS costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni complesse e non lineari.

Sensibilità al Rumore: Il metodo può essere sensibile ai valori anomali dei dati.

Incapacità di Gestire la Multicollinearità: Se le caratteristiche sono altamente correlate, LARS potrebbe avere problemi di multicollinearità.

LARS è utile nei compiti di regressione in cui è essenziale selezionare le caratteristiche più informative e costruire un modello lineare con un numero minimo di caratteristiche.





2.1.6.1. Codice per creare il modello Lars ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.Lars, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# Lars.py

# Il codice dimostra il processo di addestramento del modello Lars, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Lars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = " Lars"

onnx_model_filename = data_path + "lars"



# creare un modello Lars Regressor

lars_regressor_model = Lars()



# Adattare il modello ai dati

lars_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = lars_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print( "R-squared (Coefficient of determination)" , r2_onnx_double)

print( "Mean Absolute Error:" , mae_onnx_double)

print( "Mean Squared Error:" , mse_onnx_double)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python Lars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python Lars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python Lars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





Fig.24. Risultati di Lars.py (float ONNX)







2.1.6.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lars_cv_float.onnx e lars_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lars" #define ONNXFilenameFloat "lars_float.onnx" #define ONNXFilenameDouble "lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

Lars (EURUSD,H1) Testing ONNX float : Lars (lars_float.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 Lars (EURUSD,H1) Lars (EURUSD,H1) Testing ONNX double : Lars (lars_double.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Confronto con il modello double originale in Python:

Testing ONNX float : Lars (lars_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : Lars (lars_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 13 cifre decimali.





2.1.6.3. Rappresentazione ONNX di lars_float.onnx e lars_double.onnx









Fig.25. Rappresentazione ONNX di lars_float.onnx in Netron









Fig.26. Rappresentazione ONNX di lars_double.onnx in Netron





2.1.7. sklearn.linear_model.LarsCV

LarsCV è una variante del metodo LARS (Least Angle Regression) che seleziona automaticamente il numero ottimale di caratteristiche da includere nel modello utilizzando la convalida incrociata.



Questo metodo aiuta a trovare un equilibrio tra un modello che generalizza i dati in modo efficace e uno che utilizza un numero minimo di caratteristiche.



Principio di Funzionamento di LarsCV:



Dati di input: Si parte dal dataset originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: Si inizia con un modello nullo, cioè senza caratteristiche attive. Tutti i coefficienti sono impostati a zero. Convalida Incrociata: LarsCV esegue una convalida incrociata per diverse quantità di caratteristiche incluse. In questo modo si valutano le prestazioni del modello con diversi set di caratteristiche. Selezione del Numero Ottimale di Caratteristiche: LarsCV sceglie il numero di caratteristiche che produce le migliori prestazioni del modello, determinate attraverso la convalida incrociata. Addestramento dei Modelli: Il modello viene addestrato utilizzando il numero scelto di caratteristiche e i rispettivi coefficienti. Previsione: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LarsCV:



Selezione Automatica delle Caratteristiche: LarsCV sceglie automaticamente il numero ottimale di caratteristiche, semplificando il processo di impostazione del modello.

Interpretabilità: Come il normale LARS, LarsCV mantiene un'interpretabilità del modello relativamente alta.

Efficienza: Il metodo può essere efficiente, soprattutto quando i set di dati hanno molte caratteristiche, ma solo alcune sono significative.

Limitazioni di LarsCV:



Modello Lineare: LarsCV costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni non lineari complesse.

Sensibilità al Rumore: Il metodo può essere sensibile ai valori anomali dei dati.

Incapacità di Gestire la Multicollinearità: Se le caratteristiche sono altamente correlate, LarsCV potrebbe avere problemi di multicollinearità.

LarsCV è utile nelle attività di regressione in cui è importante scegliere automaticamente il miglior set di caratteristiche utilizzate nel modello e mantenere l'interpretabilità del modello.





2.1.7.1. Codice per creare il modello LarsCV ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LarsCV, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LarsCV.py

# Il codice dimostra il processo di addestramento del modello LarsCV, la sua esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range (1, min_decimal_places + 1 ):

if str_valore1[dot_position1 + i] == str_valore2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LarsCV"

onnx_model_filename = data_path + "lars_cv"



# creare un modello LarsCV Regressor

larscv_regressor_model = LarsCV()



# Adattare il modello ai dati

larscv_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = larscv_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(larscv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(larscv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python LarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





Fig.27. Risultati di LarsCV.py (float ONNX)





2.1.7.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lars_cv_float.onnx e lars_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LarsCV" #define ONNXFilenameFloat "lars_cv_float.onnx" #define ONNXFilenameDouble "lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

LarsCV (EURUSD,H1) Testing ONNX float : LarsCV (lars_cv_float.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LarsCV (EURUSD,H1) LarsCV (EURUSD,H1) Testing ONNX double : LarsCV (lars_cv_double.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : LarsCV (lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LarsCV (lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 16 cifre decimali.





2.1.7.3. Rappresentazione ONNX di lars_cv_float.onnx e lars_cv_double.onnx





Fig.28. Rappresentazione ONNX di lars_cv_float.onnx in Netron









Fig.29. Rappresentazione ONNX di lars_cv_double.onnx in Netron







2.1.8. sklearn.linear_model.Lasso

Lasso (Least Absolute Shrinkage and Selection Operator) è un metodo di regressione utilizzato per selezionare le caratteristiche più importanti e ridurre la dimensionalità del modello.



Ciò si ottiene aggiungendo una penalità per la somma dei valori assoluti dei coefficienti (regolarizzazione L1) nel problema di ottimizzazione della regressione lineare.



Principio di Funzionamento di Lasso:



Dati di input: Si parte dal set di dati originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Funzione Obiettivo: La funzione obiettivo di Lasso comprende la somma degli errori di regressione al quadrato e una penalità sulla somma dei valori assoluti dei coefficienti associati alle caratteristiche. Ottimizzazione: Il modello Lasso viene addestrato minimizzando la funzione obiettivo, con il risultato che alcuni coefficienti diventano nulli, escludendo di fatto le caratteristiche corrispondenti dal modello. Selezione del Valore Ottimale della Penalità: Lasso include un iperparametro che determina la forza della regolarizzazione. La scelta del valore ottimale di questo iperparametro può richiedere una convalida incrociata. Generazione di Previsioni: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di Lasso:



Selezione delle Caratteristiche: Lasso seleziona automaticamente le caratteristiche più importanti, escludendo dal modello quelle meno significative. Questo riduce la dimensionalità dei dati e semplifica il modello.

Regolarizzazione: La penalità sulla somma dei valori assoluti dei coefficienti aiuta a prevenire l'overfitting del modello e ne migliora la generalizzazione.

Interpretabilità: Poiché Lasso esclude alcune caratteristiche, il modello rimane relativamente interpretabile.

Limitazioni di Lasso:



Modello Lineare: Lasso costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni non lineari complesse.

Sensibilità al Rumore: Il metodo può essere sensibile ai valori anomali dei dati.

Incapacità di Gestire la Multicollinearità: Se le caratteristiche sono altamente correlate, Lasso potrebbe incontrare problemi di multicollinearità.

Lasso è utile nelle attività di regressione in cui è essenziale selezionare le caratteristiche più importanti e ridurre la dimensionalità del modello mantenendo l'interpretabilità.





2.1.8.1. Codice per creare il modello Lasso ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.Lasso, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza sia del modello originale che dei modelli esportati in ONNX.

# Lasso.py

# Il codice dimostra il processo di addestramento del modello Lasso, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (valore1, valore2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range ( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Lasso

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "Lasso"

onnx_model_filename = data_path + "lasso"



# creare un modello Lasso

lasso_model = Lasso()



# Adattare il modello ai dati

lasso_model.fit(X, y)



# Prevedere i valori per l'intero set di dati

y_pred = lasso_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lasso_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lasso_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python Lasso Original model ( double ) Python R-squared (Coefficient of determination): 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python Python Lasso ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381720269486 Python Mean Absolute Error: 6.346395056911361 Python Mean Squared Error: 49.77936068668213 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python Lasso ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15









Fig.30. Risultati di Lasso.py (float ONNX)





2.1.8.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lasso_float.onnx e lasso_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lasso" #define ONNXFilenameFloat "lasso_float.onnx" #define ONNXFilenameDouble "lasso_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

Lasso (EURUSD,H1) Testing ONNX float : Lasso (lasso_float.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381720269486 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463950569113612 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793606866821037 Lasso (EURUSD,H1) Lasso (EURUSD,H1) Testing ONNX double : Lasso (lasso_double.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381735682287 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463937919229840 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793402912937850

Confronto con il modello double originale in Python:

Testing ONNX float : Lasso (lasso_float.onnx) Python Mean Absolute Error: 6.34639 3791922984 MQL5: Mean Absolute Error: 6.34639 50569113612 Testing ONNX double : Lasso (lasso_double.onnx) Python Mean Absolute Error: 6.346393791922984 MQL5: Mean Absolute Error: 6.346393791922984 0

Precisione di ONNX float MAE: 5 cifre decimali, Precisione di ONNX double MAE: 15 cifre decimali.





2.1.8.3. Rappresentazione ONNX di lasso_float.onnx e lasso_double.onnx









Fig.31. Rappresentazione ONNX di lasso_float.onnx in Netron













Fig.32. Rappresentazione ONNX di lasso_double.onnx in Netron







2.1.9. sklearn.linear_model.LassoCV

LassoCV è una variante del metodo Lasso (Least Absolute Shrinkage and Selection Operator) che seleziona automaticamente il valore ottimale dell'iperparametro di regolarizzazione (alfa) utilizzando la convalida incrociata.



Questo metodo consente di trovare un bilanciamento tra la riduzione della dimensionalità del modello (selezionando le caratteristiche importanti) e la prevenzione dell'overfitting, rendendolo utile per i compiti di regressione.



Principio di Funzionamento di LassoCV:



Dati di input: Si parte dal set di dati originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: LassoCV inizializza differenti valori dell'iperparametro di regolarizzazione (alfa) che coprono un intervallo da basso ad alto. Convalida Incrociata: Per ogni valore alfa, LassoCV esegue una convalida incrociata per valutare le prestazioni del modello. Vengono comunemente utilizzate metriche come l'errore quadratico medio (MSE) o il coefficiente di determinazione (R^2). Selezione dell'Alfa Ottimale: LassoCV seleziona il valore di alfa in cui il modello ottiene le migliori prestazioni determinate dalla convalida incrociata. Addestramento dei Modelli: Il modello Lasso viene addestrato utilizzando il valore alfa scelto, escludendo le caratteristiche meno importanti e applicando la regolarizzazione L1. Generazione di Previsioni: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LassoCV:



Selezione Automatica dell'Alfa: LassoCV seleziona automaticamente il valore alfa ottimale utilizzando la convalida incrociata, semplificando la messa a punto del modello.

Selezione delle Caratteristiche: LassoCV sceglie automaticamente le caratteristiche più importanti, riducendo la dimensionalità del modello e semplificandone l'interpretazione.

Regolarizzazione: Il metodo previene l'overfitting del modello attraverso la regolarizzazione L1.

Limitazioni di LassoCV:



Modello Lineare: LassoCV costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni non lineari complesse.

Sensibilità al Rumore: Il metodo può essere sensibile ai valori anomali dei dati.

Incapacità di Gestire la Multicollinearità: Quando le caratteristiche sono altamente correlate, LassoCV potrebbe avere problemi di multicollinearità.

LassoCV è utile nei compiti di regressione in cui è importante selezionare le caratteristiche più importanti e ridurre la dimensionalità del modello mantenendo l'interpretabilità e prevenendo l'overfitting.





2.1.9.1. Codice per creare il modello LassoCV ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LassoCV, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LassoCV.py

# Il codice dimostra il processo di addestramento del modello LassoCV, l'esportazione in formato ONNX (sia float che double) e l'esecuzione di previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(-1,1)

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoCV"

onnx_model_filename = data_path + "lasso_cv"



# creare un modello LassoCV Regressor

lassocv_regressor_model = LassoCV()



# Adattare il modello ai dati

lassocv_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = lassocv_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python LassoCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python Python LassoCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.996224142876629 Python Mean Absolute Error: 6.335673221332177 Python Mean Squared Error: 49.96500504333324 Python R^ 2 matching decimal places: 10 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 6 Python float ONNX model precision: 6 Python Python LassoCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig.33. Risultati di LassoCV.py (float ONNX)



2.1.9.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lasso_cv_float.onnx e lasso_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoCV" #define ONNXFilenameFloat "lasso_cv_float.onnx" #define ONNXFilenameDouble "lasso_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

2023.10 . 26 22 : 14 : 00.736 LassoCV (EURUSD,H1) Testing ONNX float : LassoCV (lasso_cv_float.onnx) 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428766290 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356732213321800 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650050433332211 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) Testing ONNX double : LassoCV (lasso_cv_double.onnx) 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428413416 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356733445381899 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650055102816992

Confronto con il modello double originale in Python:

Testing ONNX float : LassoCV (lasso_cv_float.onnx) Python Mean Absolute Error: 6.335673 34453819 MQL5: Mean Absolute Error: 6.335673 2213321800 Testing ONNX double : LassoCV (lasso_cv_double.onnx) Python Mean Absolute Error: 6.3356733445381 9 MQL5: Mean Absolute Error: 6.3356733445381 899

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 13 cifre decimali.





2.1.9.3. Rappresentazione ONNX di lasso_cv_float.onnx e lasso_cv_double.onnx





Fig.34. Rappresentazione ONNX di lasso_cv_float.onnx in Netron









Fig.35. Rappresentazione ONNX di lasso_cv_double.onnx in Netron







2.1.10. sklearn.linear_model.LassoLars

LassoLars è una combinazione di due metodi: Lasso (Least Absolute Shrinkage and Selection Operator) e LARS (Least Angle Regression).



Questo metodo viene utilizzato per compiti di regressione e combina i vantaggi di entrambi gli algoritmi, consentendo la selezione simultanea delle caratteristiche e la riduzione della dimensionalità del modello.



Principio di Funzionamento di LassoLars:



Dati di input: Si parte dal set di dati originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: LassoLars inizia con un modello nullo, cioè senza caratteristiche attive. Tutti i coefficienti sono impostati a zero. Selezione Graduale delle Caratteristiche: Simile al metodo LARS, LassoLars seleziona, ad ogni passaggio, la caratteristica più correlata con i residui del modello e la aggiunge al modello. Quindi, il coefficiente di questa caratteristica viene regolato con il metodo dei minimi quadrati. Applicazione della Regolarizzazione L1: Contemporaneamente alla selezione graduale delle caratteristiche, LassoLars applica la regolarizzazione L1, aggiungendo una penalità per la somma dei valori assoluti dei coefficienti. Ciò consente di modellare relazioni complesse e di scegliere le caratteristiche più importanti. Effettuare Previsioni: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LassoLars:



Selezione delle Caratteristiche: LassoLars seleziona automaticamente le caratteristiche più importanti e riduce la dimensionalità del modello, aiutando ad evitare l'overfitting e semplificando l'interpretazione.

Interpretabilità: Il metodo mantiene l'interpretabilità del modello, rendendo facile determinare quali caratteristiche sono incluse e come influenzano la variabile target.

Regolarizzazione: LassoLars applica la regolarizzazione L1, evitando l'overfitting e migliorando la generalizzazione del modello.

Limitazioni di LassoLars:



Modello Lineare: LassoLars costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni non lineari complesse.

Sensibilità al Rumore: Il metodo potrebbe essere sensibile ai valori anomali dei dati.

Complessità Computazionale: La selezione delle caratteristiche in ogni fase e l'applicazione della regolarizzazione potrebbero richiedere maggiori risorse computazionali rispetto alla semplice regressione lineare.

LassoLars è utile nei compiti di regressione in cui è importante scegliere le caratteristiche più importanti, ridurre la dimensionalità del modello e mantenere l'interpretabilità.





2.1.10.1. Codice per la creazione del modello LassoLars ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LassoLars, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LassoLars.py

# Il codice dimostra il processo di addestramento del modello LassoLars, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLars"

onnx_model_filename = data_path + "lasso_lars"



# creare un modello LassoLars Regressor

lassolars_regressor_model = LassoLars(alpha= 0.1 )



# Adattare il modello ai dati

lassolars_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = lassolars_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la retta di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )



Output:

Python LassoLars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python Python LassoLars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382635045889 Python Mean Absolute Error: 6.3476034814795375 Python Mean Squared Error: 49.77815018516975 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





Fig.36. Risultato di LassoLars.py (float)





2.1.10.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i file salvati lasso_lars_float.onnx e lasso_lars_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLars" #define ONNXFilenameFloat "lasso_lars_float.onnx" #define ONNXFilenameDouble "lasso_lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

LassoLars (EURUSD,H1) Testing ONNX float : LassoLars (lasso_lars_float.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382635045889 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476034814795375 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781501851697357 LassoLars (EURUSD,H1) LassoLars (EURUSD,H1) Testing ONNX double : LassoLars (lasso_lars_double.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382633544077 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476035128950858 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781521724819029

Confronto con il modello double originale in Python:

Testing ONNX float : LassoLars (lasso_lars_float.onnx) Python Mean Absolute Error: 6.347603 5128950805 MQL5: Mean Absolute Error: 6.347603 4814795375 Testing ONNX double : LassoLars (lasso_lars_double.onnx) Python Mean Absolute Error: 6.34760351289508 05 MQL5: Mean Absolute Error: 6.34760351289508 58

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.10.3. Rappresentazione ONNX di lasso_lars_float.onnx e lasso_lars_double.onnx









Fig.37. Rappresentazione ONNX di lasso_lars_float.onnx in Netron













Fig.38. Rappresentazione ONNX di lasso_lars_double.onnx in Netron





2.1.11. sklearn.linear_model.LassoLarsCV

LassoLarsCV è un metodo che combina Lasso (Least Absolute Shrinkage and Selection Operator) e LARS (Least Angle Regression) con la selezione automatica dell'iperparametro di regolarizzazione ottimale (alfa) mediante convalida incrociata.



Questo metodo combina i vantaggi di entrambi gli algoritmi e consente di determinare il valore alfa ottimale per il modello, considerando la selezione delle caratteristiche e la regolarizzazione.



Principio di Funzionamento di LassoLarsCV:



Dati di input: Si parte dal set di dati originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: LassoLarsCV inizia con un modello nullo, in cui tutti i coefficienti sono impostati a zero. Definizione dell’Intervallo Alfa: Viene determinato un intervallo di valori per l'iperparametro alfa, che verrà considerato durante il processo di selezione. Di solito si utilizza una scala logaritmica dei valori alfa. Convalida Incrociata: Per ogni valore alfa dell'intervallo scelto, LassoLarsCV esegue una convalida incrociata per valutare le prestazioni del modello con questo valore alfa. In genere si utilizzano metriche come l'errore quadratico medio (MSE) o il coefficiente di determinazione (R^2). Selezione dell'Alfa Ottimale: LassoLarsCV sceglie il valore alfa in cui il modello ottiene le migliori prestazioni in base ai risultati della convalida incrociata. Addestramento dei Modelli: Il modello LassoLars viene addestrato utilizzando il valore alfa selezionato, escludendo le caratteristiche meno importanti e applicando la regolarizzazione L1. Effettuare Previsioni: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LassoLarsCV:

Selezione Automatica dell'Alfa: LassoLarsCV seleziona automaticamente l'iperparametro alfa ottimale utilizzando la convalida incrociata, semplificando la messa a punto del modello.

Selezione delle Caratteristiche: LassoLarsCV sceglie automaticamente le caratteristiche più importanti e riduce la dimensionalità del modello.

Regolarizzazione: Il metodo applica la regolarizzazione L1, evitando l'overfitting e migliorando la generalizzazione del modello.

Limitazioni di LassoLarsCV:



Modello Lineare: LassoLarsCV costruisce un modello lineare, che potrebbe essere insufficiente per modellare relazioni non lineari complesse.

Sensibilità al Rumore: Il metodo potrebbe essere sensibile ai valori anomali dei dati.

Complessità Computazionale: La selezione delle caratteristiche in ogni fase e l'applicazione della regolarizzazione potrebbero richiedere maggiori risorse computazionali rispetto alla semplice regressione lineare.

LassoLarsCV è utile nei compiti di regressione in cui è essenziale scegliere le caratteristiche più importanti, ridurre la dimensionalità del modello, evitare l'overfitting e regolare automaticamente gli iperparametri del modello.





2.1.11.1. Codice per la creazione del modello LassoLarsCV ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LassoLarsCV, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LassoLarsCV.py

# Il codice dimostra il processo di addestramento del modello LassoLars, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 ,1).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLarsCV"

onnx_model_filename = data_path + "lasso_lars_cv"



# creare un modello LassoLarsCV Regressor

lassolars_cv_regressor_model = LassoLarsCV(cv= 5 )



# Adattare il modello ai dati

lassolars_cv_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = lassolars_cv_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ("

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python LassoLarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LassoLarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





Fig.39. Risultati di LassoLarsCV.py (float ONNX)





2.1.11.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lasso_lars_cv_float.onnx e lasso_lars_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsCV" #define ONNXFilenameFloat "lasso_lars_cv_float.onnx" #define ONNXFilenameDouble "lasso_lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

LassoLarsCV (EURUSD,H1) Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LassoLarsCV (EURUSD,H1) LassoLarsCV (EURUSD,H1) Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

Confronto con il modello double originale in Python:

Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 16 cifre decimali.





2.1.11.3. Rappresentazione ONNX di lasso_lars_cv_float.onnx e lasso_lars_cv_double.onnx









Fig.40. Rappresentazione ONNX di lasso_lars_cv_float.onnx in Netron









Fig.41. Rappresentazione ONNX di lasso_lars_cv_double.onnx in Netron







2.1.12. sklearn.linear_model.LassoLarsIC

LassoLarsIC è un metodo di regressione che combina Lasso (Least Absolute Shrinkage and Selection Operator) e Information Criterion (IC) per selezionare automaticamente l'insieme ottimale di caratteristiche.



Utilizza criteri informativi come AIC (Akaike Information Criterion) e BIC (Bayesian Information Criterion) per determinare quali caratteristiche includere nel modello e applica la regolarizzazione L1 per stimare i coefficienti del modello.



Principio di Funzionamento di LassoLarsIC:



Dati di input: Si parte dal set di dati originale, che comprende le caratteristiche (variabili indipendenti) e i corrispondenti valori delle variabili target. Inizializzazione: LassoLarsIC inizia con un modello nullo, cioè senza caratteristiche attive. Tutti i coefficienti sono impostati a zero. Selezione delle Caratteristiche mediante Information Criterion: Il metodo valuta il criterio di informazione (ad esempio, AIC o BIC) per diversi set di caratteristiche, partendo da un modello vuoto e incorporando gradualmente le caratteristiche nel modello. Il criterio di informazione valuta la qualità del modello, considerando il compromesso tra adattamento ai dati e complessità del modello. Selezione dell'Insieme Ottimale di Caratteristiche: LassoLarsIC sceglie l'insieme di caratteristiche per il quale il criterio di informazione ottiene il valore migliore. Questo insieme di caratteristiche sarà incluso nel modello. Applicazione della Regolarizzazione L1: La regolarizzazione L1 viene applicata alle caratteristiche selezionate, aiutando nella stima dei coefficienti del modello. Effettuare Previsioni: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori delle variabili target per i nuovi dati.

Vantaggi di LassoLarsIC:



Selezione Automatica delle Caratteristiche: LassoLarsIC sceglie automaticamente il set di caratteristiche ottimale, riducendo la dimensionalità del modello ed evitando l'overfitting.

Criteri di Informazione: L'uso di criteri informativi consente di bilanciare la qualità e la complessità del modello.

Regolarizzazione: Il metodo applica la regolarizzazione L1, evitando l'overfitting e migliorando la generalizzazione del modello.

Limitazioni di LassoLarsIC:



Modello Lineare: LassoLarsIC costruisce un modello lineare, che può essere insufficiente per modellare complesse relazioni non lineari.

Sensibilità al Rumore: Il metodo potrebbe essere sensibile ai valori anomali dei dati.

Complessità Computazionale: La valutazione dei criteri informativi per diversi set di caratteristiche potrebbe richiedere ulteriori risorse computazionali.

LassoLarsIC è utile nei compiti di regressione in cui è fondamentale selezionare automaticamente il miglior set di caratteristiche e ridurre la dimensionalità del modello in base a criteri informativi.





2.1.12.1. Codice per creare il modello LassoLarsIC ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LassoLarsIC, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LassoLarsIC.py

# Il codice dimostra il processo di addestramento del modello LassoLarsIC, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLarsIC

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name= "LassoLarsIC"

onnx_model_filename = data_path + "lasso_lars_ic "



# creare un modello LassoLarsIC Regressor

lasso_lars_ic_regressor_model = LassoLarsIC(criterion= 'aic' )



# Adattare il modello ai dati

lasso_lars_ic_regressor_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = lasso_lars_ic_regressor_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python LassoLarsIC Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python LassoLarsIC ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsIC ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





Fig.42. Risultati di LassoLarsIC.py (float ONNX)





2.1.12.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati lasso_lars_ic_float.onnx e lasso_lars_ic_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsIC" #define ONNXFilenameFloat "lasso_lars_ic_float.onnx" #define ONNXFilenameDouble "lasso_lars_ic_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

LassoLarsIC (EURUSD,H1) Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LassoLarsIC (EURUSD,H1) LassoLarsIC (EURUSD,H1) Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 13 cifre decimali.





2.1.12.3. Rappresentazione ONNX di lasso_lars_ic_float.onnx e lasso_lars_ic_double.onnx









Fig.43. Rappresentazione ONNX di lasso_lars_ic_float.onnx in Netron





Fig.44. Rappresentazione ONNX di lasso_lars_ic_double.onnx in Netron













2.1.13. sklearn.linear_model.LinearRegression

LinearRegression è uno dei metodi più semplici e più utilizzati nell'apprendimento automatico per i compiti di regressione.



Viene utilizzato per costruire modelli lineari che prevedono valori numerici (continua) della variabile target sulla base di una combinazione lineare di caratteristiche di input.



Principio di Funzionamento di LinearRegression:



Modello Lineare: Il modello LinearRegression presuppone l'esistenza di una relazione lineare tra le variabili indipendenti (caratteristiche) e la variabile target. Questa relazione può essere espressa dall'equazione di regressione lineare: y = β₀ + β₁x₁ + β₂x₂ + ... + βₚxₚ, dove y è la variabile target, β₀ - è il coefficiente di intercetta, β₁, β₂, ... βₚ - sono i coefficienti delle caratteristiche, x₁, x₂, ... xₚ sono i valori delle caratteristiche. Stima dei Parametri: L'obiettivo di LinearRegression è stimare i coefficienti β₀, β₁, β₂, ... βₚ, che meglio si adattano ai dati. Questo si ottiene in genere con il metodo dei Minimi Quadrati Ordinari (Ordinary Least Squares OLS), minimizzando la somma delle differenze al quadrato tra i valori effettivi e quelli previsti. Valutazione del Modello: Per valutare la qualità del modello LinearRegression vengono utilizzate diverse metriche, come l'Errore Quadratico Medio (Mean Squared Error MSE), il Coefficiente di Determinazione (R²) e altre ancora.

Vantaggi di LinearRegression:



Semplicità e Interpretabilità: LinearRegression è un metodo semplice e di facile interpretazione, che consente di analizzare l'influenza di ogni caratteristica sulla variabile target.

Alta Velocità di Addestramento e Previsione: Il modello di regressione lineare ha un'elevata velocità di addestramento e di previsione, che lo rende una buona scelta per i grandi set di dati.

Applicabilità: LinearRegression può essere applicata con successo a diversi compiti di regressione.

Limiti di LinearRegression:



Linearità: Questo metodo presuppone la linearità della relazione tra le caratteristiche e la variabile target, che potrebbe essere insufficiente per modellare complesse dipendenze non lineari.

Sensibilità ai Valori Anomali: LinearRegression è sensibile ai valori anomali nei dati, che possono influire sulla qualità del modello.

LinearRegression è un metodo di regressione semplice e ampiamente utilizzato che costruisce un modello lineare per prevedere i valori numerici della variabile target in base a una combinazione lineare di caratteristiche di input. È adatto a problemi con una relazione lineare e quando l'interpretabilità del modello è importante.





2.1.13.1. Codice per creare il modello LinearRegression ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.LinearRegression, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# LinearRegression.py

# Il codice dimostra il processo di addestramento del modello LinearRegression, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LinearRegression"

onnx_model_filename = data_path + "linear_regression"



# creare un modello Linear Regression

linear_model = LinearRegression()



# Adattare il modello ai dati

linear_model.fit(X, y)



# Prevedere i valori per l'intero set di dati

y_pred = linear_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(linear_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data ', marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(linear_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name +' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python LinearRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python LinearRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LinearRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig.45.Risultati di LinearRegression.py (float ONNX)





2.1.13.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i file salvati linear_regression_float.onnx e linear_regression_double.onnx, dimostrando l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LinearRegression" #define ONNXFilenameFloat "linear_regression_float.onnx" #define ONNXFilenameDouble "linear_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

LinearRegression (EURUSD,H1) Testing ONNX float : LinearRegression (linear_regression_float.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LinearRegression (EURUSD,H1) LinearRegression (EURUSD,H1) Testing ONNX double : LinearRegression (linear_regression_double.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : LinearRegression (linear_regression_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LinearRegression (linear_regression_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.13.3. Rappresentazione ONNX di linear_regression_float.onnx e linear_regression_double.onnx









Fig.46. Rappresentazione ONNX di linear_regression_float.onnx in Netron













Fig.47. Rappresentazione ONNX di linear_regression_double.onnx in Netron









Nota sui Metodi Ridge e RidgeCV



Ridge e RidgeCV sono due metodi correlati nell'apprendimento automatico utilizzati per la regolarizzazione nella regressione Ridge. Condividono funzionalità simili, ma si differenziano per l'uso e la regolazione dei parametri.



Principio di Funzionamento di Ridge (Ridge Regression):

Ridge è un metodo di regressione che prevede la regolarizzazione L2. Significa che aggiunge la somma dei coefficienti al quadrato (norma L2) alla funzione di perdita minimizzata dal modello. Questo termine di regolarizzazione aggiuntivo aiuta a ridurre l'entità dei coefficienti del modello, evitando così l'overfitting.

Uso del parametro alfa: Nel metodo Ridge, il parametro alfa (noto anche come forza di regolarizzazione) è preimpostato e non viene modificato automaticamente. Gli utenti devono selezionare un valore alfa adeguato in base alla loro conoscenza dei dati e degli esperimenti. Principio di Funzionamento di RidgeCV (Ridge Cross-Validation):

RidgeCV è un'estensione del metodo Ridge, che prevede la selezione automatica del valore ottimale per il parametro alfa utilizzando la convalida incrociata. Invece di impostare manualmente alfa, RidgeCV itera tra diversi valori alfa e sceglie quello che fornisce le migliori prestazioni nella convalida incrociata.

Vantaggi della regolazione automatica: Il vantaggio principale di RidgeCV è la determinazione automatica del valore alfa ottimale, senza bisogno di regolazioni manuali. Ciò rende più comodo il processo di regolazione e previene potenziali errori nella selezione di alfa. La differenza principale tra Ridge e RidgeCV è che Ridge richiede agli utenti di specificare esplicitamente il valore del parametro alfa, mentre RidgeCV trova automaticamente il valore alfa ottimale utilizzando la convalida incrociata. RidgeCV è in genere una scelta preferibile quando si ha a che fare con una grande quantità di dati e si vuole evitare la regolazione manuale dei parametri.







2.1.14. sklearn.linear_model.Ridge

Ridge è un metodo di regressione utilizzato nell'apprendimento automatico per risolvere problemi di regressione. Fa parte della famiglia dei modelli lineari e rappresenta una regressione lineare regolarizzata.



La caratteristica principale della regressione Ridge è l'aggiunta della regolarizzazione L2 al metodo dei minimi quadrati ordinari (OLS) standard.



Come funziona la regressione Ridge:



Regressione lineare: Simile alla regressione lineare normale, la regressione Ridge mira a trovare una relazione lineare tra le variabili indipendenti (caratteristiche) e la variabile target. Regolarizzazione L2: La distinzione principale della regressione Ridge è l'aggiunta della regolarizzazione L2 alla funzione di perdita. Ciò significa che alla somma delle differenze al quadrato tra i valori effettivi e quelli previsti viene aggiunta una penalizzazione per i grandi valori dei coefficienti di regressione. Coefficienti di penalizzazione: La regolarizzazione L2 impone una penalizzazione sui valori dei coefficienti di regressione. Di conseguenza, alcuni coefficienti tendono ad avvicinarsi a zero, riducendo l'overfitting e migliorando la stabilità del modello. Iperparametro α: Uno dei parametri essenziali della regressione Ridge è l'iperparametro α (alfa), che determina il grado di regolarizzazione. Valori α più alti portano a una regolarizzazione più forte, con conseguenti modelli più semplici e valori di coefficiente più bassi.

Vantaggi della regressione Ridge:



Riduzione dell'overfitting: La regolarizzazione L2 in Ridge aiuta a ridurre l'overfitting, rendendo il modello più robusto contro il rumore dei dati.

Gestione della multicollinearità: La regressione Ridge è in grado di gestire bene i problemi di multicollinearità, in particolare quando le caratteristiche sono altamente correlate.

Affrontare la maledizione della dimensionalità: Ridge è utile in scenari con molte caratteristiche, in cui OLS potrebbe essere instabile.

Limiti della regressione Ridge:



Non elimina le caratteristiche: La regressione Ridge non azzera i coefficienti delle caratteristiche, ma si limita a ridurli, il che significa che alcune caratteristiche potrebbero ancora rimanere nel modello.

Scelta dell'α ottimale: La selezione del valore corretto dell'iperparametro α può richiedere una convalida incrociata.

La regressione Ridge è un metodo di regressione che introduce la regolarizzazione L2 alla regressione lineare standard per ridurre l'overfitting, migliorare la stabilità e risolvere i problemi di multicollinearità. Questo metodo è utile quando è necessario bilanciare precisione e stabilità del modello.





2.1.14.1. Codice per creare il modello Ridge ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.Ridge, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza sia del modello originale che dei modelli esportati in ONNX.

# Ridge.py

# Il codice dimostra il processo di addestramento del modello Ridge, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Ridge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "Ridge"

onnx_model_filename = data_path + "ridge"



# creare un modello Ridge

regression_model = Ridge()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print( "Mean Absolute Error:" , mae_onnx_float)

print( "Mean Squared Error:" , mse_onnx_float)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python Ridge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python Python Ridge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382634837793 Python Mean Absolute Error: 6.347684915729416 Python Mean Squared Error: 49.77815046053819 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python Ridge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig.49. Risultati di Ridge.py (float ONNX)

2.1.14.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvatiridge_float.onnx e ridge_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Ridge" #define ONNXFilenameFloat "ridge_float.onnx" #define ONNXFilenameDouble "ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

Ridge (EURUSD,H1) Testing ONNX float : Ridge (ridge_float.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382634837793 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476849157294160 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781504605381784 Ridge (EURUSD,H1) Ridge (EURUSD,H1) Testing ONNX double : Ridge (ridge_double.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641178552 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476844629298235 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781420699652131

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : Ridge (ridge_float.onnx) Python Mean Absolute Error: 6.347684 462929819 MQL5: Mean Absolute Error: 6.347684 9157294160 Testing ONNX double : Ridge (ridge_double.onnx) Python Mean Absolute Error: 6.3476844629298 19 MQL5: Mean Absolute Error: 6.3476844629298 235

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 13 cifre decimali.







2.1.14.3. Rappresentazione ONNX di ridge_float.onnx e ridge_double.onnx





Fig.50. Rappresentazione ONNX di ridge_float.onnx in Netron













Fig.51. Rappresentazione ONNX di ridge_double.onnx in Netron









2.1.15. sklearn.linear_model.RidgeCV

RidgeCV - è un'estensione della regressione Ridge che include la selezione automatica del miglior iperparametro α (alfa), che determina il grado di regolarizzazione nella regressione Ridge. L'iperparametro α controlla l'equilibrio tra la minimizzazione della somma degli errori al quadrato (come nella regressione lineare ordinaria) e la minimizzazione del valore dei coefficienti di regressione (regolarizzazione). RidgeCV seleziona automaticamente il valore ottimale di α in base ai parametri e ai criteri specificati.



Come funziona RidgeCV:



Dati di input: RidgeCV prende in input dati costituiti da caratteristiche (variabili indipendenti) e dalla variabile target (continua). Scelta di α: La regressione Ridge richiede la selezione dell'iperparametro α, che determina il grado di regolarizzazione. RidgeCV seleziona automaticamente il valore ottimale di α dall'intervallo indicato. Convalida incrociata: RidgeCV utilizza la convalida incrociata, come la convalida incrociata k-fold, per valutare quale valore di α fornisce la migliore generalizzazione del modello su dati indipendenti. α ottimale: Al termine del processo di addestramento, RidgeCV sceglie il valore α che offre le migliori prestazioni nella convalida incrociata e lo utilizza per addestrare il modello finale di regressione Ridge.

Vantaggi di RidgeCV:



Selezione automatica di α: RidgeCV consente di selezionare automaticamente il valore ottimale dell'iperparametro α, semplificando il processo di regolazione del modello.

Equilibrio tra regolarizzazione e prestazioni: Questo metodo aiuta a trovare l'equilibrio ottimale tra regolarizzazione (riduzione dell'overfitting) e prestazioni del modello.

Limitazioni di RidgeCV:



Complessità computazionale: La convalida incrociata può richiedere notevoli risorse computazionali, soprattutto quando si utilizza un'ampia gamma di valori α.

RidgeCV è un metodo di regressione Ridge con selezione automatica dell'iperparametro ottimale α mediante convalida incrociata. Questo metodo semplifica il processo di selezione degli iperparametri e consente di trovare il miglior equilibrio tra regolarizzazione e prestazioni del modello.





2.1.15.1. Codice per la creazione del modello RidgeCV ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.RidgeCV, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# RidgeCV.py

# Il codice dimostra il processo di addestramento del modello RidgeCV, l'esportazione in formato ONNX (sia float che double) ed effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import RidgeCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RidgeCV"

onnx_model_filename = data_path + "ridge_cv"



# creare un modello RidgeCV

regression_model = RidgeCV()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print (f"{i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python RidgeCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python Python RidgeCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499108485 Python Mean Absolute Error: 6.3472036427935485 Python Mean Squared Error: 49.77833006785168 Python R^ 2 matching decimal places: 11 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python RidgeCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig.52. Risultati di RidgeCV.py (float ONNX)





2.1.15.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati ridge_cv_float.onnx e ridge_cv_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RidgeCV" #define ONNXFilenameFloat "ridge_cv_float.onnx" #define ONNXFilenameDouble "ridge_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

RidgeCV (EURUSD,H1) Testing ONNX float : RidgeCV (ridge_cv_float.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499108485 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472036427935485 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783300678516909 RidgeCV (EURUSD,H1) RidgeCV (EURUSD,H1) Testing ONNX double : RidgeCV (ridge_cv_double.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499160807 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472033499935216 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783299986157246

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : RidgeCV (ridge_cv_float.onnx) Python Mean Absolute Error: 6.347203 34999352 MQL5: Mean Absolute Error: 6.347203 6427935485 Testing ONNX double : RidgeCV (ridge_cv_double.onnx) Python Mean Absolute Error: 6.34720334999352 MQL5: Mean Absolute Error: 6.34720334999352 16

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.15.3. Rappresentazione ONNX di ridge_cv_float.onnx e ridge_cv_double.onnx









Fig.53. Rappresentazione ONNX di ridge_cv_float.onnx in Netron









Fig.54. Rappresentazione ONNX di ridge_cv_double.onnx in Netron







2.1.16. sklearn.linear_model.OrthogonalMatchingPursuit

OrthogonalMatchingPursuit (OMP) è un algoritmo utilizzato per risolvere problemi di selezione delle caratteristiche e di regressione lineare.



È uno dei metodi per selezionare le caratteristiche più significative, che possono essere utili a ridurre la dimensionalità dei dati e migliorare la capacità di generalizzazione del modello.



Come funziona OrthogonalMatchingPursuit:



Dati di input: Si parte da un set di dati contenente caratteristiche (variabili indipendenti) e valori della variabile target (continua). Selezione del numero di caratteristiche: Una delle fasi iniziali dell'utilizzo di OrthogonalMatchingPursuit consiste nel determinare il numero di caratteristiche da includere nel modello. Questo numero può essere predefinito o scelto con criteri quali Akaike Information Criterion (AIC) o il criterio dell'errore minimo. Aggiunta iterativa delle caratteristiche: L'algoritmo inizia con un modello vuoto e aggiunge iterativamente le caratteristiche che meglio spiegano i residui del modello. Ad ogni iterazione, viene scelta una nuova caratteristica ortogonale alle caratteristiche selezionate in precedenza. La caratteristica ottimale viene selezionata in base alla sua correlazione con i residui del modello. Addestramento del modello: Dopo aver aggiunto il numero specificato di caratteristiche, il modello viene addestrato sui dati considerando solo le caratteristiche selezionate. Effettuare previsioni: Dopo l'addestramento, il modello può prevedere i valori della variabile target su nuovi dati.

Vantaggi di OrthogonalMatchingPursuit:



Riduzione della dimensionalità: OMP può ridurre la dimensionalità dei dati selezionando solo le caratteristiche più informative.

Interpretabilità: Poiché OMP seleziona solo un numero ridotto di caratteristiche, i modelli creati con questo metodo possono essere più interpretabili.

Limitazioni di OrthogonalMatchingPursuit:



Sensibilità al numero di caratteristiche selezionate: Il numero di caratteristiche selezionate deve essere regolato in modo appropriato e scelte errate possono portare ad un overfitting o ad un underfitting.

Non considera la multicollinearità: L'OMP potrebbe non tenere conto della multicollinearità tra le caratteristiche, che potrebbe influire sulla selezione delle caratteristiche ottimali.

Complessità computazionale: OMP è computazionalmente costoso, soprattutto per i grandi set di dati.

OrthogonalMatchingPursuit è un algoritmo per la selezione delle caratteristiche e la regressione lineare, che consente di selezionare le caratteristiche più informative per il modello. Questo metodo può essere utile per ridurre la dimensionalità dei dati e migliorare l'interpretabilità dei modelli.





2.1.16.1. Codice per creare il modello OrthogonalMatchingPursuit ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.OrthogonalMatchingPursuit, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# OrthogonalMatchingPursuit.py

# Il codice dimostra il processo di addestramento del modello OrthogonalMatchingPursuit, l'esportazione in formato ONNX (sia float che double) e di effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str(value1)

str_value2 = str(value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import OrthogonalMatchingPursuit

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "OrthogonalMatchingPursuit"

onnx_model_filename = data_path + "orthogonal_matching_pursuit"



# creare un modello OrthogonalMatchingPursuit

regression_model = OrthogonalMatchingPursuit()



# Adattare il modello ai dati

regression_model.fit(X, y)



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python OrthogonalMatchingPursuit Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python Python OrthogonalMatchingPursuit ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python OrthogonalMatchingPursuit ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





Fig.55. Risultati di OrthogonalMatchingPursuit.py (float ONNX)



2.1.16.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati orthogonal_matching_pursuit_float.onnx e orthogonal_matching_pursuit_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "OrthogonalMatchingPursuit" #define ONNXFilenameFloat "orthogonal_matching_pursuit_float.onnx" #define ONNXFilenameDouble "orthogonal_matching_pursuit_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 OrthogonalMatchingPursuit (EURUSD,H1) OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364275 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) Python Mean Absolute Error: 6.347737 9263364275 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) Python Mean Absolute Error: 6.3477379263364275 MQL5: Mean Absolute Error: 6.3477379263364275

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 16 cifre decimali.





2.1.16.3. Rappresentazione ONNX di orthogonal_matching_pursuit_float.onnx e orthogonal_matching_pursuit_double.onnx









Fig.56. Rappresentazione ONNX del file orthogonal_matching_pursuit_float.onnx in Netron













Fig.57. Rappresentazione ONNX di orthogonal_matching_pursuit_double.onnx in Netron





2.1.17. sklearn.linear_model.PassiveAggressiveRegressor

PassiveAggressiveRegressor è un metodo di apprendimento automatico utilizzato per compiti di regressione.



Questo metodo è una variante dell'algoritmo Passive-Aggressive (PA) che può essere impiegato per addestrare un modello in grado di prevedere i valori continui della variabile target.



Come funziona PassiveAggressiveRegressor:



Dati di input: Si parte da un set di dati che comprende le caratteristiche (variabili indipendenti) e i valori della variabile target (continua). Apprendimento supervisionato: PassiveAggressiveRegressor è un metodo di apprendimento supervisionato addestrato su coppie (X, y), dove X rappresenta le caratteristiche e y corrisponde ai valori delle variabili target. Apprendimento adattivo: L'idea principale dietro il metodo passivo-aggressivo è l'approccio di apprendimento adattivo. Il modello apprende minimizzando l'errore di previsione ad ogni esempio di addestramento. Si aggiorna correggendo i pesi per ridurre l'errore di previsione. Parametro C: PassiveAggressiveRegressor ha un iperparametro C, che controlla quanto fortemente il modello si adatta agli errori. Un valore C più alto significa aggiornamenti del peso più aggressivi, mentre un valore C più basso rende il modello meno aggressivo. Previsione: Una volta addestrato, il modello può prevedere i valori della variabile target per i nuovi dati.

Vantaggi di PassiveAggressiveRegressor:



Adattabilità: Il metodo può adattarsi alle variazioni dei dati e aggiornare il modello per ridurre al minimo gli errori di previsione.

Efficienza per grandi set di dati: PassiveAggressiveRegressor può essere un metodo efficace per la regressione, in particolare quando addestrato su volumi consistenti di dati.

Limitazioni di PassiveAggressiveRegressor:



Sensibilità alla scelta del parametro C: La scelta del valore di C può richiedere una messa a punto e una sperimentazione.

Potrebbero essere necessarie altre caratteristiche: In alcuni casi, per un buon addestramento del modello, potrebbero essere necessarie ulteriori caratteristiche ingegnerizzate.

PassiveAggressiveRegressor è un metodo di apprendimento automatico per compiti di regressione che apprende in modo adattivo minimizzando gli errori di previsione sui dati di addestramento. Questo metodo può essere utile per gestire grandi set di dati e richiede la regolazione del parametro C per ottenere prestazioni ottimali.





2.1.17.1. Codice per la creazione del modello PassiveAggressiveRegressor e per la sua esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.PassiveAggressiveRegressor, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# PassiveAggressiveRegressor.py

# Il codice dimostra il processo di addestramento del modello PassiveAggressiveRegressor, l'esportazione in formato ONNX (sia float che double) e di effettuare previsioni con i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import PassiveAggressiveRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[ 0 ]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[0:last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "PassiveAggressiveRegressor"

onnx_model_filename = data_path + "passive_aggressive_regressor"



# creare un modello PassiveAggressiveRegressor

regression_model = PassiveAggressiveRegressor()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data' , marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red ', label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python PassiveAggressiveRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python Python PassiveAggressiveRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376801868329 Python Mean Absolute Error: 9.645248834431873 Python Mean Squared Error: 139.76862616640122 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 3 Python float ONNX model precision: 5 Python Python PassiveAggressiveRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





Fig.58. Risultati del file PassiveAggressiveRegressor.py (double ONNX)



2.1.17.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati passive_aggressive_regressor_float.onnx e passive_aggressive_regressor_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "PassiveAggressiveRegressor" #define ONNXFilenameFloat "passive_aggressive_regressor_float.onnx" #define ONNXFilenameDouble "passive_aggressive_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376801868329 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452488344318716 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7686261664012761 PassiveAggressiveRegressor (EURUSD,H1) PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376841493092 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452466950654419 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7685737319100667

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) Python Mean Absolute Error: 9.64524 669506544 MQL5: Mean Absolute Error: 9.64524 88344318716 Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) Python Mean Absolute Error: 9.64524669506544 MQL5: Mean Absolute Error: 9.64524669506544 19

Precisione di ONNX float MAE: 5 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.17.3. Rappresentazione ONNX di passive_aggressive_regressor_float.onnx e passive_aggressive_regressor_double.onnx









Fig.59. Rappresentazione ONNX di passive_aggressive_regressor_float.onnx in Netron













Fig.60. Rappresentazione ONNX di passive_aggressive_regressor_double.onnx in Netron







2.1.18. sklearn.linear_model.QuantileRegressor

QuantileRegressor è un metodo di apprendimento automatico utilizzato per stimare i quantili (percentili specifici) della variabile target nei compiti di regressione.



Invece di prevedere il valore medio della variabile target, come avviene tipicamente nei compiti di regressione, QuantileRegressor prevede i valori corrispondenti ai quantili specificati, come la mediana (50° percentile) o il 25° e 75° percentile.



Come funziona QuantileRegressor:



Dati di input: Si inizia con un set di dati contenente le caratteristiche (variabili indipendenti) e la variabile target (continua). Focus sui quantili: Invece di prevedere i valori esatti della variabile target, QuantileRegressor modella la distribuzione condizionale della variabile target e prevede i valori per determinati quantili di questa distribuzione. Addestramento per differenti quantili: L'addestramento di un modello QuantileRegressor comporta l'addestramento di modelli separati per ciascun quantile desiderato. Ciascuno di questi modelli prevede un valore corrispondente al suo quantile. Parametro quantile: Il parametro principale di questo metodo è la scelta dei quantili desiderati per i quali si vogliono ottenere le previsioni. Ad esempio, se avete bisogno di previsioni per la mediana, dovrete addestrare il modello sul 50° percentile. Previsione quantile: Dopo l'addestramento, il modello può essere utilizzato per prevedere i valori corrispondenti ai quantili specificati su nuovi dati.

Vantaggi di QuantileRegressor:



Flessibilità: QuantileRegressor offre flessibilità nella previsione di vari quantili, che può essere utile in compiti in cui sono importanti diversi percentili della distribuzione.

Robustezza ai valori anomali: Un approccio orientato ai quantili può essere robusto contro i valori anomali, poiché non considera la media, che può essere fortemente influenzata dai valori estremi.

Limitazioni di QuantileRegressor:



Necessità di selezione dei quantili: La scelta dei quantili ottimali potrebbe richiedere una certa conoscenza del lavoro.

Aumento della complessità computazionale: L'addestramento di modelli separati per i diversi quantili può aumentare la complessità computazionale del compito.

QuantileRegressor è un metodo di apprendimento automatico progettato per prevedere i valori corrispondenti ai quantili specificati della variabile target. Questo metodo può essere utile nelle attività che interessano i vari percentili della distribuzione e nei casi in cui i dati possono contenere valori anomali.





2.1.18.1. Codice per creare il modello QuantileRegressor ed esportarlo in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.QuantileRegressor, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# QuantileRegressor.py

# Il codice dimostra il processo di addestramento del modello QuantileRegressor, l'esportazione in formato ONNX (sia float che double) e di effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == -1 or dot_position2 == -1:

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import QuantileRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[0]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[ 0 :last_index]



# generare dati sintetici per la regressione

X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "QuantileRegressor"

onnx_model_filename = data_path + "quantile_regressor"



# creare un modello QuantileRegressor

regression_model = QuantileRegressor(solver= 'highs' )



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float) ")

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data' , marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=( 8 , 5 ))

# tracciare i dati originali e i dati della regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python QuantileRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python Python QuantileRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915739158818 Python Mean Absolute Error: 6.3693091422201125 Python Mean Squared Error: 53.042533910812814 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 7 Python MSE matching decimal places: 5 Python float ONNX model precision: 7 Python Python QuantileRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 13 Python double ONNX model precision: 16





Fig.61. Risultati di QuantileRegressor.py (float ONNX)





2.1.18.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati quantile_regressor_float.onnx e quantile_regressor_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "QuantileRegressor" #define ONNXFilenameFloat "quantile_regressor_float.onnx" #define ONNXFilenameDouble "quantile_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

QuantileRegressor (EURUSD,H1) Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915739158818 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091422201169 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425339108128071 QuantileRegressor (EURUSD,H1) QuantileRegressor (EURUSD,H1) Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915738839231 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091850025185 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425343337142721

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) Python Mean Absolute Error: 6.3693091 850025185 MQL5: Mean Absolute Error: 6.3693091 422201169 Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) Python Mean Absolute Error: 6.3693091850025185 MQL5: Mean Absolute Error: 6.3693091850025185

Precisione di ONNX float MAE: 7 cifre decimali, Precisione di ONNX double MAE: 16 cifre decimali.





2.1.18.3. Rappresentazione ONNX di quantile_regressor_float.onnx e di quantile_regressor_double.onnx









Fig.62. Rappresentazione ONNX di quantile_regressor_float.onnx in Netron





Fig.63. Rappresentazione ONNX di quantile_regressor_double.onnx in Netron







2.1.19. sklearn.linear_model.RANSACRegressor

RANSACRegressor è un metodo di apprendimento automatico utilizzato per risolvere problemi di regressione con il metodo RANSAC (Random Sample Consensus).



Il metodo RANSAC è progettato per gestire i dati contenenti valori anomali o imperfezioni, consentendo di ottenere un modello di regressione più robusto escludendo l'influenza dei valori anomali.



Come funziona RANSACRegressor:



Dati di input: Si inizia con un set di dati contenente le caratteristiche (variabili indipendenti) e la variabile target (continua). Selezione di sottogruppi casuali: RANSAC inizia scegliendo sottogruppi casuali di dati utilizzati per addestrare il modello di regressione. Questi sottogruppi sono chiamati "ipotesi". Adattamento del modello alle ipotesi: Per ogni ipotesi scelta, viene addestrato un modello di regressione. Nel caso di RANSACRegressor, di solito si utilizza la regressione lineare e il modello viene adattato al sottogruppo di dati. Valutazione dei valori anomali: Dopo l'addestramento del modello, viene valutato il suo adattamento a tutti i dati. Per ogni punto dati viene calcolato l'errore tra i valori previsti e quelli effettivi. Identificazione dei valori anomali: I punti dati con errori superiori a una determinata soglia sono considerati anomali. Questi valori anomali possono influenzare l'addestramento del modello e distorcere i risultati. Aggiornamento del modello: Tutti i punti dati non considerati anomali vengono utilizzati per aggiornare il modello di regressione. Questo processo può essere ripetuto più volte con diverse ipotesi casuali. Modello finale: Dopo diverse iterazioni, RANSACRegressor seleziona il miglior modello addestrato sul sottogruppo di dati e lo restituisce come modello di regressione finale.

Vantaggi di RANSACRegressor:



Robustezza ai valori anomali: RANSACRegressor è un metodo robusto contro i valori anomali, in quanto li esclude dall’addestramento.

Regressione robusta: Questo metodo consente di creare un modello di regressione più affidabile quando i dati contengono valori anomali o imperfezioni.

Limitazioni di RANSACRegressor:



Sensibilità alla soglia di errore: La scelta di una soglia di errore per determinare quali punti sono considerati anomali potrebbe richiedere una sperimentazione.

Complessità della selezione delle ipotesi: La scelta di buone ipotesi nella fase iniziale potrebbe non essere un compito semplice.

RANSACRegressor è un metodo di apprendimento automatico utilizzato per problemi di regressione basato sul metodo RANSAC. Questo metodo consente di creare un modello di regressione più robusto quando i dati contengono valori anomali o imperfezioni, escludendo la loro influenza sul modello.





2.1.19.1. Codice per la creazione del modello RANSACRegressor ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.RANSACRegressor, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza del modello originale e dei modelli esportati in ONNX.

# RANSACRegressor.py

# Il codice dimostra il processo di addestramento del modello RANSACRegressor, l'esportazione in formato ONNX (sia float che double) e di effettuare previsioni utilizzando i modelli ONNX.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# funzione per confrontare le cifre decimali corrispondenti

def compare_decimal_places (value1, value2):

# Convertire entrambi i valori in stringhe

str_value1 = str (value1)

str_value2 = str (value2)



# trovare le posizioni dei punti decimali nelle stringhe

dot_position1 = str_value1.find( "." )

dot_position2 = str_value2.find( "." )



# se uno dei valori non ha un punto decimale, restituire 0

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# calcolare il numero di cifre decimali

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# Trovare il minimo delle due cifre decimali contate

min_decimal_places = min(decimal_places1, decimal_places2)



# inizializzare un conteggio per le cifre decimali corrispondenti

matching_count = 0



# confrontare i caratteri dopo il punto decimale

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# importare le librerie necessarie

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import RANSACRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# definire il percorso per il salvataggio del modello

data_path = argv[0]

last_index = data_path.rfind( "\\" ) + 1

data_path = data_path[0:last_index]



# generare dati sintetici per la regressione

X = np.arange(0,100,1).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RANSACRegressor"

onnx_model_filename = data_path + "ransac_regressor"



# creare un modello RANSACRegressor

regression_model = RANSACRegressor()



# Adattare il modello ai dati

regression_model.fit(X, y.ravel())



# Prevedere i valori per l'intero set di dati

y_pred = regression_model.predict(X)



# valutare le prestazioni del modello

r2 = r2_score(y, y_pred)

mse = mean_squared_error(y, y_pred)

mae = mean_absolute_error(y, y_pred)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# Convertire in modello ONNX (float)

# definire il tipo di dati di input come FloatTensorType

initial_type_float = [( 'float_input' , FloatTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come FloatTensorType

initial_type_float = X.astype(np.float32)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_f loat)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "ONNX: MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# convertire in modello ONNX (double)

# definire il tipo di dati di input come DoubleTensorType

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# esportare il modello in formato ONNX

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# salvare il modello in un file

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# stampare il percorso del modello

print ( f"ONNX model saved to {onnx_filename} " )



# caricare il modello ONNX e fare previsioni

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# visualizzare le informazioni sui tensori di input in ONNX

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# visualizzare le informazioni sui tensori di output in ONNX

print ("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1}. Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# definire il tipo di dati di input come DoubleTensorType

initial_type_double = X.astype(np.float64)



# prevedere i valori per l'intero set di dati usando ONNX

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# calcolare e visualizzare gli errori per i modelli originale e ONNX

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# impostare le dimensioni della figura

plt.figure(figsize=(8, 5))

# tracciare i dati originali e la linea di regressione

plt.scatter(X, y, label= 'Original Data', marker= 'o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X' )

plt.ylabel( 'y' )

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

Output:

Python RANSACRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python RANSACRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python RANSACRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





Fig.64. Risultati di RANSACRegressor.py (float ONNX)





2.1.19.2. Codice MQL5 per l'esecuzione dei Modelli ONNX

Questo codice esegue i modelli salvati ransac_regressor_float.onnx e ransac_regressor_double.onnx e dimostra l'uso delle metriche di regressione in MQL5.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RANSACRegressor" #define ONNXFilenameFloat "ransac_regressor_float.onnx" #define ONNXFilenameDouble "ransac_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

Output:

RANSACRegressor (EURUSD,H1) Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 RANSACRegressor (EURUSD,H1) RANSACRegressor (EURUSD,H1) Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

Confronto con il modello originale a doppia precisione in Python:

Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

Precisione di ONNX float MAE: 6 cifre decimali, Precisione di ONNX double MAE: 14 cifre decimali.





2.1.19.3. Rappresentazione ONNX di ransac_regressor_float.onnx e ransac_regressor_double.onnx









Fig.65. Rappresentazione ONNX di ransac_regressor_float.onnx in Netron





Fig.66. Rappresentazione ONNX di ransac_regressor_double.onnx in Netron











2.1.20. sklearn.linear_model.TheilSenRegressor

La regressioneTheil-Sen (stimatore Theil-Sen) è un metodo di stima della regressione utilizzato per approssimare le relazioni lineari tra le variabili indipendenti e la variabile target.



Offre una stima più robusta rispetto alla regressione lineare ordinaria in presenza di valori anomali e rumore nei dati.



Come funziona la regressione Theil-Sen:



Selezione dei punti: Inizialmente, Theil-Sen seleziona coppie casuali di punti nei dati del dataset di addestramento. Calcolo della pendenza: Per ogni coppia di punti di dati, il metodo calcola la pendenza della retta che passa per questi punti, creando un insieme di pendenze. Pendenza media: Quindi, il metodo trova la pendenza media dall'insieme delle pendenze. Questa pendenza media viene utilizzata come stima della pendenza della regressione lineare. Deviazioni medie: Per ogni punto di dati, il metodo calcola la deviazione (differenza tra il valore effettivo e il valore previsto in base alla pendenza media) e trova la media di queste deviazioni. In questo modo si ottiene una stima del coefficiente dell'intercetta della regressione lineare. Stima finale: Le stime finali dei coefficienti di pendenza e di intercetta vengono utilizzate per costruire il modello di regressione lineare.

Vantaggi della regressione Theil-Sen:



Resilienza dei valori anomali: La regressione Theil-Sen è più robusta contro i valori anomali e il rumore dei dati rispetto alla normale regressione lineare.

Assunzioni meno rigide: Il metodo non richiede ipotesi rigorose sulla distribuzione dei dati o sulla forma di dipendenza, rendendolo più versatile.

Adatto a dati multicollineari: La regressione Theil-Sen funziona bene con dati in cui le variabili indipendenti sono altamente correlate (problema di multicollinearità).

Limiti della regressione Theil-Sen:



Complessità computazionale: Il calcolo delle pendenze medie per tutte le coppie di punti di dati potrebbe richiedere molto tempo, soprattutto per i set di dati di grandi dimensioni.

Stima del coefficiente dell'intercetta: Le deviazioni medie sono utilizzate per stimare il coefficiente di intercetta, che può portare a distorsioni in presenza di valori anomali.

La regressione Theil-Sen è un metodo di stima per la regressione che fornisce una valutazione stabile della relazione lineare tra le variabili indipendenti e la variabile target, in particolare in presenza di valori anomali e rumore dei dati. Questo metodo è utile quando è necessaria una stima stabile in condizioni di dati reali.





2.1.20.1. Codice per la creazione di TheilSenRegressor ed esportazione in ONNX per float e double

Questo codice crea il modello sklearn.linear_model.TheilSenRegressor, lo addestra su dati sintetici, salva il modello nel formato ONNX ed esegue previsioni utilizzando dati di input sia float che double. Inoltre, valuta l'accuratezza sia del modello originale che dei modelli esportati in ONNX.