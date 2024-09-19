ONNX(오픈 신경망 교환)은 머신러닝 모델을 설명하고 교환하기 위한 형식으로서 서로 다른 머신러닝 프레임워크 간에 모델을 전송할 수 있는 기능을 제공합니다. 딥 러닝과 신경망에서는 float32와 같은 데이터 유형이 자주 사용됩니다. 일반적으로 딥러닝 모델 학습에 적합한 정확도와 효율성을 제공하기 때문에 널리 적용됩니다.



일부 고전적인 머신러닝 모델은 ONNX 연산자로 표현하기 어렵습니다. 따라서 ONNX에서 이를 구현하기 위해 연산자 (ai.onnx.ml)가 추가로 도입되었습니다. ONNX 사양에 따르면 이 집합의 키 연산자 )는 다양한 유형의 입력 데이터(tensor(float), tensor(double), tensor(int64), tensor(int32))를 받을 수 있지만 항상 출력시에는 tensor(float) 유형을 반환한다는 점에 주목할 필요가 있습니다. 이러한 연산자를 매개변수화 할때도 부동 소수점 수를 사용하여 수행 되므로 특히 원래 모델의 매개변수를 정의하는 데 배정밀도 수를 사용한 경우 계산의 정확도가 제한될 수 있습니다.

이로 인해 ONNX에서 데이터를 변환하고 처리하는 과정에서 모델을 변환하거나 다른 데이터 유형을 사용할 때 정확도가 떨어질 수 있습니다. 나중에 살펴보겠지만 일부 모델은 이러한 제한을 우회하고 ONNX 모델의 완전한 휴대성을 보장하여 정확도를 잃지 않고 이중 정밀도로 작업할 수 있습니다. 특히 데이터 표현의 정확성이 중요한 경우에는 ONNX에서 모델과 그 표현으로 작업할 때 이러한 특성을 고려하는 것이 중요합니다.

Scikit-learn은 파이썬 커뮤니티에서 가장 인기 있고 널리 사용되는 머신 러닝 라이브러리 중 하나이며 다양한 알고리즘, 사용자 친화적인 인터페이스, 훌륭한 설명서를 제공합니다. 이전 문서인 "Scikit-learn 라이브러리의 분류 모델 및 ONNX로 내보내기"는 분류 모델에 대해 다루었습니다.

이 글에서 우리는 Scikit-learn 패키지의 회귀 모델의 적용에 대해 살펴보고 테스트 데이터 세트에 대해 배정밀도로 파라미터를 계산하고 이를 부동 소수점 및 배정밀도를 위한 ONNX 형식으로 변환하고 이렇게 얻은 모델을 MQL5의 프로그램에서 사용하는 방법에 대해 알아볼 것입니다. 또한 부동 소수점 및 배정밀도 정확도에 대해 원본 모델과 ONNX 버전의 정확도를 비교합니다. 또한 회귀 모델의 내부 구조와 작동을 더 잘 이해할 수 있도록 회귀 모델의 ONNX 표현을 살펴볼 것입니다.





내용





귀찮으시다면 기고해 주세요.

런타임 개발자 포럼에서 사용자 중 한 명이 "[ONNXRuntimeError] 오류를 보고했습니다: 9 : NOT_IMPLEMENTED : ONNX 런타임을 통해 모델을 실행할 때 'LinearRegressor:LinearRegressor(1)' 노드에 대한 구현을 찾을 수 없습니다.



안녕하세요 선형 회귀 모델을 추론하려고 할 때 이 오류가 발생합니다. 이 문제를 해결하도록 도와주세요.





"NOT_IMPLEMENTED : ONNX 런타임 개발자 포럼에서 "노드 LinearRegressor:LinearRegressor(1)"에 대한 구현을 찾을 수 없습니다 라는 에러.



개발자의 답변:



float64가 아닌 float32에 대해서만 구현했기 때문입니다. 하지만 귀하의 모델에는 float64가 필요합니다.



참조:

hgithub.com/microsoft/onnxruntime/blob/master/onnxruntime/core/providers/cpu/ml/linearregressor.cc#L16https://github.com/microsoft/onnxruntime/blob/master/onnxruntime/core/providers/cpu/ml/linearregressor.cc#L16



귀찮으시다면 기고해 주세요.



사용자의 ONNX 모델에서 연산자는 double(float64) 데이터 유형으로 호출되며 ONNX 런타임이 배정밀도 LinearRegressor() 연산자를 지원하지 않기 때문에 오류 메시지가 발생합니다.



연산자의 사양에 따르면 double 입력 데이터 유형(T: tensor(float), tensor(double), tensor(int64), tensor(int32)이 가능하지만 개발자는 의도적으로 이를 구현하지 않기로 결정했습니다.



그 이유는 출력에 항상 Y: tensor(float) 값이 반환되기 때문입니다. 또한 계산 매개변수는 실수입니다(계수: 실수 목록, 인터셉트: 실수 목록).



따라서 계산이 배정밀도로 수행될 때 이 연산자는 정밀도를 부동 소수점으로 감소시키므로 배정밀도 계산에서 필요할지 의심스럽습니다.











ai.onnx.ml.LinearRegressor 연산자 설명



따라서 매개변수 및 출력 값의 정밀도를 float으로 낮추면 double(float64) 수로 완전히 작동할 수 없게 됩니다. 아마도 이러한 이유로 ONNX 런타임 개발자는 double 유형에 대한 구현을 자제하기로 결정했을 것입니다.



'double 지원 추가' 메서드는 개발자가 코드 주석(노란색으로 강조 표시)을 통해 시연했습니다.

ONNX 런타임에서는 LinearRegressor 클래스(https://github.com/microsoft/onnxruntime/blob/main/onnxruntime/core/providers/cpu/ml/linearregressor.h)를 사용하여 계산을 수행합니다.

연산자의 매개변수인 coefficients_ 및 intercepts_는 std::vector<float>로 저장됩니다:



#pragma once #include "core/common/common.h" #include "core/framework/op_kernel.h" #include "core/util/math_cpuonly.h" #include "ml_common.h" namespace onnxruntime { namespace ml { class LinearRegressor final : public OpKernel { public : LinearRegressor( const OpKernelInfo& info); Status Compute(OpKernelContext* context) const override ; private : int64_t num_targets_; std:: vector < float > coefficients_; std:: vector < float > intercepts_; bool use_intercepts_; POST_EVAL_TRANSFORM post_transform_; }; } }

#include "core/providers/cpu/ml/linearregressor.h" #include "core/common/narrow.h" #include "core/providers/cpu/math/gemm.h" namespace onnxruntime { namespace ml { ONNX_CPU_OPERATOR_ML_KERNEL( LinearRegressor, 1 , KernelDefBuilder().TypeConstraint( "T" , DataTypeImpl::GetTensorType< float >()), LinearRegressor); LinearRegressor::LinearRegressor( const OpKernelInfo& info) : OpKernel(info), intercepts_(info.GetAttrsOrDefault< float >( "intercepts" )), post_transform_(MakeTransform(info.GetAttrOrDefault<std:: string >( "post_transform" , "NONE" ))) { ORT_ENFORCE(info.GetAttr<int64_t>( "targets" , &num_targets_).IsOK()); ORT_ENFORCE(info.GetAttrs< float >( "coefficients" , coefficients_).IsOK()); use_intercepts_ = intercepts_.size() == static_cast<size_t>(num_targets_); } template < typename T> static Status ComputeImpl( const Tensor& input , ptrdiff_t num_batches, ptrdiff_t num_features, ptrdiff_t num_targets, const std:: vector < float >& coefficients, const std:: vector < float >* intercepts, Tensor& output, POST_EVAL_TRANSFORM post_transform, concurrency::ThreadPool* threadpool) { const T* input_data = input .Data<T>(); T* output_data = output.MutableData<T>(); if (intercepts != nullptr) { TensorShape intercepts_shape({num_targets}); onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, intercepts->data(), &intercepts_shape, output_data, threadpool); } else { onnxruntime::Gemm<T>::ComputeGemm(CBLAS_TRANSPOSE::CblasNoTrans, CBLAS_TRANSPOSE::CblasTrans, num_batches, num_targets, num_features, 1 .f, input_data, coefficients.data(), 1 .f, nullptr, nullptr, output_data, threadpool); } if (post_transform != POST_EVAL_TRANSFORM::NONE) { ml::batched_update_scores_inplace(gsl::make_span(output_data, SafeInt<size_t>(num_batches) * num_targets), num_batches, num_targets, post_transform, - 1 , false , threadpool); } return Status::OK(); } Status LinearRegressor::Compute(OpKernelContext* ctx) const { Status status = Status::OK(); const auto& X = *ctx->Input<Tensor>( 0 ); const auto& input_shape = X.Shape(); if (input_shape.NumDimensions() > 2 ) { return ORT_MAKE_STATUS(ONNXRUNTIME, INVALID_ARGUMENT, "Input shape had more than 2 dimension. Dims=" , input_shape.NumDimensions()); } ptrdiff_t num_batches = input_shape.NumDimensions() <= 1 ? 1 : narrow<ptrdiff_t>(input_shape[ 0 ]); ptrdiff_t num_features = input_shape.NumDimensions() <= 1 ? narrow<ptrdiff_t>(input_shape.Size()) : narrow<ptrdiff_t>(input_shape[ 1 ]); Tensor& Y = *ctx->Output( 0 , {num_batches, num_targets_}); concurrency::ThreadPool* tp = ctx->GetOperatorThreadPool(); auto element_type = X.GetElementType(); switch (element_type) { case ONNX_NAMESPACE::TensorProto_DataType_FLOAT: { status = ComputeImpl< float >(X, num_batches, num_features, narrow<ptrdiff_t>(num_targets_), coefficients_, use_intercepts_ ? &intercepts_ : nullptr, Y, post_transform_, tp); break ; } case ONNX_NAMESPACE::TensorProto_DataType_DOUBLE: { } default : status = ORT_MAKE_STATUS(ONNXRUNTIME, FAIL, "Unsupported data type of " , element_type); } return status; } } }

LinearRegressor 연산자 구현 ( https://github.com/microsoft/onnxruntime/blob/main/onnxruntime/core/providers/cpu/ml/linearregressor.cc

입력 값으로 double 숫자를 사용하고 float 매개 변수로 연산자의 계산을 수행하는 옵션이 있다는 것이 밝혀졌습니다. 또 다른 가능성은 입력 데이터의 정밀도를 float으로 낮추는 것입니다. 그러나 이러한 옵션 중 어느 것도 적절한 솔루션으로 간주될 수 없습니다.



ai.onnx.ml.LinearRegressor 연산자의 사양은 매개변수와 출력 값이 float 유형으로 제한되어 있기 때문에 double 숫자로 전체 연산을 할 수 있는 기능이 제한되어 있습니다.

다른 ONNX ML 운영업체에서도 비슷한 상황이 발생합니다. ai.onnx.ml.SVMRegressor 및 ai.onnx.ml.TreeEnsembleRegressor 등

그 결과 배정밀도의 ONNX 모델 실행을 사용하는 모든 개발자는 이와 같은 사양의 한계에 직면하게 됩니다. 해결책은 ONNX 사양을 확장하는 것(또는 매개변수와 출력값이 두 배인 LinearRegressor64, SVMRegressor64, TreeEnsembleRegressor64와 같은 유사한 연산자를 추가하는 것)이 될 것입니다. 하지만 현재 이 문제는 아직 해결되지 않은 상태입니다.



ONNX 변환기에 따라 많은 것이 달라지게 됩니다. double로 계산되는 모델의 경우 이러한 연산자를 사용하지 않는 것이 바람직할 수 있습니다(항상 가능한 것은 아니지만). 이 경우에는 ONNX로 변환기가 사용자의 모델에서 최적으로 작동하지 않았습니다.

나중에 살펴보겠지만 sklearn-onnx 변환기는 LinearRegressor의 제한을 우회하여 ONNX double 모델의 경우 ONNX 연산자 MatMul() 및 Add() 를 대신 사용합니다. 이 메서드 덕분에 Scikit-learn 라이브러리의 수많은 회귀 모델이 원래 double 모델의 정확성을 유지하면서 double로 계산된 ONNX 모델로 성공적으로 변환됩니다.







1. 테스트 데이터 세트



예제를 실행하려면 파이썬(3.10.8 버전 사용), 추가 라이브러리(pip install -U scikit-learn numpy matplotlib onnx onnxruntime skl2onnx)를 설치하고 메타에디터의 메뉴(도구->옵션->컴파일러->파이썬)에서 파이썬의 경로를 지정해야 합니다.



테스트 데이터셋으로는 y = 4X + 10sin(X*0.5) 함수로 생성된 값을 사용하겠습니다.

이러한 함수의 그래프를 표시하려면 메타에디터를 열고 RegressionData.py라는 파일을 만든 다음 스크립트 텍스트를 복사하고 "컴파일" 버튼을 클릭하여 실행합니다.



테스트 데이터 집합을 표시하는 스크립트

# RegressionData.py # The code plots the synthetic data, used for all regression models # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # import necessary libraries import numpy as np import matplotlib.pyplot as plt # generate synthetic data for regression X = np.arange( 0 , 100 , 1 ).reshape(- 1 , 1 ) y = 4 *X + 10 *np.sin(X* 0.5 ) # set the figure size plt.figure(figsize=( 8 , 5 )) # plot the initial data for regression plt.scatter(X, y, label= 'Regression Data' , marker= 'o' ) plt.xlabel( 'X' ) plt.ylabel( 'y' ) plt.legend() plt.title( 'Regression data' ) plt.show()

결과적으로 함수 그래프가 표시되며 우리는 이를 사용하여 회귀 메서드를 테스트할 것입니다.







그림 1. 회귀 모델 테스트용 함수







2. 회귀 모델



회귀 작업을 하는 목표는 새로운 데이터의 수치 값을 예측하기 위해 피처와 대상 변수 간의 관계를 가장 잘 설명하는 수학적 함수 또는 모델을 찾는 것입니다. 이를 통해 우리는 예측을 하고 솔루션을 최적화하고 데이터를 기반으로 정보에 입각한 의사 결정을 내릴 수 있습니다.

이제 scikit-learn 패키지의 주요 회귀 모델에 대해 살펴보도록 하겠습니다.

2.0. Scikit-learn 회귀 모델 목록

사용 가능한 scikit-learn 회귀 모델 목록을 표시하려면 스크립트를 사용하면 됩니다:

# ScikitLearnRegressors.py # The script lists all the regression algorithms available inb scikit-learn # Copyright 2023, MetaQuotes Ltd. # https://mql5.com # print Python version from platform import python_version print ( "The Python version is " , python_version()) # print scikit-learn version import sklearn print ( 'The scikit-learn version is {}.' .format(sklearn.__version__)) # print scikit-learn regression models from sklearn.utils import all_estimators regressors = all_estimators(type_filter= 'regressor' ) for index, (name, RegressorClass) in enumerate(regressors, start= 1 ): print (f "Regressor {index}: {name}" )

출력:

Python 버전은 3.10.8입니다.

scikit-learn 버전은 1.3.2입니다.

Regressor 1: ARDRegression

Regressor 2: AdaBoostRegressor

Regressor 3: BaggingRegressor

Regressor 4: BayesianRidge

Regressor 5: CCA

Regressor 6: DecisionTreeRegressor

Regressor 7: DummyRegressor

Regressor 8: ElasticNet

Regressor 9: ElasticNetCV

Regressor 10: ExtraTreeRegressor

Regressor 11: ExtraTreesRegressor

Regressor 12: GammaRegressor

Regressor 13: GaussianProcessRegressor

Regressor 14: GradientBoostingRegressor

Regressor 15: HistGradientBoostingRegressor

Regressor 16: HuberRegressor

Regressor 17: IsotonicRegression

Regressor 18: KNeighborsRegressor

Regressor 19: KernelRidge

Regressor 20: Lars

Regressor 21: LarsCV

Regressor 22: Lasso

Regressor 23: LassoCV

Regressor 24: LassoLars

Regressor 25: LassoLarsCV

Regressor 26: LassoLarsIC

Regressor 27: LinearRegression

Regressor 28: LinearSVR

Regressor 29: MLPRegressor

Regressor 30: MultiOutputRegressor

Regressor 31: MultiTaskElasticNet

Regressor 32: MultiTaskElasticNetCV

Regressor 33: MultiTaskLasso

Regressor 34: MultiTaskLassoCV

Regressor 35: NuSVR

Regressor 36: OrthogonalMatchingPursuit

Regressor 37: OrthogonalMatchingPursuitCV

Regressor 38: PLSCanonical

Regressor 39: PLSRegression

Regressor 40: PassiveAggressiveRegressor

Regressor 41: PoissonRegressor

Regressor 42: QuantileRegressor

Regressor 43: RANSACRegressor

Regressor 44: RadiusNeighborsRegressor

Regressor 45: RandomForestRegressor

Regressor 46: RegressorChain

Regressor 47: Ridge

Regressor 48: RidgeCV

Regressor 49: SGDRegressor

Regressor 50: SVR

Regressor 51: StackingRegressor

Regressor 52: TheilSenRegressor

Regressor 53: TransformedTargetRegressor

Regressor 54: TweedieRegressor

Regressor 55: VotingRegressor



이 회귀 변수 목록의 편의성을 위해 회귀 ㅂㄴ수들은 다른 색상으로 강조 표시되어 있습니다. 기본 회귀 모델이 필요한 모델은 회색으로 강조 표시되고 다른 모델은 독립적으로 사용할 수 있습니다. ONNX 형식으로 성공적으로 내보낸 모델은 녹색으로 표시되고 현재 버전의 scikit-learn 1.2.2에서 변환하는 동안 오류가 발생한 모델은 빨간색으로 표시됩니다. 테스트 작업에 적합하지 않은 메서드는 파란색으로 강조 표시됩니다.

회귀 품질 분석은 실제 값과 예측 값의 함수인 회귀 메트릭을 사용합니다. MQL5 언어에서는 "회귀 메트릭을 사용하여 ONNX 모델 평가하기"라는 문서에 자세히 설명된 여러 가지 메트릭을 사용할 수 있습니다.



이 글에서는 세 가지 메트릭을 사용하여 서로 다른 모델의 품질을 비교합니다:

결정 계수 R-제곱(R2); 평균 절대 오류(MAE); 평균 제곱 오차(MSE).





2.1. ONNX 모델 float 및 double로 변환하는 Scikit 학습 회귀 모델

이 섹션에서는 부동 소수점 및 배정밀도 모두에서 ONNX 형식으로 성공적으로 변환된 회귀 모델을 소개합니다.

이후 다룰 회귀 모델은 다음의 형식입니다:



모델 설명, 작동 원리, 장점 및 제한 사항 모델을 생성하고 float 및 double 형식의 ONNX 파일로 내보내고 파이썬의 ONNX 런타임을 사용하여 얻은 모델을 실행하기 위한 파이썬 스크립트입니다. sklearn.metrics를 사용하여 계산된 R^2, MAE, MSE와 같은 메트릭은 원본 및 ONNX 모델의 품질을 평가하는 데 사용됩니다.

ONNX 런타임을 통해 ONNX 모델(float 및 double)을 실행하기 위한 MQL5 스크립트로, RegressionMetric()을 사용하여 메트릭을 계산합니다.

부동 소수점 및 배정밀도용 Netron의 ONNX 모델 표현.





2.1.1. sklearn.linear_model.ARDRegression

ARDRegression (자동 관련성 결정 회귀)는 모델 학습 과정에서 피처의 중요도(관련성)를 자동으로 결정하고 가중치를 설정하면서 회귀 문제를 해결하기 위해 고안된 회귀 메서드입니다.



ARDRegression을 사용하면 회귀 모델을 구축하는 데 가장 중요한 변수만 감지하고 사용할 수 있으므로 많은 변수를 다룰 때 유용할 수 있습니다.



ARDRegression의 작동 원리:



선형 회귀: ARDRegression은 독립 변수(피처)와 대상 변수 간의 선형 관계를 가정하는 선형 회귀를 기반으로 합니다. 자동 피처 중요도 결정: ARDRegression의 주요 피처는 대상 변수를 예측하는 데 가장 중요한 변수를 자동으로 결정한다는 점입니다. 이는 가중치에 사전 분포(정규화)를 도입하여 모델이 중요도가 낮은 변수에 대해 자동으로 0이란 가중치를 설정하도록 함으로써 달성할 수 있습니다. 사후 확률 추정: ARDRegression은 각 변수에 대한 사후 확률을 계산하여 그 중요성을 결정할 수 있습니다. 사후 확률이 높은 변수는 관련성이 높은 것으로 간주되어 0이 아닌 가중치를 받고 사후 확률이 낮은 변수는 0의 가중치를 받습니다. 차원 감소: 따라서 ARDRegression는 중요하지 않은 변수를 제거하여 데이터 차원을 줄일 수 있습니다.

ARDRegression의 장점:



중요한 변수의 자동 결정: 이 메서드는 가장 중요한 메서드만 자동으로 식별하여 사용하므로 잠재적으로 모델의 성능을 향상시키고 과적합 되는 위험을 줄일 수 있습니다.

다중 선형성에 대한 복원력: ARDRegression은 변수의 상관관계가 높은 경우에도 다중 공선형성을 잘 처리합니다.

ARDRegression의 한계:



사전 배포를 선택해야 합니다: 적절한 사전 배포를 선택하려면 실험이 필요할 수 있습니다.

계산의 복잡성: 특히 대규모 데이터 세트의 경우 ARDRegression 훈련은 계산 비용이 많이 들 수 있습니다.

ARDRegression은 자동으로 변수의 중요도를 결정하고 사후 확률을 기반으로 가중치를 설정하는 회귀 메서드입니다. 이 메서드는 회귀 모델을 구축할 때 중요한 변수만 고려해야 할 때와 데이터 차원을 줄여야 할 때 유용합니다.







2.1.1.1. ARDRegression 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드



이 코드는 sklearn.linear_model.ARDRegression 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 float 및 double 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.



# ARDRegression.py

# 이 코드는 ARDRegressor 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

만약 dot_position1 == - -1 또는 dot_position2 == - -1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min (decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ARDRegression

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name= "ARDRegression"

onnx_model_filename = data_path + "ard_regression"



# ARDRegression 모델 만들기

regression_model = ARDRegression()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "평균 제곱 오차:", mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print (f "ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)



print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: ",compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f "ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f"{ i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)



print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

이 스크립트는 sklearn.linear_model.ARDRegression 모델을 생성하고 학습한 다음(원래 모델은 double로 간주됨), float 및 double용 ONNX로 모델을 내보내고(ard_regression_float.onnx 및 ard_regression_double.onnx) 그 연산 정확도를 비교합니다.



또한 float 및 double에 대한 ONNX 모델의 결과를 시각적으로 평가할 수 있도록 ARDRegression_plot_float.png 및 ARDRegression_plot_double.png 파일을 생성합니다(그림 2-3).





그림 2. ARDRegression.py의 결과(float)









그림 3. ARDRegression.py의 결과(double)



시각적으로 float 및 double용ONNX 모델은 동일하게 보입니다(그림 2-3), 자세한 정보는 저널 탭에서 확인할 수 있습니다:

Python ARDRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python Python ARDRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568 283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python ARDRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ard_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891289 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

이 예제에서는 원본 모델을 double로 고려한 다음 각각 float 및 double에 대해 ONNX 모델 ard_regression_float.onnx 및 ard_regression_double.onnx로 내보냈습니다.



모델의 정확도를 평균 절대 오차(MAE)로 평가할 경우 float용 ONNX 모델의 정확도는 소수점 이하 6자리까지 double을 사용한 ONNX 모델은 소수점 이하 15자리까지 정확도를 유지하여 원래 모델의 정밀도와 비슷하게 유지되는 것으로 나타났습니다.



ONNX 모델의 속성은 MetaEditor에서 볼 수 있습니다(그림 4-5).









그림 4. MetaEditor의 ard_regression_float.onnx ONNX 모델







그림 5. MetaEditor의 ard_regression_double.onnx ONNX 모델





실수형과 이중 ONNX 모델을 비교하면 이 경우 ARDRegression을 위한 ONNX 모델의 계산이 다르게 수행된다는 것을 알 수 있습니다. 실수형에는 ONNX-ML의 LinearRegressor() 연산자가 사용되는 반면 이중 숫자에는 ONNX 연산자 , Add()와 Reshape() 가 사용됩니다.

ONNX에서 모델을 구현하는 것은 변환기에 따라 다릅니다; ONNX로 내보내기 예제에서는 skl2onnx 라이브러리의 skl2onnx.convert_sklearn() 함수가 사용됩니다.







2.1.1.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 ard_regression_float.onnx 및 ard_regression_double.onnx ONNX 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ARDRegression" #define ONNXFilenameFloat "ard_regression_float.onnx" #define ONNXFilenameDouble "ard_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

ARDRegression (EURUSD,H1) Testing ONNX float : ARDRegression (ard_regression_float.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 ARDRegression (EURUSD,H1) ARDRegression (EURUSD,H1) Testing ONNX double : ARDRegression (ard_regression_double.onnx) ARDRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 ARDRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537597 ARDRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128795

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : ARDRegression (ard_regression_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : ARDRegression (ard_regression_double.onnx) Python Mean Absolute Error: 6.34756801285375 8 MQL5: Mean Absolute Error: 6.34756801285375 97

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.







2.1.1.3. 모델 ard_regression_float.onnx 및 ard_regression_double.onnx의 ONNX 표현은 다음과 같습니다.



Netron (웹 버전)은 모델을 시각화하고 계산 그래프를 분석하는 도구로, ONNX(Open Neural Network Exchange) 형식의 모델에 사용할 수 있습니다.



Netron은 모델 그래프와 그 아키텍처를 명확하고 인터랙티브한 형태로 표시하여 ONNX를 사용하여 만든 모델을 포함한 딥 러닝 모델의 구조와 매개변수를 탐색할 수 있습니다.



Netron의 주요 기능은 다음과 같습니다:



그래프 시각화: Netron은 모델의 아키텍처를 그래프로 표시하여 여러분이 레이어, 작업 및 이들 간의 연결을 확인할 수 있게 합니다. 여러분은 모델 내의 구조와 데이터 흐름을 쉽게 이해할 수 있을 것입니다.

대화형 탐색: 그래프에서 노드를 선택하여 각 연산자 및 해당 매개변수에 대한 추가 정보를 얻을 수 있습니다.

다양한 형식 지원: 네트론은 ONNX, 텐서플로우, 파이토치, 코어ML 등 다양한 딥러닝 모델 형식을 지원합니다.

매개변수 분석 기능: 모델의 매개변수와 가중치를 볼 수 있어 모델의 여러 부분에서 사용된 값을 이해하는 데 유용합니다.

Netron은 모델의 시각화 및 분석을 단순화하는 것을 통해 복잡한 신경망의 이해와 디버깅을 도와줍니다. 이는 머신러닝 및 딥러닝 분야의 개발자와 연구자들에게 도움이 되는 기능입니다.

이 도구를 사용하면 모델을 빠르게 검사하고 구조와 매개변수를 탐색하여 심층 신경망 작업을 쉽게 수행될 수 있도록 합니다.



네트론에 대한 자세한 내용은 관련 문서를 참조하세요: Netron을 사용한 신경망 및 Netron을 사용한 Keras 신경망.



Netron 관련 동영상::















ard_regression_float.onnx 모델은 그림 6에 나와 있습니다:

그림 6. 네트론의 ard_regression_float.onnx 모델에 대한 ONNX 표현

ai.onnx.ml LinearRegressor() ONNX 연산자는 ONNX 표준의 일부로 회귀 작업에 대한 모델을 설명합니다. 이 연산자는 입력 피처를 기반으로 숫자(연속형) 값을 예측하는 회귀에 사용됩니다.

가중치, 바이어스 등 모델 파라미터와 입력 피처를 입력으로 받아 선형 회귀를 실행합니다. 선형 회귀는 각 입력 피처에 대한 매개변수(가중치)를 추정하고 이러한 피처와 가중치의 선형 조합을 수행하여 예측을 생성합니다.

이 오퍼레이터는 다음 단계를 수행합니다:

입력 피처와 함께 모델의 가중치 및 편향성을 가져옵니다. 입력 데이터의 각 예에 대해 해당 피처와 가중치의 선형 조합을 수행합니다. 결과 값에 바이어스를 추가합니다. 그 결과 회귀 작업에서 대상 변수를 예측할 수 있습니다. LinearRegressor() 매개변수는 그림 7에 나와 있습니다.



그림 7. 네트론에서 ard_regression_float.onnx 모델의 LinearRegressor() 연산자 속성

ard_regression_double.onnx ONNX 모델은 그림 8에 나와 있습니다: ONNX 모델은 그림 8에 나와 있습니다:

그림 8. 네트론에서 ard_regression_double.onnx 모델에 대한 ONNX 표현

MatMul(), Add()와 , titlehttps://github.com/onnx/onnx/blob/main/docs/Operators.md#ReshapetitleReshape() ONNX 연산자의 매개변수는 그림 9-11에 나와 있습니다.

그림 9. 네트론의 ard_regression_double.onnx 모델에서 MatMul 연산자의 속성

MatMul (행렬 곱셈) ONNX 연산자는 두 행렬의 곱셈을 수행하며

두 개의 입력, 즉 두 개의 행렬을 받아 행렬의 곱을 반환합니다. 만약 두 행렬 A와 B가 있는 경우 Matmul(A, B)의 결과는 행렬 C이며, 여기서 각 요소 C[i][j]는 행렬 A의 행 i에 있는 요소와 행렬 B의 열 j에 있는 요소의 곱의 합으로 계산됩니다.



그림 10. 네트론 ard_regression_double.onnx 모델에서 추가 연산자의 속성

Add() ONNX 연산자는 같은 모양의 텐서 또는 배열 두 개를 요소 단위로 더하는 작업을 수행하며

두 개의 입력을 받아 결과 텐서의 각 요소는 입력 텐서의 해당 요소의 합과 같은 결과를 반환합니다.



그림 11. 네트론의 ard_regression_double.onnx 모델에서 Reshape 연산자의 속성

Reshape(-1,1) ONNX 연산자는 입력 데이터의 모양(또는 차원)을 수정하는 데 사용됩니다. 이 연산자에서 차원에 대한 값 -1은 데이터 일관성을 보장하기 위해 다른 차원을 기준으로 해당 차원의 크기가 자동으로 계산되어야 한다는 것을 나타냅니다.

두 번째 차원의 값 1은 도형 변환 후 각 요소가 하나의 하위 차원을 갖도록 지정합니다.



2.1.2. sklearn.linear_model.BayesianRidge BayesianRidge는 베이지안 접근 방식을 사용하여 모델 매개 변수를 추정하는 회귀 메서드입니다. 이 메서드를 사용하면 파라미터의 사전 분포를 모델링하고 데이터를 고려하여 업데이트하여 파라미터의 사후 분포를 얻을 수 있습니다.

BayesianRidge는 하나 또는 여러 개의 독립 변수를 기반으로 종속 변수를 예측하도록 설계된 베이지안 회귀 메서드입니다.



BayesianRidge의 작동 원리:

매개변수의 사전 배포: 모델 파라미터의 사전 분포를 정의하는 것으로 시작합니다. 이 분포는 데이터를 고려하기 전에 모델 매개변수에 대한 사전 지식 또는 가정을 나타냅니다. BayesianRidge의 경우 가우스 형태의 사전 분포가 사용됩니다. 매개변수 분포 업데이트하기: 사전 매개변수 분포가 설정되면 데이터를 기반으로 업데이트됩니다. 이는 데이터를 고려하여 매개변수의 사후 분포를 계산하는 베이지안 이론을 사용하여 수행됩니다. 필수적인 측면은 후행 분포의 형태에 영향을 미치는 하이퍼패러미터의 추정입니다. 예측: 매개변수의 사후 분포를 추정하고 나면 새로운 관측값에 대한 예측을 할 수 있습니다. 이렇게 하면 단일 포인트 값이 아닌 예측 분포가 생성되므로 예측의 불확실성을 고려할 수 있습니다. BayesianRidge의 장점:

불확실성 고려: BayesianRidge는 모델 매개변수 및 예측의 불확실성을 설명합니다. 포인트 예측 대신 신뢰 구간이 제공됩니다.

정규화: 베이지안 회귀 메서드는 모델 정규화에 유용하며 과적합을 방지하는 데 도움이 될 수 있습니다.

자동 피처 선택: BayesianRidge는 중요하지 않은 피처의 가중치를 줄여 피처의 중요도를 자동으로 결정할 수 있습니다. BayesianRidge의 한계:

계산의 복잡성: 이 메서드를 사용하려면 매개변수를 추정하고 사후 분포를 계산하는 데 계산 리소스가 필요합니다.

높은 추상화 수준: 베이지안 리지를 이해하고 사용하려면 베이지안 통계에 대한 더 깊은 이해가 필요할 수 있으며

항상 최선의 선택은 아닙니다: 특히 제한된 데이터를 다루는 경우 특정 회귀 작업에서는 BayesianRidge가 가장 적합한 메서드가 아닐 수도 있습니다. BayesianRidge는 매개변수 및 예측의 불확실성이 중요한 회귀 작업과 모델 정규화가 필요한 경우에 유용합니다.



2.1.2.1. BayesianRidge 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드 이 코드는 sklearn.linear_model.BayesianRidge 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# BayesianRidge.py

# 이 코드는 BayesianRidge 모델을 학습하고, 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import BayesianRidge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name = "BayesianRidge"

onnx_model_filename = data_path + "bayesian_ridge"



# BayesianRidge 회귀 모델 만들기

regression_model = BayesianRidge()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ("

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " , compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )





# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' ) 출력: Python BayesianRidge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python Python BayesianRidge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382627587808 Python Mean Absolute Error: 6.347568283744705 Python Mean Squared Error: 49.778160054267204 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python BayesianRidge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\bayesian_ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382628120845 Python Mean Absolute Error: 6.347568012853758 Python Mean Squared Error: 49.77815934891288 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

그림 12. BayesianRidge.py의 결과(float ONNX)



2.1.2.2. ONNX 모델 실행을 위한 MQL5 코드 이 코드는 저장된 bayesian_ridge_float.onnx 및 bayesian_ridge_double.onnx ONNX 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여 줍니다. #property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "BayesianRidge" #define ONNXFilenameFloat "bayesian_ridge_float.onnx" #define ONNXFilenameDouble "bayesian_ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); } 출력: BayesianRidge (EURUSD,H1) Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382627587808 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475682837447049 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781600542671896 BayesianRidge (EURUSD,H1) BayesianRidge (EURUSD,H1) Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) BayesianRidge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382628120845 BayesianRidge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3475680128537624 BayesianRidge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781593489128866 파이썬에서 원래 double 모델과 비교: Testing ONNX float : BayesianRidge (bayesian_ridge_float.onnx) Python Mean Absolute Error: 6.347568 012853758 MQL5: Mean Absolute Error: 6.347568 2837447049 Testing ONNX double : BayesianRidge (bayesian_ridge_double.onnx) Python Mean Absolute Error: 6.3475680128537 58 MQL5: Mean Absolute Error: 6.3475680128537 624 ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 13자리.



2.1.2.3. bayesian_ridge_float.onnx and bayesian_ridge_double.onnx의 ONNX 표현





그림 13. 네트론에서 bayesian_ridge_float.onnx의 ONNX 표현





그림 14. 네트론에서 bayesian_ridge_double.onnx의 ONNX 표현





ElasticNet 및 ElasticNetCV 메서드에 대한 참고 사항

회귀 모델, 특히 선형 회귀를 정규화하는 데 사용되는 두 가지 관련 머신 러닝 메서드로는 ElasticNet과 ElasticNetCV가 있습니다. 이들은 서로 공통의 기능을 공유하지만 사용 및 적용 방식이 다릅니다.



ElasticNet(엘라스틱 넷 회귀):

작동 원리: ElasticNet은 Lasso(L1 정규화)와 Ridge(L2 정규화)를 결합한 회귀 메서드입니다. 하나는 올가미처럼 계수의 절대값이 큰 경우 모델에 불이익을 주고 다른 하나는 릿지처럼 계수의 제곱이 큰 경우 모델에 불이익을 주는 두 가지 정규화 구성 요소를 손실 함수에 추가합니다.

ElasticNet은 일반적으로 데이터에 다중 상관관계가 있는 경우(피처의 상관관계가 높은 경우)와 차원 축소 및 계수 값 제어가 필요한 경우에 사용됩니다. ElasticNetCV(Elastic Net 교차 검증):

작동 원리: ElasticNetCV는 교차 검증을 사용하여 최적의 하이퍼파라미터 알파(L1과 L2 정규화 사이의 혼합 계수)와 람다(정규화 강도)를 자동으로 선택하는 ElasticNet의 확장 기능입니다. 다양한 알파 및 람다 값을 반복하여 교차하여 유효성 검사에서 가장 우수한 성능을 발휘하는 조합을 선택합니다.

장점: ElasticNetCV는 교차 검증을 기반으로 모델 매개변수를 자동으로 조정하므로 수동으로 조정할 필요 없이 최적의 하이퍼파라미터 값을 선택할 수 있습니다. 이렇게 하면 더 편리하게 사용할 수 있고 모델의 과적합을 방지할 수 있습니다. 따라서 ElasticNet과 ElasticNetCV의 가장 큰 차이점은 ElasticNet은 데이터에 적용되는 회귀 메서드인 반면 ElasticNetCV는 교차 검증을 사용하여 ElasticNet 모델에 대한 최적의 하이퍼파라미터 값을 자동으로 찾아주는 도구라는 점입니다. 최적의 모델 매개변수를 찾고 튜닝 프로세스를 더욱 자동화해야 할 때 ElasticNetCV가 유용합니다.





2.1.3. sklearn.linear_model.ElasticNet

ElasticNet은 L1(올가미)과 L2(릿지) 정규화의 조합을 나타내는 회귀 메서드입니다.

이 메서드는 일련의 피처을 기반으로 대상 변수의 수치 값을 예측하는 회귀 분석에 사용됩니다. ElasticNet은 과적합을 제어하고 모델 계수에 대한 L1 및 L2 페널티를 모두 고려합니다.



ElasticNet의 작동 원리:



입력 데이터: 피처(독립 변수)와 대상 변수의 해당 값이 있는 원본 데이터 세트에서 시작합니다. 목적 함수: ElasticNet은 평균 제곱 오차(MSE)와 두 개의 정규화라는 두 가지 구성 요소를 포함하는 손실 함수를 최소화합니다: L1(올가미) 및 L2(능선). 즉 목적 함수는 다음과 같습니다:

Objective Function = MSE + α * L1 + β * L2

여기서 α와 β는 각각 L1 및 L2 정규화의 가중치를 제어하는 하이퍼파라미터입니다. 최적의 α와 β 찾기: 교차 검증 메서드는 일반적으로 α와 β의 최적 값을 찾는 데 사용됩니다. 이를 통해 과적합을 줄이는 것과 필수 피처를 보존하는 것 사이에서 균형을 이루는 값을 선택할 수 있습니다. 모델 교육: ElasticNet은 목적 함수를 최소화하여 최적의 α와 β를 고려하며 모델을 학습시킵니다. 예측: 모델이 학습된 후에는 ElasticNet을 사용해 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

ElasticNet의 장점:



피처 선택 능력: ElasticNet은 중요하지 않은 피처에 대해서는 가중치를 0으로 설정하여 가장 중요한 피처를 자동으로 선택할 수 있습니다(Lasso와 유사).

과적합 제어: ElasticNet을 사용하면 L1 및 L2 정규화로 인한 과적합을 제어할 수 있습니다.

다연속성 다루기: 이 메서드는 다중 선형성(피처 간의 높은 상관관계)이 존재하는 경우 L2 정규화를 통해 다중 선형 피처의 영향을 줄일 수 있으므로 유용합니다.

ElasticNet의 한계:



하이퍼파라미터 α와 β의 조정이 필요한데 이는 간단한 작업이 아닐 수 있습니다.

매개변수 선택에 따라 ElasticNet은 너무 적거나 너무 많은 피처를 유지하게 되고 이에 따라 모델의 품질에 영향을 미칠 수 있습니다.

ElasticNet은 피처 선택과 과적합 제어가 중요한 작업에서 유용할 수 있는 강력한 회귀 메서드입니다.



2.1.3.1. ElasticNet 모델을 생성하고 float 및 double 용의 ONNX로 내보내는 코드

이 코드는 sklearn.linear_model.ElasticNet 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# ElasticNet.py

# 이 코드는 ElasticNet 모델을 학습하고 이를 ONNX 형식(float 및 double)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNet

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0 . 5 )



model_name = "ElasticNet"

onnx_model_filename = data_path + "elastic_net"



# ElasticNet 모델 생성

regression_model = ElasticNet()



# 데이터에 모델 맞추기

regression_model.fit(X,y)



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print( "

" +model_name+ " Original model (double)" )

print( "R-squared (Coefficient of determination):" , r2)

print( "Mean Absolute Error:" , mae)

print( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1 } . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1 } . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python ElasticNet Original model ( double ) Python R-squared (Coefficient of determination): 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python Python ElasticNet ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377032416807 Python Mean Absolute Error: 6.344395027824294 Python Mean Squared Error: 49.78556400887057 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 5 Python MSE matching decimal places: 6 Python float ONNX model precision: 5 Python Python ElasticNet ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962377031744798 Python Mean Absolute Error: 6.344394662876524 Python Mean Squared Error: 49.78556489812415 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림 15. ElasticNet.py의 결과(float ONNX)

2.1.3.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 elastic_net_double.onnx 및 elastic_net_float.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNet" #define ONNXFilenameFloat "elastic_net_float.onnx" #define ONNXFilenameDouble "elastic_net_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

ElasticNet (EURUSD,H1) Testing ONNX float : ElasticNet (elastic_net_float.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377032416807 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443950278242944 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855640088705869 ElasticNet (EURUSD,H1) ElasticNet (EURUSD,H1) Testing ONNX double : ElasticNet (elastic_net_double.onnx) ElasticNet (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962377031744798 ElasticNet (EURUSD,H1) MQL5: Mean Absolute Error: 6.3443946628765220 ElasticNet (EURUSD,H1) MQL5: Mean Squared Error: 49.7855648981241217

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : ElasticNet (elastic_net_float.onnx) Python Mean Absolute Error: 6.34439 4662876524 MQL5: Mean Absolute Error: 6.34439 50278242944 Testing ONNX double : ElasticNet (elastic_net_double.onnx) Python Mean Absolute Error: 6.34439466287652 4 MQL5: Mean Absolute Error: 6.34439466287652 20

ONNX float MAE의 정확도: 소수점 이하 5자리, 정확도 ONNX 더블 MAE: 소수점 이하 14자리.





2.1.3.3. elastic_net_float.onnx 및 elastic_net_double.onnx의 ONNX 표현







그림 16. 네트론에서 elastic_net_float.onnx의 ONNX 표현









그림 17. 네트론에서 elastic_net_double.onnx의 ONNX 표현







2.1.4. sklearn.linear_model.ElasticNetCV

ElasticNetCV은 교차 검증을 사용하여 하이퍼파라미터 α 및 β(L1 및 L2 정규화)의 최적 값을 자동으로 선택하도록 설계된 ElasticNet 메서드의 확장입니다.



이를 통해 수동으로 매개변수를 조정할 필요 없이 ElasticNet 모델에 가장 적합한 정규화 조합을 찾을 수 있습니다.



ElasticNetCV의 작동 원리:



입력 데이터: 피처(독립 변수)와 그에 해당하는 목표 변수 값이 포함된 원본 데이터 집합으로 시작합니다. α 및 β 범위 정의하기: 사용자는 최적화 중에 고려할 α와 β의 값의 범위를 지정합니다. 이러한 값은 일반적으로 로그 스케일로 선택됩니다. 데이터 분할: 데이터 세트는 교차 검증을 위해 여러 번 분할됩니다. 각 폴드는 테스트 데이터세트로 사용되고 다른 폴드는 학습에 사용됩니다. 교차 유효성 검사: 지정된 범위 내에서 α와 β의 각 조합에 대해 교차 유효성 검사가 수행됩니다. 학습 데이터에 대해 ElasticNet 모델을 학습한 다음 테스트 데이터에 대해 평가합니다. 성능 평가: 교차 검증에서 테스트 데이터 세트의 평균 오류는 각 α 및 β 조합에 대해 계산됩니다. 최적의 매개변수 선택: 교차 검증 중에 얻은 최소 평균 오류에 해당하는 α 및 β의 값이 결정됩니다. 최적의 매개변수로 모델 학습: 발견된 α와 β의 최적 값을 사용하여 ElasticNetCV 모델을 학습합니다. 예측: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

ElasticNetCV의 장점:



자동 하이퍼파라미터 선택: ElasticNetCV는 α와 β의 최적 값을 자동으로 찾아내어 모델 튜닝을 간소화합니다.

과적합 방지: 교차 검증은 일반화 능력이 우수한 모델을 선택하는 데 도움이 됩니다.

노이즈 견고성: 이 메서드은 데이터 노이즈에 강하며 노이즈를 고려하면서 최적의 정규화 조합을 식별할 수 있습니다.

ElasticNetCV의 한계:



계산의 복잡성: 매개변수가 커다란 범위에 걸쳐 있는 교차 검증을 수행하려면 시간이 많이 소요될 수 있습니다.

최적의 매개변수는 범위 선택에 알려 있습니다: α 및 β 범위의 선택에 따라 결과가 달라질 수 있으므로 이 범위를 신중하게 조정하는 것이 중요합니다.

ElasticNetCV는 ElasticNet 모델에서 정규화를 자동으로 조정하고 성능을 향상시키기 위한 강력한 도구입니다.



2.1.4.1. ElasticNetCV 모델을 생성하고 float 및 double 용의 ONNX로 내보내는 코드

이 코드는 sklearn.linear_model.ElasticNetCV 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.



# ElasticNetCV.py

# 이 코드는 ElasticNetCV 모델을 학습하고 이를 ONNX 형식(float 및 double)으로 내보내고 ONNX 모델을 사용하여 예측하는 프로세스를 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places(value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str(value1)

str_value2 = str(value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find(".")

dot_position2 = str_value2.find(".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == -1 or dot_position2 == -1:

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else:

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import ElasticNetCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv[0]

last_index = data_path.rfind("\\")+ 1

data_path = data_path[0:last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange(0,100,1).reshape(-1,1)

y = 4*X+ 10*np.sin(X*0.5)



model_name = "ElasticNetCV"

onnx_model_filename = data_path + "elastic_net_cv"



# ElasticNetCV 모델 생성하기

regression_model = ElasticNetCV()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print("

"+model_name+" Original model (double)")

print("R-squared (Coefficient of determination):", r2)

print("Mean Absolute Error:", mae)

print("Mean Squared Error:", mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [('float_input', FloatTensorType([None, X.shape[1]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset=12)



# 파일에 모델 저장

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print("

"+model_name+" ONNX model (float)")

# 모델 경로 인쇄

print(f"ONNX model saved to {onnx_filename}")



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[0]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print("R-squared (Coefficient of determination)", r2_onnx_float)

print("Mean Absolute Error:", mae_onnx_float)

print("Mean Squared Error:", mse_onnx_float)

print("R^2 matching decimal places: ",compare_decimal_places(r2, r2_onnx_float))

print("MAE matching decimal places: ",compare_decimal_places(mae, mae_onnx_float))

print("MSE matching decimal places: ",compare_decimal_places(mse, mse_onnx_float))

print("float ONNX model precision: ",compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparison (with float ONNX)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_float.png')



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [('double_input', DoubleTensorType([None, X.shape[1]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# 파일에 모델 저장

onnx_filename=onnx_model_filename+"_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print("

"+model_name+" ONNX model (double)")

# 모델 경로 인쇄

print(f"ONNX model saved to {onnx_filename}")



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print("Information about input tensors in ONNX:")

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print(f"{i + 1}. Name: {input_tensor.name}, Data Type: {input_tensor.type}, Shape: {input_tensor.shape}")



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print(f"{i + 1}. Name: {output_tensor.name}, Data Type: {output_tensor.type}, Shape: {output_tensor.shape}")



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print("R-squared (Coefficient of determination)", r2_onnx_double)

print("Mean Absolute Error:", mae_onnx_double)

print("Mean Squared Error:", mse_onnx_double)

print("R^2 matching decimal places: ",compare_decimal_places(r2, r2_onnx_double))

print("MAE matching decimal places: ",compare_decimal_places(mae, mae_onnx_double))

print("MSE matching decimal places: ",compare_decimal_places(mse, mse_onnx_double))

print("double ONNX model precision: ",compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=(8,5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label='Original Data', marker='o')

plt.scatter(X, y_pred, color='blue', label='Scikit-Learn '+model_name+' Output', marker='o')

plt.scatter(X, y_pred_onnx_float, color='red', label='ONNX '+model_name+' Output', marker='o', linestyle='--')

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+' Comparison (with double ONNX)')

#plt.show()

plt.savefig(data_path + model_name+'_plot_double.png')

출력:

Python ElasticNetCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python Python ElasticNetCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137770260989 Python Mean Absolute Error: 6.334486542922601 Python Mean Squared Error: 50.10217383894468 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python ElasticNetCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\elastic_net_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962137763338385 Python Mean Absolute Error: 6.334487104423225 Python Mean Squared Error: 50.10218299945999 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15

< 의



그림 18. ElasticNetCV.py의 결과(float ONNX)

2.1.4.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 elastic_net_cv_float.onnx 및 elastic_net_cv_double.onnx ONNX 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 시연합니다.



#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "ElasticNetCV" #define ONNXFilenameFloat "elastic_net_cv_float.onnx" #define ONNXFilenameDouble "elastic_net_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

ElasticNetCV (EURUSD,H1) Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137770260989 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344865429226038 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021738389446938 ElasticNetCV (EURUSD,H1) ElasticNetCV (EURUSD,H1) Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) ElasticNetCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962137763338385 ElasticNetCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3344871044232205 ElasticNetCV (EURUSD,H1) MQL5: Mean Squared Error: 50.1021829994599983

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : ElasticNetCV (elastic_net_cv_float.onnx) Python Mean Absolute Error: 6.33448 7104423225 MQL5: Mean Absolute Error: 6.33448 65429226038 Testing ONNX double : ElasticNetCV (elastic_net_cv_double.onnx) Python Mean Absolute Error: 6.33448710442322 5 MQL5: Mean Absolute Error: 6.33448710442322 05

ONNX float MAE의 정확도: 소수점 이하 5자리, 정확도 ONNX 더블 MAE: 소수점 이하 14자리.



2.1.4.3. elastic_net_cv_float.onnx 및 elastic_net_cv_double.onnx의 ONNX 표현









그림 19. 네트론에서 elastic_net_cv_float.onnx의 ONNX 표현









그림 20. 네트론에서 elastic_net_cv_double.onnx의 ONNX 표현









2.1.5. sklearn.linear_model.HuberRegressor

HuberRegressor - 회귀 작업에 사용되는 머신 러닝 메서드입니다. 최소자승법(OLS)을 수정한 것으로 데이터의 이상값에 강하도록 설계되었습니다.



오차의 제곱을 최소화하는 OLS와 달리 HuberRegressor는 제곱 오차와 절대 오차의 조합을 최소화합니다. 이를 통해 데이터에 이상값이 있는 경우 메서드가 더욱 강력하게 작동할 수 있습니다.



HuberRegressor의 작동 원리:



입력 데이터: 피처(독립 변수()와 그에 해당하는 목표 변수 값이 있는 원본 데이터 세트에서 시작합니다. 후버 손실 함수: HuberRegressor는 작은 오류에 대한 이차적 손실 함수와 큰 오류에 대한 선형적 손실 함수를 결합한 Huber 손실 함수를 활용합니다. 이렇게 하면 이상값에 대해 메서드의 복원력이 높아집니다. 모델 교육: 모델은 후버 손실 함수를 사용하여 데이터에 대해 학습합니다. 학습하는 동안 각 피처의 가중치(계수)와 편향성을 조정합니다. 예측: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

HuberRegressor의 장점:



이상값에 대한 견고성: HuberRegressor는 OLS에 비해 데이터의 이상값에 더 강력하므로 데이터에 비정상적인 값이 포함될 수 있는 작업에 유용합니다.

오류 추정: 후버 손실 함수는 모델 결과를 분석하는 데 유용한 예측 오류를 추정하는 데 기여합니다.

정규화 수준: HuberRegressor는 또한 일정 수준의 정규화를 통합하여 과적합을 줄일 수 있습니다.

HuberRegressor의 한계:



이상값이 없는 경우 OLS만큼 정확하지 않습니다: 데이터에 이상값이 없는 경우 OLS가 더 정확한 결과를 제공할 수 있습니다.

매개변수 조정: HuberRegressor에는 선형 손실 함수로 전환하기 위해 "큰" 것으로 간주되는 임계값을 정의하는 매개변수가 있습니다. 이 매개변수는 조정이 필요합니다.

HuberRegressor는 데이터에 이상값이 포함될 수 있는 회귀 작업에서 유용하며 이러한 이상값에 강한 모델이 필요합니다.





2.1.5.1. HuberRegressor 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.HuberRegressor 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# HuberRegressor.py

# 이 코드는 HuberRegressor 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import HuberRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name = "HuberRegressor"

onnx_model_filename = data_path + "huber_regressor"



# 후버 회귀 모델 만들기

huber_regressor_model = HuberRegressor()



# 데이터에 모델 맞추기

huber_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = huber_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

"+model_name+" Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(huber_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print( "R-squared (Coefficient of determination)" , r2_onnx_float)

print( "Mean Absolute Error:" , mae_onnx_float)

print( "Mean Squared Error:" , mse_onnx_float)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(huber_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print( "

" +model_name +" ONNX model (double)" )

# 모델 경로 인쇄

print( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python HuberRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python Python HuberRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363944236795 Python Mean Absolute Error: 6.341633300252807 Python Mean Squared Error: 49.80288328126165 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python HuberRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\huber_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962363935647066 Python Mean Absolute Error: 6.341633708569641 Python Mean Squared Error: 49.80289464784336 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림 21. HuberRegressor.py(float ONNX)의 결과







2.1.5.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 huber_regressor_float.onnx 및 huber_regressor_double.onnx ONNX 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 예를 보여 줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "HuberRegressor" #define ONNXFilenameFloat "huber_regressor_float.onnx" #define ONNXFilenameDouble "huber_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

HuberRegressor (EURUSD,H1) Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363944236795 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416333002528074 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028832812616571 HuberRegressor (EURUSD,H1) HuberRegressor (EURUSD,H1) Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) HuberRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962363935647066 HuberRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3416337085696410 HuberRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.8028946478433525

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : HuberRegressor (huber_regressor_float.onnx) Python Mean Absolute Error: 6.341633 708569641 MQL5: Mean Absolute Error: 6.341633 3002528074 Testing ONNX double : HuberRegressor (huber_regressor_double.onnx) Python Mean Absolute Error: 6.34163370856964 1 MQL5: Mean Absolute Error: 6.34163370856964 10

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.





2.1.5.3. huber_regressor_float.onnx 및 huber_regressor_double.onnx의 ONNX 표현











그림 22. 네트론에서 huber_regressor_float.onnx의 ONNX 표현









그림 23. 네트론에서 huber_regressor_double.onnx의 ONNX 표현









2.1.6. sklearn.linear_model.Lars

LARS(최소 각 회귀)는 회귀 작업에 사용되는 머신 러닝 메서드입니다. 학습 과정에서 활성 피처(변수)를 선택해 선형 회귀 모델을 구축하는 알고리즘입니다.



LARS는 목표 변수에 가장 가까운 근사치를 제공하는 최소한의 피처를 찾으려고 시도합니다.



LARS의 작동 원리:



입력 데이터: LARS는 피처(독립 변수)와 그에 해당하는 목표 변수 값으로 구성된 원본 데이터 세트에서 시작합니다. 초기화: 활성 피처가 없다는 것을 의미하는 null 모델로 시작합니다. 모든 계수는 0으로 설정됩니다. 피처 선택: 각 단계에서 LARS는 모델의 잔차와 가장 상관관계가 높은 피처를 선택합니다. 그런 다음 이 피처를 모델에 추가하고 최소 제곱 메서드을 사용하여 해당 계수를 조정합니다. 활성 피처를 따라 회귀: 모델에 피처을 추가한 후 LARS는 새 모델의 변경 사항을 수용하도록 모든 활성 피처의 계수를 업데이트합니다. 반복 단계: 이 프로세스는 모든 피처가 선택되거나 지정된 중지 기준이 충족될 때까지 계속됩니다. 예측: 모델 학습 후에는 새로운 데이터의 목표 변수 값을 예측하는 데 사용할 수 있습니다.

LARS의 장점:



효율성: 특히 피처가 많지만 대상 변수에 큰 영향을 미치는 피처가 몇 개에 불과한 경우 LARS가 효율적인 메서드가 될 수 있습니다.

해석 가능성: LARS는 가장 유익한 피처만 선택하는 것을 목표로 하기 때문에 비교적 해석하기 쉽습니다.

LARS의 한계:



선형 모델: LARS는 선형 모델을 구축하기 때문에 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

소음 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

다중 선형성을 처리 불가: 피처의 상관관계가 높은 경우 LARS에 다중 상관성 문제가 발생할 수 있습니다.

LARS는 가장 유익한 피처들을 선택하고 최소한의 피처으로 선형 모델을 구성하는 것이 필수적인 회귀 작업에 유용합니다.





2.1.6.1. Lars 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.Lars 모델을 생성하고, 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 이중 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# Lars.py

# 이 코드는 Lars 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

에서 sklearn.linear_model import Lars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name = " Lars"

onnx_model_filename = data_path + "lars"



# 라스 회귀 모델 만들기

lars_regressor_model = Lars()



# 데이터에 모델 맞추기

lars_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = lars_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print( "R-squared (Coefficient of determination)" , r2_onnx_double)

print( "Mean Absolute Error:" , mae_onnx_double)

print( "Mean Squared Error:" , mse_onnx_double)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python Lars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python Lars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python Lars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





그림 24. Lars.py 결과(float ONNX)







2.1.6.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lars_cv_float.onnx 및 lars_cv_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭의 사용을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lars" #define ONNXFilenameFloat "lars_float.onnx" #define ONNXFilenameDouble "lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

Lars (EURUSD,H1) Testing ONNX float : Lars (lars_float.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 Lars (EURUSD,H1) Lars (EURUSD,H1) Testing ONNX double : Lars (lars_double.onnx) Lars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 Lars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 Lars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : Lars (lars_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : Lars (lars_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 13자리.





2.1.6.3. lars_float.onnx 및 lars_double.onnx의 ONNX 표현









그림 25. 네트론에서 lars_float.onnx의 ONNX 표현









그림 26. Netron에서 lars_double.onnx의 ONNX 표현





2.1.7. sklearn.linear_model.LarsCV

LarsCV는 교차 검증을 사용하여 모델에 포함할 최적의 피처 수를 자동으로 선택하는 LARS(최소 각 회귀) 메서드의 변형입니다.



이 메서드는 데이터를 효과적으로 일반화하는 모델과 최소한의 피처을 사용하는 모델 간의 균형을 맞추는 데 도움이 됩니다.



LarsCV의 작동 원리:



입력 데이터: LarsCV는 피처(독립 변수)와 그에 해당하는 목표 변수 값으로 구성된 원본 데이터 집합으로 시작합니다. 초기화: 활성 피처가 없음을 의미하는 널 모델로 시작합니다. 모든 계수는 0으로 설정됩니다. 교차 유효성 검사: LarsCV는 다양한 량이 포함된 피처에 대해 교차 검증을 수행하며 다양한 피처 세트를 사용하여 모델의 성능을 평가합니다. 최적의 피처 수 선택하기: LarsCV는 결정된 최상의 모델 성능을 제공하는 피처의 수를 교차 검증을 통해 선택합니다. 모델 교육: 모델은 선택한 피처 수와 각각의 계수를 사용하여 학습됩니다. 예측: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

LarsCV의 장점:



자동 피처 선택: LarsCV는 최적의 피처 수를 자동으로 선택해 모델 설정 프로세스를 간소화합니다.

해석 가능성: 일반 LARS와 마찬가지로 LarsCV는 상대적으로 높은 모델 해석 가능성을 유지합니다.

효율성: 이 메서드는 특히 데이터 집합에 많은 피처가 있지만 중요한 피처는 몇 개에 불과한 경우에 효율적일 수 있습니다.

LarsCV의 한계:



선형 모델: LarsCV는 선형 모델을 구축하기 때문에 복잡한 비선형 관계를 모델링하기에는 부족할 수 있습니다.

잡음 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

다중 선형성을 처리 불가: 피처의 상관관계가 높은 경우 LarsCV에 다중 상관성 문제가 발생할 수 있습니다.

LarsCV이 유용하게 쓰이는 곳은 모델에 사용되는 최적의 피처 집합을 자동으로 선택하고 모델 해석 가능성을 유지하는 것이 중요한 회귀 작업에서입니다.





2.1.7.1. LarsCV 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LarsCV 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LarsCV.py

# 이 코드는 LarsCV 모델을 학습하고 이를 ONNX 형식(float 및 double)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name = "LarsCV"

onnx_model_filename = data_path + "lars_cv"



# LarsCV 회귀 모델 만들기

larscv_regressor_model = LarsCV()



# 데이터에 모델 맞추기

larscv_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = larscv_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(larscv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(larscv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python LarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





그림 27. LarsCV.py의 결과(float ONNX)





2.1.7.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lars_cv_float.onnx 및 lars_cv_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LarsCV" #define ONNXFilenameFloat "lars_cv_float.onnx" #define ONNXFilenameDouble "lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

LarsCV (EURUSD,H1) Testing ONNX float : LarsCV (lars_cv_float.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LarsCV (EURUSD,H1) LarsCV (EURUSD,H1) Testing ONNX double : LarsCV (lars_cv_double.onnx) LarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : LarsCV (lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LarsCV (lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 16자리.





2.1.7.3. lars_cv_float.onnx 및 lars_cv_double.onnx의 ONNX 표현





그림 28. 네트론에서 lars_cv_float.onnx의 ONNX 표현









그림 29. 네트론에서 lars_cv_double.onnx의 ONNX 표현







2.1.8. sklearn.linear_model.Lasso

Lasso(최소 절대 축소 및 선택 연산자)는 가장 중요한 피처를 선택하고 모델 차원을 줄이는 데 사용되는 회귀 메서드입니다.



선형 회귀 최적화 문제에서 계수 절대값의 합에 페널티를 추가하여(L1 정규화) 이를 달성합니다.



Lasso의 작동 원리:



입력 데이터: Lasso는 피처(독립 변수) 및 해당 목표 변수 값을 포함한 원본 데이터 집합으로 시작합니다. 목적 함수: Lasso의 목적 함수에는 회귀 오차의 제곱합과 피처와 관련된 계수의 절대값 합에 대한 페널티가 포함됩니다. 최적화: Lasso 모델은 목적 함수를 최소화하여 학습되므로 일부 계수가 0이 되어 모델에서 해당 피처를 효과적으로 제외합니다. 최적의 페널티 값 선택하기: Lasso에는 정규화 강도를 결정하는 하이퍼파라미터가 포함되어 있습니다. 이 하이퍼파라미터에 대한 최적의 값을 선택하려면 교차 검증이 필요할 수 있습니다. 예측 생성하기: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

Lasso의 장점:



피처 선택: Lasso는 모델에서 덜 중요한 피처을 제외하고 가장 중요한 피처를 자동으로 선택합니다. 이렇게 하면 데이터 차원이 줄어들고 모델이 단순화됩니다.

정규화: 계수 절대값의 합에 대한 페널티는 모델 과적합을 방지하고 일반화를 향상시키는 데 도움이 됩니다.

해석 가능성: Lasso는 일부 피처을 제외하기 때문에 비교적 해석하기 쉬운 모델로 남아 있습니다.

Lasso의 한계:



선형 모델: Lasso는 선형 모델을 구축하므로 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

잡음 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

다중 선형성 처리 불가: 피처의 상관관계가 높은 경우 올가미에 다중 상관성 문제가 발생할 수 있습니다.

Lasso는 가장 중요한 피처를 선택하고 해석 가능성을 유지하면서 모델의 차원을 줄이는 것이 필수적인 회귀 작업에 유용합니다.





2.1.8.1. Lasso 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.Lasso 모델을 생성하고, 합성 데이터로 학습시키고, 모델을 ONNX 형식으로 저장하고, 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# Lasso.py

# 이 코드는 Lasso 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range ( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import Lasso

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4*X + 10*np .sin(X*0. 5 )



model_name = "Lasso"

onnx_model_filename = data_path + "lasso"



# Lasso 모델 만들기

lasso_model = Lasso()



# 데이터에 모델 맞추기

lasso_model.fit(X, y)



# 전체 데이터 집합에 대한 값 예측

y_pred = lasso_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lasso_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lasso_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python Lasso Original model ( double ) Python R-squared (Coefficient of determination): 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python Python Lasso ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381720269486 Python Mean Absolute Error: 6.346395056911361 Python Mean Squared Error: 49.77936068668213 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 4 Python float ONNX model precision: 5 Python Python Lasso ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962381735682287 Python Mean Absolute Error: 6.346393791922984 Python Mean Squared Error: 49.77934029129379 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15









그림 30. 올가미.py 결과(float ONNX)





2.1.8.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lasso_float.onnx 및 lasso_double.onnx를 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Lasso" #define ONNXFilenameFloat "lasso_float.onnx" #define ONNXFilenameDouble "lasso_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

Lasso (EURUSD,H1) Testing ONNX float : Lasso (lasso_float.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381720269486 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463950569113612 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793606866821037 Lasso (EURUSD,H1) Lasso (EURUSD,H1) Testing ONNX double : Lasso (lasso_double.onnx) Lasso (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962381735682287 Lasso (EURUSD,H1) MQL5: Mean Absolute Error: 6.3463937919229840 Lasso (EURUSD,H1) MQL5: Mean Squared Error: 49.7793402912937850

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : Lasso (lasso_float.onnx) Python Mean Absolute Error: 6.34639 3791922984 MQL5: Mean Absolute Error: 6.34639 50569113612 Testing ONNX double : Lasso (lasso_double.onnx) Python Mean Absolute Error: 6.346393791922984 MQL5: Mean Absolute Error: 6.346393791922984 0

ONNX float MAE의 정확도: 소수점 이하 5자리, 정확도 ONNX 더블 MAE: 소수점 이하 15자리.





2.1.8.3. lasso_float.onnx 및 lasso_double.onnx의 ONNX 표현









그림 31. 네트론에서 lasso_float.onnx의 ONNX 표현













그림 32. 네트론에서 lasso_double.onnx의 ONNX 표현







2.1.9. sklearn.linear_model.LassoCV

LassoCV는 Lasso 메서드(최소 절대 축소 및 선택 연산자)의 변형으로 교차 검증을 사용하여 정규화 하이퍼파라미터(알파)의 최적 값을 자동으로 선택하는 방식입니다.



이 메서드를 사용하면 모델의 차원 축소(중요한 피처 선택)와 과적합 방지 사이의 균형을 찾을 수 있으므로 회귀 작업에 유용합니다.



LassoCV의 작동 원리:



입력 데이터: LassoCV는 피처(독립 변수) 및 해당 목표 변수 값을 포함한 원본 데이터 집합으로 시작합니다. 초기화: LassoCV는 낮은 값부터 높은 값까지 다양한 정규화 하이퍼파라미터(알파) 값을 초기화합니다. 교차 유효성 검사: LassoCV는 각 알파 값에 대해 교차 검증을 수행하여 모델의 성능을 평가합니다. 평균 제곱 오차(MSE) 또는 결정 계수(R^2)와 같은 메트릭이 일반적으로 사용됩니다. 최적의 알파 선택하기: LassoCV는 교차 검증을 통해 모델이 최고의 성능을 달성하는 알파 값을 선택합니다. 모델 교육: Lasso 모델은 선택한 알파 값을 사용하여 덜 중요한 피처를 제외하고 L1 정규화를 적용하여 학습합니다. 예측 생성하기: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

LassoCV의 장점:



자동 알파 선택: LassoCV는 교차 검증을 통해 최적의 알파 값을 자동으로 선택하여 모델 튜닝을 간소화합니다.

피처 선택: LassoCV는 가장 중요한 피처를 자동으로 선택해 모델의 크기를 줄이고 해석을 단순화합니다.

정규화: 이 메서드는 L1 정규화를 통해 모델 과적합을 방지합니다.

LassoCV의 한계:



선형 모델: LassoCV는 선형 모델을 구축하기 때문에 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

잡음 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

다중 선형성 처리 불가: 피처의 상관관계가 높은 경우 LassoCV는 다중 선형성 문제에 직면할 수 있습니다.

LassoCV는 해석 가능성을 유지하고 과적합을 방지하면서 가장 중요한 피처를 선택하고 모델의 차원을 줄이는 것이 중요한 회귀 작업에 유용합니다.





2.1.9.1. LassoCV 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LassoCV 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LassoCV.py

# 이 코드는 LassoCV 모델을 학습하고 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range (1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange( 0 , 100 , 1 ).reshape(-1,1)

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoCV"

onnx_model_filename = data_path + "lasso_cv"



# 올가미 CV 회귀 모델 만들기

lassocv_regressor_model = LassoCV()



# 데이터에 모델 맞추기

lassocv_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = lassocv_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lassocv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python LassoCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python Python LassoCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.996224142876629 Python Mean Absolute Error: 6.335673221332177 Python Mean Squared Error: 49.96500504333324 Python R^ 2 matching decimal places: 10 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 6 Python float ONNX model precision: 6 Python Python LassoCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962241428413416 Python Mean Absolute Error: 6.33567334453819 Python Mean Squared Error: 49.96500551028169 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





그림 33. LassoCV.py의 결과(float ONNX)



2.1.9.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lasso_cv_float.onnx 및 lasso_cv_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoCV" #define ONNXFilenameFloat "lasso_cv_float.onnx" #define ONNXFilenameDouble "lasso_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

2023.10 . 26 22 : 14 : 00.736 LassoCV (EURUSD,H1) Testing ONNX float : LassoCV (lasso_cv_float.onnx) 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428766290 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356732213321800 2023.10 . 26 22 : 14 : 00.739 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650050433332211 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) 2023.10 . 26 22 : 14 : 00.748 LassoCV (EURUSD,H1) Testing ONNX double : LassoCV (lasso_cv_double.onnx) 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962241428413416 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3356733445381899 2023.10 . 26 22 : 14 : 00.753 LassoCV (EURUSD,H1) MQL5: Mean Squared Error: 49.9650055102816992

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : LassoCV (lasso_cv_float.onnx) Python Mean Absolute Error: 6.335673 34453819 MQL5: Mean Absolute Error: 6.335673 2213321800 Testing ONNX double : LassoCV (lasso_cv_double.onnx) Python Mean Absolute Error: 6.3356733445381 9 MQL5: Mean Absolute Error: 6.3356733445381 899

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 13자리.





2.1.9.3. lasso_cv_float.onnx 및 lasso_cv_double.onnx의 ONNX 표현





그림 34. 네트론에서 lasso_cv_float.onnx의 ONNX 표현









그림 35. 네트론에서 lasso_cv_double.onnx의 ONNX 표현







2.1.10. sklearn.linear_model.LassoLars

LassoLars 두 가지 메서드를 조합한 것입니다: Lasso(최소 절대 축소 및 선택 연산자) 및 LARS(최소 각도 회귀).



이 메서드는 회귀 작업에 사용되며 두 알고리즘의 장점을 결합하여 피처 선택과 모델 차원 축소를 동시에 수행할 수 있습니다.



LassoLars의 작동 원리:



입력 데이터: LassoCV는 피처(독립 변수) 및 해당 목표 변수 값을 포함한 원본 데이터 집합으로 시작합니다. 초기화: LassoLars는 활성 피처가 없는 널 모델로 시작합니다. 모든 계수는 0으로 설정됩니다. 단계별 피처 선택: LARS 메서드와 유사하게 LassoLars는 각 단계에서 모델 잔차와 가장 상관관계가 높은 피처를 선택하여 모델에 추가합니다. 그런 다음 이 피처의 계수는 최소 제곱 메서드를 사용하여 조정됩니다. L1 정규화 적용: LassoLars는 단계적 피처 선택과 동시에 L1 정규화를 적용하여 계수 절대값의 합에 페널티를 추가합니다. 이를 통해 복잡한 관계를 모델링하고 가장 중요한 피처를 선택할 수 있습니다. 예측하기: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

LassoLars의 장점:



피처 선택: LassoLars는 가장 중요한 피처를 자동으로 선택하고 모델의 차원을 줄여 과적합을 방지하고 해석을 단순화합니다.

해석 가능성: 이 메서드는 모델의 해석 가능성을 유지하여 어떤 피처가 포함되고 목표 변수에 어떤 영향을 미치는지 쉽게 파악할 수 있습니다.

정규화: LassoLars는 L1 정규화를 적용하여 과적합을 방지하고 모델의 일반화를 향상시킵니다.

LassoLars의 한계:



선형 모델: LassoLars는 선형 모델을 구축하기 때문에 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

소음에 대한 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

계산의 복잡성: 각 단계에서 피처를 선택하고 정규화를 적용하려면 단순한 선형 회귀보다 더 많은 계산 리소스가 필요할 수 있습니다.

LassoLars는 가장 중요한 피처를 선택하고 모델의 차원을 줄이며 해석 가능성을 유지하는 것이 중요한 회귀 작업에 유용합니다.





2.1.10.1. LassoLars 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LassoLars 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LassoLars.py

# 이 코드는 LassoLars 모델을 학습하고 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLars

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLars"

onnx_model_filename = data_path + "lasso_lars"



# LassoLars 회귀 모델 만들기

lassolars_regressor_model = LassoLars(alpha= 0.1 )



# 데이터에 모델 맞추기

lassolars_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = lassolars_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lassolars_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# plot the original data and the regres sion line

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )



출력:

Python LassoLars Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python Python LassoLars ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382635045889 Python Mean Absolute Error: 6.3476034814795375 Python Mean Squared Error: 49.77815018516975 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLars ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382633544077 Python Mean Absolute Error: 6.3476035128950805 Python Mean Squared Error: 49.778152172481896 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





그림 36. LassoLars.py의 결과(float)





2.1.10.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lasso_lars_float.onnx 및 lasso_lars_double.onnx를 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLars" #define ONNXFilenameFloat "lasso_lars_float.onnx" #define ONNXFilenameDouble "lasso_lars_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

LassoLars (EURUSD,H1) Testing ONNX float : LassoLars (lasso_lars_float.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382635045889 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476034814795375 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781501851697357 LassoLars (EURUSD,H1) LassoLars (EURUSD,H1) Testing ONNX double : LassoLars (lasso_lars_double.onnx) LassoLars (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382633544077 LassoLars (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476035128950858 LassoLars (EURUSD,H1) MQL5: Mean Squared Error: 49.7781521724819029

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : LassoLars (lasso_lars_float.onnx) Python Mean Absolute Error: 6.347603 5128950805 MQL5: Mean Absolute Error: 6.347603 4814795375 Testing ONNX double : LassoLars (lasso_lars_double.onnx) Python Mean Absolute Error: 6.34760351289508 05 MQL5: Mean Absolute Error: 6.34760351289508 58

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.





2.1.10.3. lasso_lars_float.onnx 및 lasso_lars_double.onnx의 ONNX 표현









그림 37. 네트론에서 lasso_lars_float.onnx의 ONNX 표현













그림 38. 네트론에서 lasso_lars_double.onnx의 ONNX 표현





2.1.11. sklearn.linear_model.LassoLarsCV

LassoLarsCV는 교차 검증을 통해 최적의 정규화 하이퍼파라미터(알파)를 자동으로 선택하는 Lasso(최소 절대 축소 및 선택 연산자)와 LARS(최소 각도 회귀)를 결합한 방식입니다.



이 메서드는 두 알고리즘의 장점을 결합하여 피처 선택과 정규화를 고려하여 모델에 대한 최적의 알파 값을 결정할 수 있습니다.



LassoLarsCV의 작동 원리:



입력 데이터: LassoCV는 피처(독립 변수) 및 해당 목표 변수 값을 포함한 원본 데이터 집합으로 시작합니다. 초기화: 올가미LarsCV는 모든 계수가 0으로 설정된 널 모델로 시작합니다. 알파 범위의 정의: 하이퍼파라미터 알파의 값 범위가 결정되며 이는 선택 과정에서 고려됩니다. 일반적으로 알파 값의 로그 눈금이 사용됩니다. 교차 유효성 검사: 선택한 범위의 각 알파 값에 대해 올가미LarsCV는 교차 검증을 수행하여 이 알파 값으로 모델의 성능을 평가합니다. 일반적으로 평균 제곱 오차(MSE) 또는 결정 계수(R^2)와 같은 메트릭이 사용됩니다. 최적의 알파 선택: LassoLarsCV는 교차 검증 결과를 바탕으로 모델이 최고의 성능을 달성하는 알파 값을 선택합니다. 모델 교육: LassoLars 모델은 선택된 알파 값을 사용하여 덜 중요한 피처을 제외하고 L1 정규화를 적용하여 학습합니다. 예측하기: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

LassoLarsCV의 장점:

자동 알파 선택: LassoLarsCV는 교차 검증을 통해 최적의 하이퍼파라미터 알파를 자동으로 선택하므로 모델 튜닝이 간소화됩니다.

피처 선택: LassoLarsCV는 가장 중요한 피처을 자동으로 선택하고 모델의 크기를 줄입니다.

정규화: 이 메서드는 L1 정규화를 적용하여 과적합을 방지하고 모델의 일반화를 향상시킵니다.

LassoLarsCV의 한계:



선형 모델: LassoLarsCV는 선형 모델을 구축하므로 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

소음에 대한 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

계산의 복잡성: 각 단계에서 피처를 선택하고 정규화를 적용하려면 단순한 선형 회귀보다 더 많은 계산 리소스가 필요할 수 있습니다.

LassoLarsCV는 가장 중요한 피처을 선택하고 모델의 차원을 줄이고 과적합을 방지하고 모델의 하이퍼파라미터를 자동으로 조정하는 것이 필수적인 회귀 작업에 유용합니다.





2.1.11.1. 올가미LassoLarsCV 모델을 생성하고 float 및 double으로 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LassoLarsCV 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LassoLarsCV.py

# 이 코드는 LassoLars 모델을 학습하고 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

에서 sklearn.linear_model import LassoLarsCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LassoLarsCV"

onnx_model_filename = data_path + "lasso_lars_cv"



# LassoLarsCV 회귀 모델 만들기

lassolars_cv_regressor_model = LassoLarsCV(cv= 5 )



# 데이터에 모델 맞추기

lassolars_cv_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = lassolars_cv_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ("

"+model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lassolars_cv_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python LassoLarsCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python Python LassoLarsCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382640824089 Python Mean Absolute Error: 6.347737845846069 Python Mean Squared Error: 49.778142539016564 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642612767 Python Mean Absolute Error: 6.3477379221400145 Python Mean Squared Error: 49.77814017210321 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 14 Python double ONNX model precision: 16





그림 39. LassoLarsCV.py 결과(float ONNX)





2.1.11.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lasso_lars_cv_float.onnx 및 lasso_lars_cv_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여 줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsCV" #define ONNXFilenameFloat "lasso_lars_cv_float.onnx" #define ONNXFilenameDouble "lasso_lars_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

LassoLarsCV (EURUSD,H1) Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382640824089 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477378458460691 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781425390165566 LassoLarsCV (EURUSD,H1) LassoLarsCV (EURUSD,H1) Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) LassoLarsCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642612767 LassoLarsCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379221400145 LassoLarsCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401721031642

파이썬에서 원래 double 모델과 비교:

Testing ONNX float : LassoLarsCV (lasso_lars_cv_float.onnx) Python Mean Absolute Error: 6.347737 9221400145 MQL5: Mean Absolute Error: 6.347737 8458460691 Testing ONNX double : LassoLarsCV (lasso_lars_cv_double.onnx) Python Mean Absolute Error: 6.3477379221400145 MQL5: Mean Absolute Error: 6.3477379221400145

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 16자리.





2.1.11.3. lasso_lars_cv_float.onnx 및 lasso_lars_cv_double.onnx의 ONNX 표현









그림 40. 네트론에서 lasso_lars_cv_float.onnx의 ONNX 표현









그림 41. 네트론에서 lasso_lars_cv_double.onnx의 ONNX 표현







2.1.12. sklearn.linear_model.LassoLarsIC

LassoLarsIC는 올가미(최소 절대 축소 및 선택 연산자)와 정보 기준(IC)을 결합하여 최적의 피처 집합을 자동으로 선택하는 회귀 메서드입니다.



모델에 포함할 피처를 결정하기 위해 AIC(Akaike 정보 기준) 및 BIC(베이지안 정보 기준)와 같은 정보 기준을 활용하고 모델 계수를 추정하기 위해 L1 정규화를 적용합니다.



LassoLarsIC의 작동 원리:



입력 데이터: LassoCV는 피처(독립 변수) 및 해당 목표 변수 값을 포함한 원본 데이터 집합으로 시작합니다. 초기화: LassoLarsIC는 null 모델로 시작하며 이는 활성 피처가 없음을 의미합니다. 모든 계수는 0으로 설정됩니다. 정보 기준을 사용한 피처 선택: 이 메서드는 빈 모델에서 시작하여 점차적으로 모델에 피처을 통합하면서 다양한 피처 세트에 대한 정보 기준(예: AIC 또는 BIC)을 평가합니다. 정보 기준은 데이터 적합성과 모델 복잡성 간의 절충점을 고려하여 모델의 품질을 평가합니다. 최적의 피처 세트 선택: LassoLarsIC는 정보 기준이 최고의 가치를 달성하는 피처 세트를 선택합니다. 이 피처 세트는 모델에 포함됩니다. L1 정규화 적용: 선택한 피처에 L1 정규화가 적용되어 모델 계수 추정에 도움이 됩니다. 예측하기: 학습 후에는 이 모델을 사용하여 새로운 데이터의 목표 변수 값을 예측할 수 있습니다.

LassoLarsIC의 장점:



자동 피처 선택: LassoLarsIC는 최적의 피처 세트를 자동으로 선택하여 모델의 치수를 줄이고 과적합을 방지합니다.

정보 기준: 정보 기준을 사용하면 모델 품질과 복잡성의 균형을 맞출 수 있습니다.

정규화: 이 메서드는 L1 정규화를 적용하여 과적합을 방지하고 모델의 일반화를 향상시킵니다.

LassoLarsIC의 한계:



선형 모델: LassoLarsIC는 선형 모델을 구축하므로 복잡한 비선형 관계를 모델링하는 데 부족할 수 있습니다.

소음에 대한 민감도: 이 메서드는 데이터의 이상값에 민감할 수 있습니다.

계산의 복잡성: 다양한 피처 세트에 대한 정보 기준을 평가하려면 추가적인 컴퓨팅 리소스가 필요할 수 있습니다.

정보 기준에 따라 최적의 피처 집합을 자동으로 선택하고 모델의 차원을 줄이는 것이 중요한 회귀 작업에서 LassoLarsIC는 유용합니다.





2.1.12.1. LassoLarsIC 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LassoLarsIC 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LassoLarsIC.py

# 이 코드는 LassoLarsIC 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LassoLarsIC

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name= "LassoLarsIC"

onnx_model_filename = data_path + "lasso_lars_ic "



# LassoLarsIC 회귀 모델 만들기

lasso_lars_ic_regressor_model = LassoLarsIC(criterion= 'aic')



# 데이터에 모델 맞추기

lasso_lars_ic_regressor_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = lasso_lars_ic_regressor_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(lasso_lars_ic_regressor_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python LassoLarsIC Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python Python LassoLarsIC ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LassoLarsIC ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\lasso_lars_ic_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336425 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 15 Python double ONNX model precision: 15





그림 42. LassoLarsIC.py 결과(float ONNX)





2.1.12.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 lasso_lars_ic_float.onnx 및 lasso_lars_ic_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여 줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LassoLarsIC" #define ONNXFilenameFloat "lasso_lars_ic_float.onnx" #define ONNXFilenameDouble "lasso_lars_ic_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

LassoLarsIC (EURUSD,H1) Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LassoLarsIC (EURUSD,H1) LassoLarsIC (EURUSD,H1) Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) LassoLarsIC (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LassoLarsIC (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364302 LassoLarsIC (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : LassoLarsIC (lasso_lars_ic_float.onnx) Python Mean Absolute Error: 6.347737 926336425 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LassoLarsIC (lasso_lars_ic_double.onnx) Python Mean Absolute Error: 6.3477379263364 25 MQL5: Mean Absolute Error: 6.3477379263364 302

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 13자리.





2.1.12.3. lasso_lars_ic_float.onnx 및 lasso_lars_ic_double.onnx의 ONNX 표현









그림 43. 네트론에서 lasso_lars_ic_float.onnx의 ONNX 표현





그림 44. 네트론에서 lasso_lars_ic_double.onnx의 ONNX 표현













2.1.13. sklearn.linear_model.LinearRegression

LinearRegression은 머신 러닝에서 회귀 작업에 가장 간단하고 널리 사용되는 메서드 중 하나로



입력 피처의 선형 조합을 기반으로 대상 변수의 수치(연속형)를 예측하는 선형 모델을 구축하는 데 사용됩니다.



선형 회귀의 작동 원리:



선형 모델: 선형 회귀 모델은 독립 변수(피처)와 대상 변수 사이에 선형 관계가 있다고 가정합니다. 이 관계는 선형 회귀 방정식으로 표현할 수 있습니다: y = β₀ + β₁x₁ + β₂x₂ + ... + βₚxₚ에서 y는 목표 변수, β₀ -는 절편 계수, β₁, β₂, ... βₚ -는 피처 계수, x₁, x₂, ... xₚ는 피처 값입니다. 매개변수 추정: 선형 회귀의 목표는 데이터에 가장 잘 맞는 계수 β₀, β₁, β₂, ... βₚ를 추정하는 것입니다. 이는 일반적으로 실제 값과 예측 값의 제곱 차이의 합을 최소화하는 OLS(최소제곱법) 메서드를 사용하여 수행됩니다. 모델 평가: 선형 회귀 모델의 품질을 평가하기 위해 평균 제곱 오차(MSE), 결정 계수(R²) 등 다양한 메트릭이 사용됩니다.

선형 회귀의 장점:



단순성 및 해석 가능성: 선형 회귀는 해석하기 쉬운 간단한 메서드로 각 피처가 대상 변수에 미치는 영향을 분석할 수 있습니다.

빠른 훈련 및 예측 속도: 선형 회귀 모델은 학습 및 예측 속도가 빠르므로 대규모 데이터 세트에 적합합니다.

적용 가능성: 선형 회귀는 다양한 회귀 작업에 성공적으로 적용될 수 있습니다.

선형 회귀의 한계:



선형성: 이 메서드는 피처와 대상 변수 간의 관계에 선형성이 있다고 가정하므로 복잡한 비선형 종속성을 모델링하는 데 충분하지 않을 수 있습니다.

이상값에 대한 민감도: 선형 회귀는 데이터의 이상값에 민감하므로 모델의 품질에 영향을 줄 수 있습니다.

선형 회귀는 입력 피처의 선형 조합을 기반으로 대상 변수의 수치 값을 예측하기 위해 선형 모델을 구성하는 간단하고 널리 사용되는 회귀 메서드입니다. 선형 관계가 있는 문제나 모델 해석 가능성이 중요한 경우에 적합합니다.





2.1.13.1. LinearRegression 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.LinearRegression 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# LinearRegression.py

# 이 코드는 선형 회귀 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 프로세스를 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "LinearRegression"

onnx_model_filename = data_path + "linear_regression"



# 선형 회귀 모델 만들기

linear_model = LinearRegression()



# 데이터에 모델 맞추기

linear_model.fit(X, y)



# 전체 데이터 집합에 대한 값 예측

y_pred = linear_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(linear_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data ', marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(linear_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[0]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name +' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python LinearRegression Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python LinearRegression ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python LinearRegression ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\linear_regression_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림.45.LinearRegression.py 결과(float ONNX)





2.1.13.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 linear_regression_float.onnx 및 linear_regression_double.onnx를 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "LinearRegression" #define ONNXFilenameFloat "linear_regression_float.onnx" #define ONNXFilenameDouble "linear_regression_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

LinearRegression (EURUSD,H1) Testing ONNX float : LinearRegression (linear_regression_float.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 LinearRegression (EURUSD,H1) LinearRegression (EURUSD,H1) Testing ONNX double : LinearRegression (linear_regression_double.onnx) LinearRegression (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 LinearRegression (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 LinearRegression (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : LinearRegression (linear_regression_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : LinearRegression (linear_regression_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.





2.1.13.3. linear_regression_float.onnx 및 linear_regression_double.onnx의 ONNX 표현









그림 46. 네트론에서 linear_regression_float.onnx의 ONNX 표현













그림 47. 네트론에서 linear_regression_double.onnx의 ONNX 표현









Ridge 및 RidgeCV 메서드에 대한 참고 사항



Ridge와 RidgeCV는 Ridge 회귀의 정규화에 사용되는 머신 러닝의 두 가지 관련 메서드입니다. 이들은 유사한 기능을 공유하지만 사용법과 매개변수 튜닝에 차이가 있습니다.



Ridge (Ridge Regression)의 작동 원리:

Ridge는 L2 정규화와 관련된 회귀 메서드입니다. 즉 모델에서 최소화한 손실 함수에 제곱 계수(L2 norm)의 합을 더한다는 의미입니다. 이 추가 정규화 항은 모델 계수의 크기를 줄여 과적합을 방지하는 데 도움이 됩니다.

알파 매개변수 사용: Ridge 방식에서는 알파 매개변수(정규화 강도라고도 함)가 미리 설정되어 있으며 자동으로 변경되지 않습니다. 사용자는 데이터와 실험에 대한 지식을 바탕으로 적절한 알파 값을 선택해야 합니다. RidgeCV(Ridge 교차 검증)의 작동 원리:

RidgeCV는 교차 검증을 통해 알파 파라미터에 대한 최적의 값을 자동으로 선택하는 Ridge 메서드을 확장한 것입니다. 알파를 수동으로 설정하는 대신 RidgeCV는 다양한 알파 값을 반복하여 교차 검증에서 가장 우수한 성능을 제공하는 값을 선택합니다.

자동 튜닝의 장점: RidgeCV의 가장 큰 장점은 수동으로 조정할 필요 없이 최적의 알파 값을 자동으로 결정한다는 점입니다. 이렇게 하면 튜닝 프로세스가 더 편리해지고 알파 선택 시 발생할 수 있는 오류를 방지할 수 있습니다. Ridge와 RidgeCV의 주요 차이점은 Ridge는 사용자가 알파 파라미터 값을 명시적으로 지정해야 하는 반면 RidgeCV는 교차 검증을 통해 최적의 알파 값을 자동으로 찾아낸다는 점입니다. 일반적으로 많은 양의 데이터를 처리하고 수동 매개변수 조정을 피하고자 할 때는 RidgeCV가 더 선호됩니다.







2.1.14. sklearn.linear_model.Ridge

Ridge는 머신러닝에서 회귀 문제를 해결하기 위해 사용되는 회귀 메서드입니다. 선형 모델 제품군의 일부이며 정규화된 선형 회귀를 나타냅니다.



릿지 회귀의 주요 피처은 표준 최소자승법(OLS) 방식에 L2 정규화를 추가하는 것입니다.



릿지 회귀의 작동 방식:



선형 회귀: 일반 선형 회귀와 마찬가지로 릿지 회귀는 독립 변수(피처)와 목표 변수 사이의 선형 관계를 찾는 것을 목표로 합니다. L2 정규화: 릿지 회귀의 주요 차이점은 손실 함수에 L2 정규화를 추가하는 것입니다. 즉 회귀 계수의 값이 클 경우 실제 값과 예측 값의 제곱 차이의 합에 페널티가 추가됩니다. 페널티 계수: L2 정규화는 회귀 계수 값에 페널티를 부과합니다. 결과적으로 일부 계수는 0에 가까워지는 경향이 있어 과적합이 줄어들고 모델 안정성이 향상됩니다. 하이퍼파라미터 α: Ridge 회귀의 필수 파라미터 중 하나는 정규화 정도를 결정하는 하이퍼파라미터 α(알파)입니다. α 값이 높을수록 정규화가 강해져 계수 값이 낮은 더 단순한 모델이 생성됩니다.

Ridge 회귀의 장점:



과적합 감소: Ridge의 L2 정규화는 과적합을 줄여 데이터의 노이즈에 대해 모델을 더욱 견고하게 만듭니다.

다중 선형성 처리하기: 릿지 회귀는 특히 피처의 상관관계가 높은 경우 다중 선형성 문제에 잘 대처합니다.

차원의 저주 해결: Ridge는 OLS가 불안정할 수 있는 많은 피처에 있는 시나리오에 도움이 됩니다.

Ridge 회귀의 한계:



피처를 제거하지 않습니다: Ridge 회귀는 피처 계수를 0으로 만들지 않고 감소시킬 뿐이므로 일부 피처는 여전히 모델에 남아있을 수 있습니다.

최적의 α 선택: 하이퍼파라미터 α의 올바른 값을 선택하려면 교차 검증이 필요할 수 있습니다.

Ridge 회귀는 표준 선형 회귀에 L2 정규화를 도입하여 과적합을 줄이고 안정성을 높이며 다중공선성 문제를 해결하는 회귀 메서드입니다. 이 메서드는 정확도와 모델 안정성의 균형을 맞춰야 할 때 유용합니다.





2.1.14.1. Ridge 모델을 생성하고 float 및 double을 위해 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.Ridge 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# Ridge.py

# 이 코드는 Ridge 모델을 학습하고 이를 ONNX 형식(float 및 double)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

에서 sklearn.linear_model import Ridge

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "Ridge"

onnx_model_filename = data_path + "ridge"



# Ridge 모델 만들기

regression_model = Ridge()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+"_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print( "Mean Absolute Error:" , mae_onnx_float)

print( "Mean Squared Error:" , mse_onnx_float)

print( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel('X')

plt.ylabel('y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python Ridge Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python Python Ridge ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382634837793 Python Mean Absolute Error: 6.347684915729416 Python Mean Squared Error: 49.77815046053819 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python Ridge ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641178552 Python Mean Absolute Error: 6.347684462929819 Python Mean Squared Error: 49.77814206996523 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림 49. Ridge.py 결과(float ONNX)

2.1.14.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 ridge_float.onnx 및 ridge_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "Ridge" #define ONNXFilenameFloat "ridge_float.onnx" #define ONNXFilenameDouble "ridge_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

Ridge (EURUSD,H1) Testing ONNX float : Ridge (ridge_float.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382634837793 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476849157294160 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781504605381784 Ridge (EURUSD,H1) Ridge (EURUSD,H1) Testing ONNX double : Ridge (ridge_double.onnx) Ridge (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641178552 Ridge (EURUSD,H1) MQL5: Mean Absolute Error: 6.3476844629298235 Ridge (EURUSD,H1) MQL5: Mean Squared Error: 49.7781420699652131

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : Ridge (ridge_float.onnx) Python Mean Absolute Error: 6.347684 462929819 MQL5: Mean Absolute Error: 6.347684 9157294160 Testing ONNX double : Ridge (ridge_double.onnx) Python Mean Absolute Error: 6.3476844629298 19 MQL5: Mean Absolute Error: 6.3476844629298 235

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 13자리.







2.1.14.3. ridge_float.onnx와 ridge_double.onnx의 ONNX 표현





그림 50. 네트론에서 ridge_float.onnx의 ONNX 표현













그림 51. 넷트론에서 ridge_double.onnx의 ONNX 표현









2.1.15. sklearn.linear_model.RidgeCV

- Ridge 회귀의 정규화 정도를 결정하는 최상의 하이퍼파라미터 α(알파)의 자동 선택을 포함하는 Ridge 회귀의 확장 기능입니다. 하이퍼파라미터 α는 일반 선형 회귀에서와 같이 제곱 오차의 합을 최소화하는 것과 회귀 계수의 값을 최소화하는 것(정규화) 사이의 균형을 제어합니다. RidgeCV는 지정된 매개변수와 기준에 따라 α의 최적 값을 자동으로 선택합니다.



RidgeCV의 작동 방식:



데이터를 입력합니다: RidgeCV는 피처(독립 변수)과 목표 변수(연속형)로 구성된 입력 데이터를 받습니다. α를 선택합니다: Ridge 회귀를 사용하려면 정규화 정도를 결정하는 하이퍼파라미터 α를 선택해야 합니다. RidgeCV는 주어진 범위에서 α의 최적 값을 자동으로 선택합니다. 교차 검증: RidgeCV는 k-배 교차 검증과 같은 교차 검증을 사용하여 독립 데이터에 대해 어떤 α 값이 최상의 모델 일반화를 제공하는지 평가합니다. 최적의 α: 훈련 프로세스가 완료되면 RidgeCV는 교차 검증에서 최고의 성능을 제공하는 α 값을 선택하고 이 값을 사용하여 최종 Ridge 회귀 모델을 훈련합니다.

RidgeCV의 장점:



α 자동 선택: RidgeCV는 하이퍼파라미터 α의 최적값을 자동으로 선택할 수 있어 모델 튜닝 프로세스를 간소화합니다.

정규화와 성능 간의 균형: 이 메서드는 정규화(과적합 감소)와 모델 성능 간의 최적의 균형을 찾는 데 도움이 됩니다.

RidgeCV의 한계:



계산의 복잡성: 교차 검증에는 특히 큰 범위의 α 값을 사용하는 경우 상당한 계산 리소스가 필요할 수 있습니다.

RidgeCV는 교차 검증을 사용하여 최적의 하이퍼파라미터 α를 자동으로 선택하는 Ridge 회귀 메서드입니다. 이 메서드를 사용하면 하이퍼파라미터 선택 프로세스를 간소화하고 정규화와 모델 성능 간에 최적의 균형을 찾을 수 있습니다.





2.1.15.1. RidgeCV 모델을 생성하고 float 및 double을 위해 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.RidgeCV 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# RidgeCV.py

# 이 코드는 RidgeCV 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

dot_position1 == -1 또는 dot_position2 == -1:

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range (1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

에서 sklearn.linear_model import RidgeCV

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RidgeCV"

onnx_model_filename = data_path + "ridge_cv"



# RidgeCV 모델 생성

regression_model = RidgeCV()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print (f"{i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python RidgeCV Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python Python RidgeCV ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499108485 Python Mean Absolute Error: 6.3472036427935485 Python Mean Squared Error: 49.77833006785168 Python R^ 2 matching decimal places: 11 Python MAE matching decimal places: 6 Python MSE matching decimal places: 4 Python float ONNX model precision: 6 Python Python RidgeCV ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ridge_cv_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382499160807 Python Mean Absolute Error: 6.34720334999352 Python Mean Squared Error: 49.77832999861571 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





그림 52. RidgeCV.py 결과(float ONNX)





2.1.15.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 ridge_cv_float.onnx 및 ridge_cv_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RidgeCV" #define ONNXFilenameFloat "ridge_cv_float.onnx" #define ONNXFilenameDouble "ridge_cv_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

RidgeCV (EURUSD,H1) Testing ONNX float : RidgeCV (ridge_cv_float.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499108485 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472036427935485 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783300678516909 RidgeCV (EURUSD,H1) RidgeCV (EURUSD,H1) Testing ONNX double : RidgeCV (ridge_cv_double.onnx) RidgeCV (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382499160807 RidgeCV (EURUSD,H1) MQL5: Mean Absolute Error: 6.3472033499935216 RidgeCV (EURUSD,H1) MQL5: Mean Squared Error: 49.7783299986157246

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : RidgeCV (ridge_cv_float.onnx) Python Mean Absolute Error: 6.347203 34999352 MQL5: Mean Absolute Error: 6.347203 6427935485 Testing ONNX double : RidgeCV (ridge_cv_double.onnx) Python Mean Absolute Error: 6.34720334999352 MQL5: Mean Absolute Error: 6.34720334999352 16

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.





2.1.15.3. ridge_cv_float.onnx 및 ridge_cv_double.onnx의 ONNX 표현









그림 53. 네트론에서 ridge_cv_float.onnx의 ONNX 표현









그림 54. 네트론에서 ridge_cv_double.onnx의 ONNX 표현







2.1.16. sklearn.linear_model.OrthogonalMatchingPursuit

OrthogonalMatchingPursuit (OMP)는 피처 선택 및 선형 회귀 문제를 해결하는 데 사용되는 알고리즘입니다.



가장 중요한 피처을 선택하는 메서드 중 하나로 데이터 차원을 줄이고 모델의 일반화 능력을 향상시키는 데 도움이 될 수 있습니다.



OrthogonalMatchingPursuit 작동 방식:



데이터를 입력합니다: 피처(독립 변수)와 대상 변수(연속형)의 값을 포함하는 데이터 집합으로 시작합니다. 피처 수 선택하기: OrthogonalMatchingPursuit를 사용할 때 초기 단계 중 하나는 모델에 포함할 피처의 수를 결정하는 것입니다. 이 숫자는 미리 정의하거나 AIC(Akaike 정보 기준) 또는 최소 오류 기준과 같은 기준을 사용하여 선택할 수 있습니다. 반복 피처 추가: 알고리즘은 빈 모델에서 시작하여 모델의 잔여값을 가장 잘 설명하는 피처를 반복적으로 추가합니다. 각 반복에서 이전에 선택한 피처에 직교하도록 새 피처가 선택됩니다. 최적의 피처는 모델 잔차와의 상관관계를 기반으로 선택됩니다. 모델 훈련: 지정된 수의 피처를 추가하면 선택한 피처만 고려하여 모델을 데이터에 대해 학습시킵니다. 예측하기: 학습 후 모델은 새로운 데이터에 대한 목표 변수의 값을 예측할 수 있습니다.

OrthogonalMatchingPursuit의 장점:



차원 축소: OMP는 가장 유익한 피처만 선택하여 데이터 차원을 줄일 수 있습니다.

해석 가능성: OMP는 소수의 피처만 선택하기 때문에 이를 사용하여 만든 모델을 더 쉽게 해석할 수 있습니다.

OrthogonalMatchingPursuit의 한계:



선택한 피처의 수에 대한 민감도입니다: 선택한 피처의 개수를 적절히 조정해야 하며 잘못 선택하면 과적합 또는 과소적합이 발생할 수 있습니다.

다중 선형성을 고려하지 않습니다: OMP는 피처 간의 다중 선형성을 고려하지 않을 수 있으므로 최적의 피처 선택에 영향을 미칠 수 있습니다.

계산의 복잡성: OMP는 특히 대규모 데이터 세트의 경우 계산 비용이 많이 듭니다.

OrthogonalMatchingPursuit는 피처 선택 및 선형 회귀를 위한 알고리즘으로 모델에 가장 유익한 피처를 선택할 수 있게 해줍니다. 이 메서드는 데이터 차원을 줄이고 모델 해석 가능성을 개선하는 데 유용할 수 있습니다.





2.1.16.1. OrthogonalMatchingPursuit 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드입니다.

이 코드는 OrthogonalMatchingPursuit 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# OrthogonalMatchingPursuit.py

# 이 코드는 OrthogonalMatchingPursuit 모델을 훈련하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str(value1)

str_value2 = str(value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import OrthogonalMatchingPursuit

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "OrthogonalMatchingPursuit"

onnx_model_filename = data_path + "orthogonal_matching_pursuit"



# OrthogonalMatchingPursuit 모델 만들기

regression_model = OrthogonalMatchingPursuit()



# 데이터에 모델 맞추기

regression_model.fit(X, y)



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python OrthogonalMatchingPursuit Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python Python OrthogonalMatchingPursuit ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python OrthogonalMatchingPursuit ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\orthogonal_matching_pursuit_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.3477379263364275 Python Mean Squared Error: 49.778140171281784 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 15 Python double ONNX model precision: 16





그림 55. OrthogonalMatchingPursuit.py의 결과 (float ONNX)



2.1.16.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 orthogonal_matching_pursuit_float.onnx 및 orthogonal_matching_pursuit_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여 줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "OrthogonalMatchingPursuit" #define ONNXFilenameFloat "orthogonal_matching_pursuit_float.onnx" #define ONNXFilenameDouble "orthogonal_matching_pursuit_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 OrthogonalMatchingPursuit (EURUSD,H1) OrthogonalMatchingPursuit (EURUSD,H1) Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) OrthogonalMatchingPursuit (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364275 OrthogonalMatchingPursuit (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_float.onnx) Python Mean Absolute Error: 6.347737 9263364275 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : OrthogonalMatchingPursuit (orthogonal_matching_pursuit_double.onnx) Python Mean Absolute Error: 6.3477379263364275 MQL5: Mean Absolute Error: 6.3477379263364275

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 16자리.





2.1.16.3. orthogonal_matching_pursuit_float.onnx 및 orthogonal_matching_pursuit_double.onnx의 ONNX 표현









그림 56. 네트론에서 orthogonal_matching_pursuit_float.onnx의 ONNX 표현













그림 57. 네트론에서 orthogonal_matching_pursuit_double.onnx의 ONNX 표현





2.1.17. sklearn.linear_model.PassiveAggressiveRegressor

PassiveAggressiveRegressor는 회귀 작업에 사용되는 머신 러닝 메서드입니다.



이 메서드는 대상 변수의 연속적인 값을 예측할 수 있는 모델을 학습시키는 데 사용할 수 있는 Passive-Aggressive(PA) 알고리즘의 변형입니다.



PassiveAggressiveRegressor의 작동 방식:



데이터를 입력합니다: 피처(독립 변수)와 대상 변수(연속형)의 값으로 구성된 데이터 집합으로 시작합니다. 지도 학습: PassiveAggressiveRegressor는 쌍(X, y)으로 훈련된 지도 학습 메서드로 여기서 X는 피처를 나타내고 Y는 목표 변수 값에 해당합니다. 적응형 학습: PassiveAggressiveRegressor 메서드의 기본 개념은 적응형 학습 접근 방식입니다. 모델은 각 학습 예제에서 예측 오류를 최소화하여 학습합니다. 예측 오차를 줄이기 위해 가중치를 수정하여 업데이트합니다. 파라미터 C: 모델에는 오류에 적응하는 정도를 제어하는 하이퍼파라미터 C가 PassiveAggressiveRegressor에 있습니다. C 값이 높을수록 가중치 업데이트가 더 공격적으로 이루어지며 C 값이 낮을수록 모델이 덜 공격적으로 업데이트됩니다. 예측: 학습이 완료된 모델은 새로운 데이터에 대한 목표 변수 값을 예측할 수 있습니다.

PassiveAggressiveRegressor의 장점:



적응력: 이 메서드는 데이터의 변화에 적응하고 모델을 업데이트하여 예측 오류를 최소화할 수 있습니다.

대규모 데이터 세트의 효율성: 특히 상당한 양의 데이터로 학습할 경우 PassiveAggressiveRegressor는 회귀에 효과적인 메서드가 될 수 있습니다.

PassiveAggressiveRegressor의 한계:



매개변수 선택에 대한 민감도 C: C 값을 올바르게 선택하려면 튜닝과 실험이 필요할 수 있습니다.

추가 피처가 필요할 수 있습니다: 경우에 따라 성공적인 모델 학습을 위해 추가로 맞춘 피처가 필요할 수 있습니다.

PassiveAggressiveRegressor는 학습 데이터의 예측 오류를 최소화하여 적응적으로 학습하는 회귀 작업용 머신러닝 메서드입니다. 이 메서드는 대규모 데이터 세트를 처리하는 데 유용할 수 있으며 최적의 성능을 위해 C 매개변수를 조정해야 합니다.





2.1.17.1. float 및 double용PassiveAgressiveRegressor 모델을 생성하고 이를 ONNX로 내보내기 위한 코드

이 코드는 PassiveAggressiveRegressor 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# PassiveAggressiveRegressor.py

# 이 코드는 수동 공격적 회귀 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == -1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range( 1 , min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import PassiveAggressiveRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[0:last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "PassiveAggressiveRegressor"

onnx_model_filename = data_path + "passive_aggressive_regressor"



# PassiveAggressiveRegressor 모델 만들기

regression_model = PassiveAgressiveRegressor()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input' , FloatTensorType([None, X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data', marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red ', label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python PassiveAggressiveRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python Python PassiveAggressiveRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376801868329 Python Mean Absolute Error: 9.645248834431873 Python Mean Squared Error: 139.76862616640122 Python R^ 2 matching decimal places: 8 Python MAE matching decimal places: 5 Python MSE matching decimal places: 3 Python float ONNX model precision: 5 Python Python PassiveAggressiveRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\passive_aggressive_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9894376841493092 Python Mean Absolute Error: 9.64524669506544 Python Mean Squared Error: 139.76857373191007 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 14 Python MSE matching decimal places: 14 Python double ONNX model precision: 14





그림 58. PassiveAggressiveRegressor.py의 결과(더블 ONNX)



2.1.17.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 passive_aggressive_regressor_float.onnx 및 passive_aggressive_regressor_double. onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여 줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "PassiveAggressiveRegressor" #define ONNXFilenameFloat "passive_aggressive_regressor_float.onnx" #define ONNXFilenameDouble "passive_aggressive_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376801868329 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452488344318716 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7686261664012761 PassiveAggressiveRegressor (EURUSD,H1) PassiveAggressiveRegressor (EURUSD,H1) Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) PassiveAggressiveRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9894376841493092 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 9.6452466950654419 PassiveAggressiveRegressor (EURUSD,H1) MQL5: Mean Squared Error: 139.7685737319100667

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : PassiveAggressiveRegressor (passive_aggressive_regressor_float.onnx) Python Mean Absolute Error: 9.64524 669506544 MQL5: Mean Absolute Error: 9.64524 88344318716 Testing ONNX double : PassiveAggressiveRegressor (passive_aggressive_regressor_double.onnx) Python Mean Absolute Error: 9.64524669506544 MQL5: Mean Absolute Error: 9.64524669506544 19

ONNX float MAE의 정확도: 소수점 이하 5자리, 정확도 ONNX 더블 MAE: 소수점 이하 14자리.





2.1.17.3. passive_aggressive_regressor_float.onnx 및 passive_aggressive_regressor_double.onnx의 ONNX 표현









그림 59. passive_aggressive_regressor_float.onnx의 ONNX 표현













그림 60. 네트론에서 passive_aggressive_regressor_double.onnx의 ONNX 표현







2.1.18. sklearn.linear_model.QuantileRegressor

QuantileRegressor은 회귀 작업에서 대상 변수의 사분위수(특정 백분위수)를 추정하는 데 사용되는 머신 러닝 메서드입니다.



회귀 작업에서 일반적으로 수행되는 것처럼 대상 변수의 평균값을 예측하는 대신 QuantileRegressor는 중앙값(50번째 백분위수) 또는 25번째 및 75번째 백분위수와 같이 지정된 사분위수에 해당하는 값을 예측합니다.



QuantileRegressor 작동 방식:



데이터를 입력합니다: 피처(독립 변수)와 대상 변수(연속형)가 포함된 데이터 집합으로 시작합니다. 사분위수 초점: 대상 변수의 정확한 값을 예측하는 대신 QuantileRegressor는 대상 변수의 조건부 분포를 모델링하고 이 분포의 특정 사분위수에 대한 값을 예측합니다. 다양한 분위수에 대한 훈련: 사분위수 회귀 모델을 훈련하려면 원하는 각 사분위수에 대해 별도의 모델을 훈련해야 합니다. 이러한 각 모델은 해당 사분위수에 해당하는 값을 예측합니다. 사분위수 매개변수입니다: 이 메서드의 주요 매개 변수는 예측을 얻고자 하는 사분위수를 선택하는 것입니다. 예를 들어 중앙값에 대한 예측이 필요한 경우 50번째 백분위수를 기준으로 모델을 학습시켜야 합니다. 사분위수 예측: 학습 후 모델을 사용하여 새 데이터에서 지정된 사분위수에 해당하는 값을 예측할 수 있습니다.

QuantileRegressor의 장점:



유연성: QuantileRegressor는 다양한 사분위수를 예측할 수 있는 유연성을 제공하므로 분포의 다양한 백분위수가 중요한 작업에 유용할 수 있습니다.

이상값에 대한 견고성: 사분위수에 근거한 접근 방식은 극단값의 영향을 많이 받을 수 있는 평균을 고려하지 않기 때문에 이상값에 대해 강력할 수 있습니다.

QuantileRegressor의 한계:



사분위수의 선택이 필요합니다: 최적의 사분위수를 선택하려면 하고자 하는 작업이 무엇인지에 대한 지식이 필요할 수 있습니다.

계산 복잡성 증가: 서로 다른 사분위수에 대해 별도의 모델을 학습하면 작업의 계산 복잡성이 증가할 수 있습니다.

QuantileRegressor는 대상 변수의 지정된 사분위수에 해당하는 값을 예측하도록 설계된 머신 러닝 메서드입니다. 이 메서드는 분포의 다양한 백분위수가 중요한 작업이나 데이터에 이상값이 포함될 수 있는 경우에 유용할 수 있습니다.





2.1.18.1. QuantileRegressor 모델을 생성하고 float 및 double용 ONNX로 내보내는 코드

이 코드는 sklearn.linear_model.QuantileRegressor 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# QuantileRegressor.py

# 이 코드는 QuantileRegressor 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == -1 or dot_position2 == -1:

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import QuantileRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv[0]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[ 0 :last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "QuantileRegressor"

onnx_model_filename = data_path + "quantile_regressor"



# QuantileRegressor 모델 만들기

regression_model = QuantileRegressor(solver= 'highs ')



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float) ")

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data', marker='o')

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset=12)



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python QuantileRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python Python QuantileRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915739158818 Python Mean Absolute Error: 6.3693091422201125 Python Mean Squared Error: 53.042533910812814 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 7 Python MSE matching decimal places: 5 Python float ONNX model precision: 7 Python Python QuantileRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\quantile_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9959915738839231 Python Mean Absolute Error: 6.3693091850025185 Python Mean Squared Error: 53.0425343337143 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 16 Python MSE matching decimal places: 13 Python double ONNX model precision: 16





그림 61. QuantileRegressor.py의 결과(float ONNX)





2.1.18.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 quantile_regressor_float.onnx 및 quantile_regressor_double.onnx를 실행하여 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "QuantileRegressor" #define ONNXFilenameFloat "quantile_regressor_float.onnx" #define ONNXFilenameDouble "quantile_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

QuantileRegressor (EURUSD,H1) Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915739158818 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091422201169 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425339108128071 QuantileRegressor (EURUSD,H1) QuantileRegressor (EURUSD,H1) Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) QuantileRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9959915738839231 QuantileRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3693091850025185 QuantileRegressor (EURUSD,H1) MQL5: Mean Squared Error: 53.0425343337142721

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : QuantileRegressor (quantile_regressor_float.onnx) Python Mean Absolute Error: 6.3693091 850025185 MQL5: Mean Absolute Error: 6.3693091 422201169 Testing ONNX double : QuantileRegressor (quantile_regressor_double.onnx) Python Mean Absolute Error: 6.3693091850025185 MQL5: Mean Absolute Error: 6.3693091850025185

ONNX float MAE의 정확도: 소수점 이하 7자리, ONNX 더블 MAE의 정확도: 소수점 이하 16자리.





2.1.18.3. quantile_regressor_float.onnx 및 quantile_regressor_double.onnx의 ONNX 표현









그림 62. 네트론에서 quantile_regressor_float.onnx의 ONNX 표현





그림 63. 네트론에서 quantile_regressor_double.onnx의 ONNX 표현







2.1.19. sklearn.linear_model.RANSACRegressor

RANSACRegressor은 RANSAC(무작위 표본 합의) 메서드을 사용하여 회귀 문제를 해결하는 데 사용되는 머신 러닝 메서드입니다.



RANSAC 메서드은 이상값이나 불완전성이 포함된 데이터를 처리하도록 설계되어 이상값의 영향을 배제함으로써 보다 강력한 회귀 모델을 만들 수 있습니다.



RANSACRegressor의 작동 방식:



데이터를 입력합니다: 피처(독립 변수)와 대상 변수(연속형)가 포함된 데이터 집합으로 시작합니다. 무작위 하위 집합 선택: RANSAC은 회귀 모델을 훈련하는 데 사용되는 데이터의 무작위 하위 집합을 선택하는 것으로 시작합니다. 이러한 하위 집합을 "가설"이라고 합니다. 가설에 모델 맞추기: 선택한 각 가설에 대해 회귀 모델이 학습됩니다. RANSACRegressor의 경우 일반적으로 선형 회귀가 사용되며 모델은 데이터의 하위 집합에 맞춰집니다. 이상값 평가: 모델을 학습한 후 모든 데이터에 대한 적합도를 평가합니다. 예측값과 실제값 사이의 오차는 각 데이터 포인트에 대해 계산됩니다. 이상값 식별: 지정된 임계값을 초과하는 오류가 있는 데이터 요소는 이상값으로 간주됩니다. 이러한 이상값은 모델 학습에 영향을 미치고 결과를 왜곡할 수 있습니다. 모델 업데이트: 이상값으로 간주되지 않는 모든 데이터 포인트는 회귀 모델을 업데이트하는 데 사용됩니다. 이 과정은 다른 무작위 가설을 사용하여 여러 번 반복될 수 있습니다. 최종 모델: 여러 번 반복한 후 RANSACRegressor는 데이터 하위 집합에서 학습된 최상의 모델을 선택하고 이를 최종 회귀 모델로 반환합니다.

RANSACRegressor의 장점:



이상값 견고성: RANSACRegressor는 이상값을 학습에서 제외하기 때문에 이상값에 대한 강력한 메서드입니다.

강력한 회귀: 이 메서드를 사용하면 데이터에 이상값이나 불완전성이 있는 경우 보다 신뢰할 수 있는 회귀 모델을 만들 수 있습니다.

RANSACRegressor의 한계:



오류 임계값에 대한 민감도: 이상값으로 간주되는 지점을 결정하기 위해 오류 임계값을 선택하려면 실험이 필요할 수 있습니다.

가설 선택의 복잡성: 초기 단계에서 좋은 가설을 선택하는 것은 쉬운 일이 아닐 것입니다.

RANSACRegressor는 RANSAC 메서드를 기반으로 회귀 문제에 사용되는 머신 러닝 메서드입니다. 이 메서드를 사용하면 데이터에 이상값이나 불완전성이 있는 경우 모델에 미치는 영향을 배제하여 보다 강력한 회귀 모델을 만들 수 있습니다.





2.1.19.1. RANSACRegressor 모델을 생성하고 float 및 double용 ONNX로 내보내기 위한 코드

이 코드는 sklearn.linear_model.RANSACRegressor 모델을 생성하고 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# RANSACRegressor.py

# 이 코드는 RANSACRegressor 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여 줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str (value1)

str_value2 = str (value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len (str_value1) - dot_position1 - 1

decimal_places2 = len (str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range ( 1 , min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import RANSACRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

from skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv[0]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[0:last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange(0,100,1).reshape(- 1 , 1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "RANSACRegressor"

onnx_model_filename = data_path + "ransac_regressor"



# RANSACRegressor 모델 만들기

regression_model = RANSACRegressor()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [( 'float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_onnx_f loat)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "ONNX: MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ("Information about output tensors in ONNX:")

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1}. Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=(8, 5))

# 원본 데이터와 회귀선을 그림으로 표시합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:

Python RANSACRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python Python RANSACRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382641628886 Python Mean Absolute Error: 6.3477377671679385 Python Mean Squared Error: 49.77814147404787 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python ONNX: MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python RANSACRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\ransac_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962382642613388 Python Mean Absolute Error: 6.347737926336427 Python Mean Squared Error: 49.77814017128179 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림 64. RANSACRegressor.py의 결과(float ONNX)





2.1.19.2. ONNX 모델 실행을 위한 MQL5 코드

이 코드는 저장된 ransac_regressor_float.onnx 및 ransac_regressor_double.onnx 모델을 실행하고 MQL5에서 회귀 메트릭을 사용하는 것을 보여줍니다.

#property copyright "Copyright 2023, MetaQuotes Ltd." #property link "https://www.mql5.com" #property version "1.00" #define ModelName "RANSACRegressor" #define ONNXFilenameFloat "ransac_regressor_float.onnx" #define ONNXFilenameDouble "ransac_regressor_double.onnx" #resource ONNXFilenameFloat as const uchar ExtModelFloat[]; #resource ONNXFilenameDouble as const uchar ExtModelDouble[]; #define TestFloatModel 1 #define TestDoubleModel 2 bool RunModelFloat( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); float input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=( float )input_vector[k]; float output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool RunModelDouble( long model, vector &input_vector, vector &output_vector) { ulong batch_size=input_vector.Size(); if (batch_size== 0 ) return ( false ); output_vector.Resize(( int )batch_size); double input_data[]; ArrayResize (input_data,( int )batch_size); ulong input_shape[]= {batch_size, 1 }; OnnxSetInputShape (model, 0 ,input_shape); for ( int k= 0 ; k<( int )batch_size; k++) input_data[k]=input_vector[k]; double output_data[]; ArrayResize (output_data,( int )batch_size); ulong output_shape[]= {batch_size, 1 }; OnnxSetOutputShape (model, 0 ,output_shape); bool res= OnnxRun (model, ONNX_DEBUG_LOGS ,input_data,output_data); if (res) { for ( int k= 0 ; k<( int )batch_size; k++) output_vector[k]=output_data[k]; } return (res); } bool GenerateData( const int n, vector &x, vector &y) { if (n<= 0 ) return ( false ); x.Resize(n); y.Resize(n); for ( int i= 0 ; i<n; i++) { x[i]=( double ) 1.0 *i; y[i]=( double )( 4 *x[i] + 10 * sin (x[i]* 0.5 )); } return ( true ); } bool TestRegressionModel( const string model_name, const int model_type) { long model= INVALID_HANDLE ; ulong flags= ONNX_DEFAULT ; if (model_type==TestFloatModel) { PrintFormat ( "

Testing ONNX float: %s (%s)" ,model_name,ONNXFilenameFloat); model= OnnxCreateFromBuffer (ExtModelFloat,flags); } else if (model_type==TestDoubleModel) { PrintFormat ( "

Testing ONNX double: %s (%s)" ,model_name,ONNXFilenameDouble); model= OnnxCreateFromBuffer (ExtModelDouble,flags); } else { PrintFormat ( "Model type is not incorrect." ); return ( false ); } if (model== INVALID_HANDLE ) { PrintFormat ( "model_name=%s OnnxCreate error %d" ,model_name, GetLastError ()); return ( false ); } vector x_values= {}; vector y_true= {}; vector y_predicted= {}; int n= 100 ; GenerateData(n,x_values,y_true); bool run_result= false ; if (model_type==TestFloatModel) { run_result=RunModelFloat(model,x_values,y_predicted); } else if (model_type==TestDoubleModel) { run_result=RunModelDouble(model,x_values,y_predicted); } if (run_result) { PrintFormat ( "MQL5: R-Squared (Coefficient of determination): %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_R2 )); PrintFormat ( "MQL5: Mean Absolute Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MAE )); PrintFormat ( "MQL5: Mean Squared Error: %.16f" ,y_predicted.RegressionMetric(y_true, REGRESSION_MSE )); } else PrintFormat ( "Error %d" , GetLastError ()); OnnxRelease (model); return ( true ); } int OnStart ( void ) { TestRegressionModel(ModelName,TestFloatModel); TestRegressionModel(ModelName,TestDoubleModel); return ( 0 ); }

출력:

RANSACRegressor (EURUSD,H1) Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382641628886 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477377671679385 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781414740478638 RANSACRegressor (EURUSD,H1) RANSACRegressor (EURUSD,H1) Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) RANSACRegressor (EURUSD,H1) MQL5: R-Squared (Coefficient of determination): 0.9962382642613388 RANSACRegressor (EURUSD,H1) MQL5: Mean Absolute Error: 6.3477379263364266 RANSACRegressor (EURUSD,H1) MQL5: Mean Squared Error: 49.7781401712817768

파이썬의 원래 배정밀도 모델과 비교:

Testing ONNX float : RANSACRegressor (ransac_regressor_float.onnx) Python Mean Absolute Error: 6.347737 926336427 MQL5: Mean Absolute Error: 6.347737 7671679385 Testing ONNX double : RANSACRegressor (ransac_regressor_double.onnx) Python Mean Absolute Error: 6.34773792633642 7 MQL5: Mean Absolute Error: 6.34773792633642 66

ONNX float MAE의 정확도: 소수점 이하 6자리, 정확도 ONNX double MAE: 소수점 이하 14자리.





2.1.19.3. ransac_regressor_float.onnx 및 ransac_regressor_double.onnx의 ONNX 표현









그림 65. 넷트론에서 ransac_regressor_float.onnx의 ONNX 표현





그림 66. 네트론에서 ransac_regressor_double.onnx의 ONNX 표현











2.1.20. sklearn.linear_model.TheilSenRegressor

Theil-Sen 회귀(Theil-Sen 추정기)는 독립 변수와 목표 변수 간의 선형 관계를 추정하는 데 사용되는 회귀 추정 메서드입니다.



데이터에 이상값과 노이즈가 있는 경우 일반 선형 회귀에 비해 더 강력한 추정치를 제공합니다.



Theil-Sen 회귀의 작동 방식:



포인트 선택: 처음에 Theil-Sen은 학습 데이터 세트에서 무작위 데이터 포인트 쌍을 선택합니다. 기울기 계산: 각 데이터 포인트 쌍에 대해 이 메서드는 해당 포인트를 통과하는 선의 기울기를 계산하여 기울기 집합을 생성합니다. 중앙값 기울기: 그런 다음 이 메서드는 기울기 집합에서 중앙값 기울기를 찾습니다. 이 중앙값 기울기는 선형 회귀 기울기의 추정치로 사용됩니다. 중앙값 편차: 이 메서드는 각 데이터 포인트에 대해 편차(실제 값과 중앙값 기울기를 기준으로 예측한 값의 차이)를 계산하고 이러한 편차의 중앙값을 찾습니다. 이렇게 하면 선형 회귀 절편 계수에 대한 추정치가 생성됩니다. 최종 추정치: 기울기 및 절편 계수의 최종 추정치는 선형 회귀 모델을 구축하는 데 사용됩니다.

Theil-Sen 회귀의 장점:



이상값 복원력: Theil-Sen 회귀는 일반 선형 회귀에 비해 이상값과 데이터 노이즈에 대해 더 강력합니다.

덜 엄격한 가정: 이 메서드는 데이터 분포나 종속성 형태에 대한 엄격한 가정이 필요하지 않으므로 더 다양한 용도로 사용될 수 있습니다.

다중 선형 데이터에 적합합니다: Theil-Sen 회귀는 독립 변수의 상관 관계가 높은 데이터(다중 공선성 문제)에서 잘 작동합니다.

Theil-Sen 회귀의 한계:



계산의 복잡성: 모든 데이터 포인트 쌍에 대한 중앙값 기울기를 계산하는 것은 특히 대규모 데이터 집합의 경우 시간이 많이 걸릴 수 있습니다.

인터셉트 계수 추정: 중앙값 편차는 절편 계수를 추정하는 데 사용되며 이상값이 있을 경우에는 편향이 발생할 수 있습니다.

Theil-Sen 회귀분석은 특히 이상값과 데이터 노이즈가 있는 경우 독립변수와 목표 변수 간의 선형 관계를 안정적으로 평가할 수 있는 회귀 추정 메서드입니다. 이 메서드는 실제 데이터 조건에서 안정적인 추정치가 필요할 때 유용합니다.





2.1.20.1. TheilSenRegressor를 생성하고 float 및 double용 ONNX로 내보내는 코드

이 코드는 sklearn.linear_model.TheilSenRegressor 모델을 생성하고, 합성 데이터로 학습시키고 모델을 ONNX 형식으로 저장하고 플로트 및 더블 입력 데이터를 모두 사용하여 예측을 수행합니다. 또한 원본 모델과 ONNX로 내보낸 모델 모두의 정확도를 평가합니다.

# TheilSenRegressor.py

# 이 코드는 TheilSenRegressor 모델을 학습하고 이를 ONNX 형식(float 및 double 모두)으로 내보내고 ONNX 모델을 사용하여 예측하는 과정을 보여줍니다.

# Copyright 2023, MetaQuotes Ltd.

# https://www.mql5.com



# 소수점 이하 자릿수를 비교학 위한 함수

def compare_decimal_places (value1, value2):

# 두 값을 모두 문자열로 변환

str_value1 = str(value1)

str_value2 = str(value2)



# 문자열에서 소수점 위치 찾기

dot_position1 = str_value1.find( ".")

dot_position2 = str_value2.find( ".")



# 값 중 소수점이 없는 경우 0을 반환합니다.

if dot_position1 == - 1 or dot_position2 == - 1 :

return 0



# 소수점 이하 자릿수 계산

decimal_places1 = len(str_value1) - dot_position1 - 1

decimal_places2 = len(str_value2) - dot_position2 - 1



# 소수점 이하 두 자리 수 중 최소값 찾기

min_decimal_places = min(decimal_places1, decimal_places2)



# 소수점 이하 자릿수가 일치하도록 카운트를 초기화

matching_count = 0



# 소수점 이하 문자 비교

for i in range(1, min_decimal_places + 1 ):

if str_value1[dot_position1 + i] == str_value2[dot_position2 + i]:

matching_count += 1

else :

break



return matching_count



# 필요한 라이브러리 가져오기

import numpy as np

import matplotlib.pyplot as plt

에서 sklearn.linear_model import TheilSenRegressor

from sklearn.metrics import r2_score,mean_absolute_error,mean_squared_error

import onnx

import onnxruntime as ort

from skl2onnx import convert_sklearn

에서 skl2onnx.common.data_types import FloatTensorType

from skl2onnx.common.data_types import DoubleTensorType

from sys import argv



# 모델 저장 경로를 정의합니다.

data_path = argv [0 ]

last_index = data_path.rfind( "\\") + 1

data_path = data_path[0:last_index]



# 회귀를 위한 합성 데이터 생성

X = np.arange (0 ,100 ,1 ).reshape( -1 ,1 )

y = 4 *X + 10 *np.sin(X* 0.5 )



model_name = "TheilSenRegressor"

onnx_model_filename = data_path + "theil_sen_regressor"



# TheilSen 회귀 모델 만들기

regression_model = TheilSenRegressor()



# 데이터에 모델 맞추기

regression_model.fit(X, y.ravel())



# 전체 데이터 집합에 대한 값 예측

y_pred = regression_model.predict(X)



# 모델의 성능 평가

r2 = r2_score(y, y_pred)

MSE = MEAN_SQUARE_ERROR(Y, Y_PED)

MAE = MEAN_ABSOLUTE_ERROR(Y, Y_PED)



print ( "

" +model_name+ " Original model (double)" )

print ( "R-squared (Coefficient of determination):" , r2)

print ( "Mean Absolute Error:" , mae)

print ( "Mean Squared Error:" , mse)



# ONNX 모델로 변환 (float)

# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = [('float_input', FloatTensorType([ None , X.shape [1 ]])]]



# 모델을 ONNX 형식으로 내보내기

onnx_model_float = convert_sklearn(regression_model, initial_types=initial_type_float, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_float.onnx"

onnx.save_model(onnx_model_float, onnx_filename)



print ( "

" +model_name+ " ONNX model (float)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[0].name

output_name = onnx_session.get_outputs()[0].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 FloatTensorType으로 정의합니다.

initial_type_float = X.astype(np.float32)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_float = onnx_session.run([output_name], {input_name: initial_type_float})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_float = r2_score(y, y_pred_onnx_float)

mse_onnx_float = mean_squared_error(y, y_pred_onnx_float)

mae_onnx_float = mean_absolute_error(y, y_pred_onnx_float)

print ( "R-squared (Coefficient of determination)" , r2_onnx_float)

print ( "Mean Absolute Error:" , mae_ o nnx_float)

print ( "Mean Squared Error:" , mse_onnx_float)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_float))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_float))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_float))

print ( "float ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_float))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label='ONNX '+model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with float ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_float.png' )



# ONNX 모델로 변환 (double)

# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = [( 'double_input' , DoubleTensorType([ None , X.shape[ 1 ]]))]



# 모델을 ONNX 형식으로 내보내기

onnx_model_double = convert_sklearn(regression_model, initial_types=initial_type_double, target_opset= 12 )



# 파일에 모델 저장

onnx_filename=onnx_model_filename+ "_double.onnx"

onnx.save_model(onnx_model_double, onnx_filename)



print ( "

" +model_name+ " ONNX model (double)" )

# 모델 경로 인쇄

print ( f"ONNX model saved to {onnx_filename} " )



# ONNX 모델을 로드하고 예측을 수행합니다.

onnx_session = ort.InferenceSession(onnx_filename)

input_name = onnx_session.get_inputs()[ 0 ].name

output_name = onnx_session.get_outputs()[ 0 ].name



# ONNX에서 입력 텐서에 대한 정보를 표시합니다.

print ( "Information about input tensors in ONNX:" )

for i, input_tensor in enumerate(onnx_session.get_inputs()):

print ( f" {i + 1} . Name: {input_tensor.name} , Data Type: {input_tensor.type} , Shape: {input_tensor.shape} " )



# ONNX에서 출력 텐서에 대한 정보를 표시합니다.

print ( "Information about output tensors in ONNX:" )

for i, output_tensor in enumerate(onnx_session.get_outputs()):

print ( f" {i + 1} . Name: {output_tensor.name} , Data Type: {output_tensor.type} , Shape: {output_tensor.shape} " )



# 입력 데이터 유형을 DoubleTensorType으로 정의합니다.

initial_type_double = X.astype(np.float64)



# ONNX를 사용하여 전체 데이터 세트의 값을 예측합니다.

y_pred_onnx_double = onnx_session.run([output_name], {input_name: initial_type_double})[ 0 ]



# 원본 및 ONNX 모델에 대한 오류를 계산하고 표시합니다.

r2_onnx_double = r2_score(y, y_pred_onnx_double)

mse_onnx_double = mean_squared_error(y, y_pred_onnx_double)

mae_onnx_double = mean_absolute_error(y, y_pred_onnx_double)

print ( "R-squared (Coefficient of determination)" , r2_onnx_double)

print ( "Mean Absolute Error:" , mae_onnx_double)

print ( "Mean Squared Error:" , mse_onnx_double)

print ( "R^2 matching decimal places: " ,compare_decimal_places(r2, r2_onnx_double))

print ( "MAE matching decimal places: " ,compare_decimal_places(mae, mae_onnx_double))

print ( "MSE matching decimal places: " ,compare_decimal_places(mse, mse_onnx_double))

print ( "double ONNX model precision: " ,compare_decimal_places(mae, mae_onnx_double))



# 그림 크기 설정

plt.figure(figsize=( 8 , 5 ))

# 원본 데이터와 회귀 데이터를 플로팅합니다.

plt.scatter(X, y, label= 'Original Data' , marker= 'o' )

plt.scatter(X, y_pred, color= 'blue' , label= 'Scikit-Learn ' +model_name+ ' Output' , marker= 'o' )

plt.scatter(X, y_pred_onnx_float, color= 'red' , label= 'ONNX ' +model_name+ ' Output' , marker= 'o' , linestyle= '--' )

plt.xlabel( 'X')

plt.ylabel( 'y')

plt.legend()

plt.title(model_name+ ' Comparison (with double ONNX)' )

#plt.show()

plt.savefig(data_path + model_name+ '_plot_double.png' )

출력:



Python TheilSenRegressor Original model ( double ) Python R-squared (Coefficient of determination): 0.9962329196940459 Python Mean Absolute Error: 6.338686004537594 Python Mean Squared Error: 49.84886353898735 Python Python TheilSenRegressor ONNX model ( float ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\theil_sen_regressor_float.onnx Python Information about input tensors in ONNX: Python 1 . Name: float_input, Data Type: tensor( float ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( float ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.996232919516505 Python Mean Absolute Error: 6.338686370832071 Python Mean Squared Error: 49.84886588834327 Python R^ 2 matching decimal places: 9 Python MAE matching decimal places: 6 Python MSE matching decimal places: 5 Python float ONNX model precision: 6 Python Python TheilSenRegressor ONNX model ( double ) Python ONNX model saved to C:\Users\user\AppData\Roaming\MetaQuotes\Terminal\D0E8209F77C8CF37AD8BF550E51FF075\MQL5\Scripts\Regression\theil_sen_regressor_double.onnx Python Information about input tensors in ONNX: Python 1 . Name: double_input, Data Type: tensor( double ), Shape: [None, 1 ] Python Information about output tensors in ONNX: Python 1 . Name: variable, Data Type: tensor( double ), Shape: [None, 1 ] Python R-squared (Coefficient of determination) 0.9962329196940459 Python Mean Absolute Error: 6.338686004537594 Python Mean Squared Error: 49.84886353898735 Python R^ 2 matching decimal places: 16 Python MAE matching decimal places: 15 Python MSE matching decimal places: 14 Python double ONNX model precision: 15





그림 67. TheilSenRegressor.py의 결과(float ONNX)

