トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

JeeyCi 2021.11.07 15:35 #24921

eccocom#:
TensorFlowのドキュメントを読むと、全てがコンストラクタ形式になっている...。を実践しています。本当にブラックボックスです。もし興味があれば、手動で書いたパーセプトロンのコードを差し上げます。ちなみに、これはすべて行列計算で、その上に成り立っています。

私はちょうど Evgeny Dyukaと彼のServerNN（コードを読む）による TensorFlowの投稿を見に来たところです。

というのも、趣味でPythonのライブラリに対する批判のようなものに出くわしたからです。

sklearnスタックでは、xgboost、lightGBMパッケージが「ウッドモデル」に対する特徴量の重要度を推定するメソッドを内蔵していました。

1.Gain
各特徴のモデルへの相対的な寄与度を示す指標。計算方法は、各樹木ノードに行き、どの特徴がノード分割につながるかを見て、その指標（Gini impurity, information gain）に従ってモデルの不確実性がどれだけ低減されるかを見る。
各特徴について、その寄与度をすべての木について合計する。

2.Cover
各フィーチャーの観測数を表示します。例えば、4つの機能、3つの木があるとします。ノード中のfich 1が、木1、2、3においてそれぞれ10、5、2個のオブザベーションを含むとすると、与えられたfichの重要度は17 (10 + 5 + 2)となる。

3.Frequency
与えられた特徴がツリーノードに出現する頻度を示す。すなわち、各ツリーにおける各特徴のツリー分割の総数をカウントするものである。

これらのアプローチの主な問題点は、与えられた特徴がモデルの予測にどのように影響するのかが不明確であることである。例えば、銀行のお客様の支払い能力を評価する際には、所得水準が重要であることを学びました。しかし、具体的にどのように？高所得者はモデル予測をどの程度シフトさせるのか？

ここで「木製モデル」はRAMを食うので避けたいのですが...（スピードとコンパクトさを重視する私としては）。

- とにかく、質問の答えは「CONVENIENTLY, INTERESTED...」です。そうですね、ニューラルネットワークは行列計算ですからね（だから、そのためのライブラリについて質問したんです）。

追伸

もし、引用したライブラリが多項式係数を予測できないのであれば（答え：どの程度）、どうやって動的モデルを記述できるのでしょうか？(線形でもなければ回帰でもない（同じこと））...だからこそ、これまでモデルを作ることに疑問を感じていた（diferentiationを思い出そうとして...苦労している）。

Машинное обучение в трейдинге: теория, практика, торговля и не только

2021.10.23
www.mql5.com

Добрый день всем, Знаю, что есть на форуме энтузиасты machine learning и статистики...

eccocom 2021.11.07 15:45 #24922

JeeyCi#：

エフゲニー・ダイカ氏の投稿に戻りました。

というのも、趣味でPythonのライブラリに対する批判のようなものに出くわしたからです。

sklearnスタックでは、xgboost、lightGBMパッケージが「ウッドモデル」の特徴量重要度を推定するメソッドを内蔵していました。

Gain
この指標は、各特徴のモデルへの相対的な貢献度を示す。これを計算するために、各樹木ノードに行き、どの特徴がノード分割につながるかを見て、その指標（Gini impurity, information gain）に従ってモデルの不確実性がどれだけ低減されるかを見る。
各特徴について、その寄与度をすべての木について合計する。
Cover
各フィーチャーの観測回数を表示します。例えば、4つの機能、3つの木があるとします。ノード中の fich 1 が、木1、木2、木3においてそれぞれ10、5、2個のオブザベーションを含むとすると、この fich の重要度は17 (10 + 5 + 2)である。
Frequency
ある特徴がツリーノードに出現する頻度を示す。つまり、各ツリーにおける各特徴のツリーノード分割の総数をカウントするのである。

これらのアプローチの主な問題点は、与えられた特徴がモデルの予測にどのように影響するのかが不明確であることである。例えば、銀行のお客様の返済能力を評価する際には、所得水準が重要であることを学びました。しかし、具体的にどのように？高所得者はモデル予測をどの程度シフトさせるのか？

私の好みでは、パイソンは調理法を知らない人たちから批判されますね。また、Fortranで書かれているため、numpyなどを使えば、C++よりも高速になるでしょう。PythonはMT5と簡単に統合できるので、いわば一気通貫で、ソケットを持つサーバーがなくてもAIを使うことができるようになったのです。

Forester 2021.11.07 15:46 #24923

JeeyCi#：

エフゲニー・ダイカ氏の投稿に戻りました。

というのも、趣味でPythonのライブラリに対する批判のようなものに出くわしたからです。

sklearnスタックでは、xgboost、lightGBMパッケージが「ウッドモデル」に対する特徴量の重要度を推定する方法を内蔵していました。

Gain
この指標は、各特徴のモデルへの相対的な貢献度を示す。これを計算するために、各樹木ノードに行き、どの特徴がノード分割につながるかを見て、その指標（Gini impurity, information gain）に従ってモデルの不確実性がどれだけ低減されるかを見る。
各特徴について、その寄与度をすべての木について合計する。
Cover
各フィーチャーの観測回数を表示します。例えば、4つの機能、3つの木があるとします。ノード中の fich 1 が、木1、木2、木3においてそれぞれ10、5、2個のオブザベーションを含むとすると、この fich の重要度は17 (10 + 5 + 2)である。
Frequency
ある特徴がツリーノードに出現する頻度を示す。つまり、各ツリーにおける各特徴のツリーノード分割の総数をカウントするのである。

これらのアプローチの主な問題点は、与えられた特徴がモデルの予測にどのように影響するのかが不明確であることである。例えば、銀行のお客様の支払い能力を評価する際には、所得水準が重要であることを学びました。しかし、具体的にどのように？高所得者はモデル予測をどの程度シフトさせるのか？

これらの方法はすべて不向きです。以下はその検証結果ですhttps://www.mql5.com/ru/blogs/post/737458
木や森はすぐに数えることができます。また、1つずつ機能を追加・削除していくこともできます。そして、結果を改善するものと悪化させるものを見つけてください。

Сравнение разных методов оценки важности предикторов.

www.mql5.com

Провел сравнение разных методов оценки важности предикторов. Тесты проводил на данных титаника (36 фичей и 891 строки) при помощи случайного леса из 100 деревьев. Распечатка с результатами ниже. За

eccocom 2021.11.07 15:50 #24924

モデルについては、それがどうこうではなく、AIは基本的に近似値であり、それがマーケット以外の他のケースでは強みになるということです。価格の波を引き起こす海面下の滑らかさの中に、魚やゴジラが多すぎるのです。すべてが価格に組み込まれているという仮説は正しいのですが、それが多すぎるのです。ニューラルネットは、あるシステムのごく一部にしかなりえません。

mytarmailS 2021.11.07 16:07 #24925

eccocom#:
モデルについては、そういう問題ではなく、AIは本質的に近似値であり、それが市場以外の他のケースでは強みであるということです。滑らかな海の下には、価格の波を起こす魚やゴジラが多すぎるのです。すべてが価格に組み込まれているという仮説は正しいのですが、それが多すぎるのです。ニューラルネットは、あるシステムのほんの一部に過ぎず、これに反対する人は自己欺瞞に陥っている。

そして、アップデータをAIと呼ぶ人は、何をする人なのか？)

eccocom 2021.11.07 16:44 #24926

mytarmailS#:
そして、AI近似値を呼ぶ人は......何をする人？)

まあ、単なるニューラルネットワークという意味でAIと呼んだのは間違いだったかもしれませんが、AIの中でも特殊なものですからね。私は皆と同じように、聖杯を探して、狂信的なことなく、面的にそれをやっています)。私はモデルのためのアイデアを見つけるためにここに来た（ニューラルネットワークの意味で）、自分自身を共有するために何かを持っている。経験の20年は確かに利用できませんが、私は通っているNSの百変種のために。近距離での最大効率は、約68%に達しましたが、安定性がなく、状況に応じて変化することはご理解いただけると思います。

mytarmailS 2021.11.07 16:56 #24927

eccocom#:
まあ、AIの特殊例であるニューラルネットワークだけを意味していたので、AIと呼ぶのは間違いだったかもしれませんね。私は他のみんなと同じように、聖杯を探して、狂信的なことなく、面的にそれをやって、従事している）。須田は、モデル（まさにニューラルネットワークの意味で）のアイデアを探しに来た、自分自身を共有するものがあります。経験の20年は確かに利用できませんが、NSの百変種のために私は行ってきました。私が到達した近距離での最大効率は約68％ですが、安定せず状況に応じて変化することは、おそらくご理解いただけると思います。

ええ、もちろんです...。

しかし、20年の経験を持つ専門家が、他の人からコードを請うことには注意が必要です ;)

eccocom 2021.11.07 17:27 #24928

mytarmailS#:
はい、もちろんわかっていますよ...

でも、他人からコードをねだられている20代の専門家には気をつけましょう;)

人が良ければ、コードは気にしない）。ちなみに、Mihail Marchukajtes氏の記事を読み、そこで使われていたアイデアのいくつかは私も使っていますが、筆者とは全く違う理由です。どのモデルのどのレイヤーが一番効果的なのか、議論するのも面白いかもしれませんね。Mikhailは状況証拠から判断して、Sequential()フルリンクのレイヤーを使っているようです。

Mihail Marchukajtes

2021.10.12
www.mql5.com

Профиль трейдера

mytarmailS 2021.11.07 17:39 #24929

eccocom#:
人が良ければ、コードは気にしない)。ちなみに、Mihail Marchukajtes氏の記事は私も読みましたが、そこに書かれていることは私も参考にしていますが、その理由は著者とは全く異なるものでした。どのモデルのどのレイヤーが一番効果的なのか、議論するのも面白いかもしれませんね。Mikhailは、間接的な証拠から判断すると、フルリンクのSequential()層を使っているようです。

ニューロンを全く使わない、作者の出来合いの凡庸なプログラム（SVMとMSUAのハイブリッドとか）を使っている、PythonでもRでもプログラミングしないのでSequential()という言葉が馴染まない、ニューラルネットワーク歴20年、興味を持つのは早計...などです。

eccocom 2021.11.07 17:59 #24930

mytarmailS#:
彼はニューロンを全く使っていない、既製の作者の凡庸なプログラムを使っている（SVMとMGUAのハイブリッドだ）、PythonやR-codeでプログラミングをしていない、したがってSequental（）という言葉は知らない、ニューラルネットワーク歴20年、手を出すのはまだ早い...と。

)))).なるほど、相当なコミュニケーションのお荷物をお持ちのようですね。私自身は、10本のうち8本はヒンズー教のコードを書いていると思います。また、ニューラルネットワークだけでなく、EA全般の構造をPythonで書いている人がいたら最高です。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2493