トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング

Aleksey Vyazmikin 2021.03.15 17:27 #23661

mytarmailS:

長いため息...忘れられた、疲れた)

384GB RAM ?

そんなにいらないよ～、64は価値あるよ。

mytarmailS 2021.03.15 18:31 #23662

Aleksey Vyazmikin：

そんなにいらないよ～、64もかかるんだから。

OK、まあ、そうですね、私自身はまだコードを整理しているところです、最適化できるものをどうするのがベストか、そう思います、オプションを試しているところです、私も無駄にあなたを悩ませたくないです、心に留めておきます koroch....。

mytarmailS 2021.03.15 18:35 #23663

アレクセイ・ニコラエフ：

コーヒー、キャビア、わさび、ロックミュージックなど、後から結構好きになるものも、最初は嫌なものに見える。）

そうですね、私も最初はP-KAを理解できず、ナンセンスだと思いました。

私も最初はp-kaの構造をいじっていて、例えばループで全部書いたり、"apply "ファミリーを理解していなかったりと、ナンセンスだと思っていましたが、後で可読性とスピードで勝てることがわかり、6行のコードを書いて1行のコードを作ることができるようになりました。

Vladimir Perervenko 2021.03.16 16:09 #23664

mytarmailS:

私も最初はp-kaの構造が理解できず、ナンセンスだと思いました。

私は以前、すべてをループで書いていて、「適用」ファミリーを理解していませんでしたが、後でより可読性と速度を得られることがわかり、6行のコードを書いて1つの

適用するだけでなくforeachはコードを変えずに並列化できるのでよく使うのですが...。イテレータが便利な場合もあるので、試してみてください

library(coro)
abc <- generate_abc()
loop(for (x in abc) print(x))

グッドラック

mytarmailS 2021.03.16 20:03 #23665

Vladimir Perervenko:

適用するだけでなくforeachを使うことが多くなった、コードをやり直さずに並列化できる...。イテレータが便利な場合もあるので、試してみてください

グッドラック

ありがとうございました。

mytarmailS 2021.03.17 15:45 #23666

mytarmailS:

ありがとうございました。

generate_abcとは何ですか？サンプルがエラーを出すので、まだ理解していません。

library(coro)
> abc <- generate_abc()
Error in generate_abc() : could not find function "generate_abc"

Maxim Dmitrievsky 2021.03.18 06:33 #23667

これらの操作はすべてpythonで行われます

print([x for x in range(50)])

Aleksey Nikolayev 2021.03.18 07:10 #23668

これはすべてlispから始まり、特に関数型プログラミングで発展したもので、その要素はRとPythonの両方に見られるものです。

Vladimir Perervenko 2021.03.25 09:25 #23669

予測値、応答、残差：本当に正規分布でなければ ならないものは何か」という記事を読んで驚いた。

少し引用します。

"統計解析における変数の正規性・非正規性については、多くの科学者が関心を寄せています。以下のような見解や類似の見解がしばしば表明され、発表されたり、教えられたりしています。

「統計学をやりたいのなら、すべてが正規分布で なければならない。
" 正規性 "の仮定に合うように、データを正規化 しました。
" データが大きく歪んだ分布をしていたため、対数に変換した " .
" モデルを当てはめた後、残差のホモソデシティを検証 しました。
「データが正規性の仮定に当てはまらないため、ノンパラメトリック検定を使用 した」。

といった具合に。もっと複雑なことは分かっているのですが、それでも、人々がどこでも見たがっているのは正規分布であり、物事の正規分布がきれいで説得力のある統計や強い結果への扉を開いているように思えるのです。私の知る限り、多くの人は分析前にデータが正規分布しているかどうかを定期的にチェックし、対数変換などで「正規化」しようとするか、データの度数分布から統計手法を適宜調整する。ここでは、このことをより詳しく調べ、正常性についての仮定は人が考えるよりも少ないかもしれないことを示す。"

思考と結論のさらなる正当化。

"なぜ人々はいまだにデータを正規化するのか？

もう一つの不可解な問題は、なぜ人々はいまだにモデルを当てはめる前に変数（予測因子と反応の両方）を「正規化」する傾向があるのかということです。きっかけとなる前提がないにもかかわらず、なぜこのような慣習が生まれ、浸透しているのでしょうか。これにはいくつかの説がある。無知であること、統計的なクックブックに従う傾向があること、エラーが伝播すること、などだ。D.
二つの説明がより妥当であると思われる：第一に、人々は関係を線形化するためにデータを正規化する。例えば、対数予測変換は、通常の最小二乗メカニズムを使用して、指数関数に適合させることができます。これは普通に見えるかもしれないが、それならなぜ非線形関係を直接モデルで指定しないのか（例えば適切な参照関数を使用する）。さらに、対数応答変換の実施は、例えばゼロカウントのカウントデータの場合など、深刻なアーティファクトを引き起こす可能性があります (O'Hara & Kotze 2010)。
研究者が問題を解決しようとしているのに、そのデータが非常に巧妙に、かつ不均一に収集されているためかもしれないのだ。つまり、勾配のある部分に多くの観測値が集約され、勾配の他の部分は相対的に過小評価されているデータを扱うことが非常に多いのです。そのため、分布が歪んでしまうのです。このような分布を変換することで、勾配に沿った一見規則的な観測分布が得られ、外れ値を排除することができる。これは実際、誠実に行うことができます。しかし、これも根本的に間違っている。"

私にとっては、この発言は（衝撃的な？でも、今後は気をつけたいと思います。

Predictors, responses and residuals: What really needs to be normally distributed?

www.r-bloggers.com

[This article was first published on Are you cereal? » R , and kindly contributed to R-bloggers]. (You can report issue about the content on this page here)

Vladimir Perervenko 2021.03.25 09:26 #23670

マキシム・ドミトリエフスキー：

これらの操作はすべてpythonで行われます。

プリントではなく、ジェネレータとイテレータの話です。

トレーディングにおける機械学習：理論、モデル、実践、アルゴトレーディング - ページ 2367