トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 2367

 
mytarmailS:

長いため息...忘れられた、疲れた)

384GB RAM ?

そんなにいらないよ~、64は価値あるよ。

 
Aleksey Vyazmikin:

そんなにいらないよ~、64もかかるんだから。

OK、まあ、そうですね、私自身はまだコードを整理しているところです、最適化できるものをどうするのがベストか、そう思います、オプションを試しているところです、私も無駄にあなたを悩ませたくないです、心に留めておきます koroch....。

 
アレクセイ・ニコラエフ

コーヒー、キャビア、わさび、ロックミュージックなど、後から結構好きになるものも、最初は嫌なものに見える。)

そうですね、私も最初はP-KAを理解できず、ナンセンスだと思いました。

私も最初はp-kaの構造をいじっていて、例えばループで全部書いたり、"apply "ファミリーを理解していなかったりと、ナンセンスだと思っていましたが、後で可読性とスピードで勝てることがわかり、6行のコードを書いて1行のコードを作ることができるようになりました。

 
mytarmailS:

私も最初はp-kaの構造が理解できず、ナンセンスだと思いました。

私は以前、すべてをループで書いていて、「適用」ファミリーを理解していませんでしたが、後でより可読性と速度を得られることがわかり、6行のコードを書いて1つの

適用するだけでなくforeachはコードを変えずに並列化できるのでよく使うのですが...。イテレータが便利な場合もあるので、試してみてください

library(coro)
abc <- generate_abc()
loop(for (x in abc) print(x))

グッドラック

 
Vladimir Perervenko:

適用するだけでなくforeachを使うことが多くなった、コードをやり直さずに並列化できる...。イテレータが便利な場合もあるので、試してみてください

グッドラック

ありがとうございました。

 
mytarmailS:

ありがとうございました。

generate_abcとは何ですか? サンプルがエラーを出すので、まだ 理解していません。

library(coro)
> abc <- generate_abc()
Error in generate_abc() : could not find function "generate_abc"
 

これらの操作はすべてpythonで行われます

print([x for x in range(50)])
 
これはすべてlispから始まり、特に関数型プログラミングで発展したもので、その要素はRとPythonの両方に見られるものです。
 
予測値、応答、残差:本当に正規分布でなければ ならないものは何か」という記事を読んで驚いた。

少し引用します。

"統計解析における変数の正規性・非正規性については、多くの科学者が関心を寄せています。 以下のような見解や類似の見解がしばしば表明され、発表されたり、教えられたりしています。

  • 「統計学をやりたいのなら、すべてが正規分布で なければならない
  • " 正規性 "の仮定に合うように、データを正規化 しました
  • " データが大きく歪んだ分布をしていたため、対数に変換した " .
  • " モデルを当てはめた後、残差のホモソデシティを検証 しました
  • 「データが正規性の仮定に当てはまらないため、ノンパラメトリック検定を使用 した」

といった具合に。もっと複雑なことは分かっている のですが、それでも、人々がどこでも見たがっているのは正規分布であり、物事の正規分布がきれいで説得力のある統計や強い結果への扉を開いているように思えるのです。私の知る限り、多くの人は分析前にデータが正規分布しているかどうかを定期的にチェックし、対数変換などで「正規化」しようとするか、データの度数分布から統計手法を適宜調整する。ここでは、このことをより詳しく調べ、正常性についての仮定は人が考えるよりも少ないかもしれないことを示す。"

思考と結論のさらなる正当化。

"なぜ人々はいまだにデータを正規化するのか?

もう一つの不可解な問題は、なぜ人々はいまだにモデルを当てはめる前に変数(予測因子と反応の両方)を「正規化」する傾向があるのかということです。きっかけとなる前提がないにもかかわらず、なぜこのような慣習が生まれ、浸透しているのでしょうか。これにはいくつかの説がある。無知であること、統計的なクックブックに従う傾向があること、エラーが伝播すること、などだ。D.
二つの説明がより妥当であると思われる:第一に、人々は関係を線形化するためにデータを正規化する。例えば、対数予測変換は、通常の最小二乗メカニズムを使用して、指数関数に適合させることができます。これは普通に見えるかもしれないが、それならなぜ非線形関係を直接モデルで指定しないのか(例えば適切な参照関数を使用する)。さらに、対数応答変換の実施は、例えばゼロカウントのカウントデータの場合など、深刻なアーティファクトを引き起こす可能性があります (O'Hara & Kotze 2010)。
研究者が問題を解決しようとしているのに、そのデータが非常に巧妙に、かつ不均一に収集されているためかもしれないのだ。つまり、勾配のある部分に多くの観測値が集約され、勾配の他の部分は相対的に過小評価されているデータを扱うことが非常に多いのです。そのため、分布が歪んでしまうのです。このような分布を変換することで、勾配に沿った一見規則的な観測分布が得られ、外れ値を排除することができる。これは実際、誠実に行うことができます。しかし、これも根本的に間違っている。"

私にとっては、この発言は(衝撃的な?でも、今後は気をつけたいと思います。

Predictors, responses and residuals: What really needs to be normally distributed?
Predictors, responses and residuals: What really needs to be normally distributed?
  • www.r-bloggers.com
[This article was first published on Are you cereal? » R , and kindly contributed to R-bloggers]. (You can report issue about the content on this page here)
 
マキシム・ドミトリエフスキー

これらの操作はすべてpythonで行われます。

プリントではなく、ジェネレータとイテレータの話です。

理由: