トレーディングにおける機械学習:理論、モデル、実践、アルゴトレーディング - ページ 3231

 
Forester #:
なぜそれが必要なのか?私がRで実験していたとき、SanSanychによって注文されたdll-kuを使っていました。これは問題なく動作し、より多くの可能性を持っています。なぜなら、(最初のRポートにあったように)引用符だけでなく、あらゆるデータを双方向に転送できるからです。さらに、マルチスレッド最適化も実行できた。

公式なサポートは、RとMKLの両方を後押ししてくれるだろう。

すべての国の新しい記事、新しいアイデア、話すべき新しい人々、新しいアルゴリズム......。

 

新しいRパッケージの公開を記録しているサイトが ある。

このデータをダウンロードして、時間ごとに集計する (1日に何個の新しいパッケージがダウンロードされているか) ことにずっと興味があった。

でもいつも先延ばしにしていたんだ。やり方がわからなかったし、長くて複雑だと思ったから。

今日、やることにしたんだ。やり方を理解するのに5分、コード自体に30秒くらい費やしたよ)))

コードは 以下の通り

library(rvest)
library(xts)
url <- "https://cran.r-project.org/web/packages/available_packages_by_date.html"

tb <- url |> read_html() |> html_table() |> _[[1]] |> {\(.) .[nrow(.):1,]}()

tb$Date |> rle() |> _$lengths |> xts(as.POSIXct(r$values)) |> plot(main="количество новых пакетов",col=4)

サイトからのデータダウンロード+日別集計+視覚化。


2008-09-08                                           1
2008-10-28                                           1
2010-06-25                                           1
2010-07-07                                           1
2011-08-18                                           1
2011-09-07                                           1
2011-12-01                                           1
2011-12-28                                           1
2012-01-28                                           1
2012-03-01                                           1
       ...                                            
2023-09-01                                          44
2023-09-02                                          35
2023-09-03                                          37
2023-09-04                                          32
2023-09-05                                          72
2023-09-06                                          84
2023-09-07                                          58
2023-09-08                                          45
2023-09-09                                          26
2023-09-10                                          27

一日平均40-50の新しいパッケージを取得します。

=========================================================================


そして以下は、解析と一般に最適なpythonで同じコードです。

import pandas as pd
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt

url = "https://cran.r-project.org/web/packages/available_packages_by_date.html"

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find_all('table')[0] 
df = pd.read_html(str(table))[0]
df = df.iloc[::-1]

df['Date'] = pd.to_datetime(df['Date'])
df_grouped = df.groupby('Date').size()

df_grouped.plot(title="количество новых пакетов")
plt.show()

Date
2008-09-08     1
2008-10-28     1
2010-06-25     1
2010-07-07     1
2011-08-18     1
              ..
2023-09-06    84
2023-09-07    58
2023-09-08    45
2023-09-09    26
2023-09-10    29
Length: 2807, dtype: int64

===========================================================


Rのコード7行、pythonのコード18行...

 
Renat Fatkhullin #:

基本的にはすべて、コンペの条件を調整しながら進めていくことになる。

詳細な条件を待つことになる。

しかし、ほとんどの開発者は独自のものを持っており、それを万人向けの基準/テンプレートに当てはめることはできない。そして、最も価値のあるものはモデルではなく、予測因子である。

もし予測変数が固定されたセットであれば、トレーニングのタスクは重要なものを選択することに絞られる。しかし、これらの予測変数の設定を調整することが可能であれば、それはより楽しいものになるだろう。

 
Andrey Dik #:

ZZY**。"夜は気だるさを止める" - 何が出てくるか非常に興味深い、結局のところ、fxsaber、あなたは気にしていますよね?- 私もそうです)))))))))))))))))))))))))))))))))))))))))))))))))

、ののののののののののののののののののののののののののののののののののののののののののののののののののののののののぶすよどんなに議論してもうまくいかない。ーそれゆえーそれゆえー。

 
fxsaber #:

最も愚かなことのひとつは、他人の考えを変えようとすることだろう。いくら議論しても無駄だ。だからこそ、もうひとつの "P "の言葉は "bygones "なのだ。

彼らのコンテスト==彼らの条件。

議論するのは愚かなことだ。

 

アクセラレーションを使ったパッケージをインストールできるようにするためには、もっと努力しなければならないだろう。

import requests, pandas as pd, matplotlib.pyplot as plt
from bs4 import BeautifulSoup

df = pd.read_html(requests.get("https://cran.r-project.org/web/packages/available_packages_by_date.html").text, flavor='bs4')[0].iloc[::-1]
df.groupby('Date').size().plot(title="количество новых пакетов")
plt.show()
またしてもあなたは騙され、ただ画面に線を引き、それを真実として受け流した。
 
Maxim Dmitrievsky #:

パッケージを加速度的にインストールできるようにするためには、労力を増やさなければならないだろう

またもや私はダメになった。私はただ画面に行を塗りつぶして、それを真実として受け流しただけなのだ。
君のように無駄な圧縮をすれば、ライブラリ宣言と合わせて2行になってしまう......。

だから、ここでも運が悪かったね。
 
mytarmailS #:
あなたのように使えない方法で圧縮すると、ライブラリ宣言と合わせて合計2行になる...

つまり、ここでも運が悪かったということだ。

絶対に使える方法で、完璧に理解できる構文で、キーボードにもない曲線でコードを書くために、捕食者のアルファベットを 学ぶのだ ))。

その結果、象形文字に慣れているため、他の言語ではエラーなしでループを書くことさえできない。

 

MoDの普及を目的とした選手権の開催は歓迎すべきことだ。

そう思える。

しかし、パイソンとonnxという選手権の技術的枠組みは、MOで使用可能な真の多様なモデルを選手権から除外している。

何百ものモデルが除外されているのだ。 機械学習」という言葉の意味を定義しているのはこれらのモデルであり、様々なニューラルネットワークはMOのごく一部であり、トレーディングにとって最も興味深い部分ではない。

このリストは私の好みを反映したものであるため、いくつかのモデル・グループの 構成は明らかにしていません。

ファイル:
 
ったな。
理由: