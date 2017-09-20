DNNは広く使用されており、多くの分野で積極的に開発されています。ニューラルネットワークの日常的な使用の最も一般的な例は、音声認識と画像認識、及び言語間の自動翻訳です。DNNは取引にも使用されます。アルゴリズム取引の急速な発展は、DNNの徹底的な研究の有用性をうかがわせます。

最近、開発者はDNNの使用に関する多くの新しいアイデア、方法、及びアプローチを考えつき、実験的に証明しています。この一連の記事では、DNNの発展の状態と主な方向性について検討します。実践的な実験を使用したさまざまなアイデアや方法のテストとDNNの質的特性には、多くのスペースが設けられています。作業には、完全接続の多層ネットワークだけを使用します。

記事には4つの重点分野があります。

様々な変換による入力データの準備、評価、拡大



darchパッケージ（v.0.12）の新機能、柔軟性と拡張機能

予測結果の拡大（DNNとニューラルネットワークのアンサンブルのハイパーパラメータの最適化）の使用

エキスパートアドバイザーの作業を学習と作業の両方において制御するグラフィカル機能

本稿では、取引端末で受け取ったデータのニューラルネットワークで使用するための準備を考察します。

内容

はじめに

ディープニューラルネットワークの開発、訓練、テストは、厳密なシーケンスを持つ段階で行われます。機械学習の任意のモデルと同様、DNNを作成する過程は、2つの不等な部分に分割できます。

実験用入出力データの準備

DNNパラメータの作成、訓練、検証、及び最適化

第1段階はプロジェクト時間の約70％を占めます。DNNの作業結果は、この段階の成功に大きく依存します。結局のところはGIGO（garbage in garbage out）です。このため、この段階での一連の行動は詳細に説明されます。

実験を繰り返すには、MRO 3.4.0とRstudioをインストールする必要があります。このソフトウェアのインストール手順は、インターネット上で簡単に見つけることができます。この情報は本稿の添付ファイルにも含まれているので、詳細は考察されません。

Ｒ言語

Rについていくつか重要なことを思い出してみましょう。これは、統計的な計算とグラフィックスのためのプログラミング言語と環境で、1996年に、ニュージーランドの科学者ロスイハカ氏とオークランド大学のロバートジェントルマン氏によって開発されました。RはオープンソースソフトウェアであるGNUプロジェクトで、オープンソースソフトウェアを使用するアプローチは、以下の原則（自由）に従います。

任意の目的のためにプログラムを立ち上げる自由（自由0）

プログラムの仕組みを研究してプログラマーのニーズに適応させる自由（自由1）

隣人を助けるためにコピーを配布する自由（自由2）

プログラムを改善して変更されたバージョンを配布し、コミュニティ全体に利益をもたらす自由

現在Rは「R開発コアチーム」と昨年設立された Rコンソーシアムによって主に改善され、開発されています。コンソーシアムのメンバー（IBM、Microsoft、Rstudio、Google、Mango、Oracleなど）のリストは、言語の優れた支持、重要な関心及び見通しを示しています。

下記はRのメリットです。

現在の統計計算の標準

世界の科学界による支持と開発

データマイニングにおけるすべての高度な方向に関するパッケージの幅広いセット。新しいアイデアは科学者による発表後2週間以内にはRで実装されるということには言及するべきである」。

そして最後に重要なこととして、それは絶対に無償であるということ



1. 初期（生）データの作成

「過去、現在、将来のすべての価格変動は価格自体に含まれている」

事前準備、評価、予測子の選択のために設計された方法（パッケージ）は数多くあります。[1]にはこれらの方法のレビューが見られ、その多様性は、実世界のデータの多様性によって説明されます。探索及び処理の方法は使用中のデータ型によって定義されます。

ここでは経済的データを検討します。これらは無限で簡単に抽出できる階層的な通常の時間系列です。基本行は、特定の時間枠での製品のOHLCV相場です。

他のすべての時系列はこの基本行から来ます。

ノンパラメトリック：例えば、x^2、sqrt(abs(x))、x^3、-x^2など

機能的ノンパラメトリック：例えば、sin(2*n*x)、ln(abs(x))、log(Pr(t)/Pr(t-1)) など

パラメトリック：これには様々な指標が属し、主に予測変数として使用されます。それらはオシレータと異なる種類のフィルタの両方になります。

シグナルを生成する指標（因子）またはシグナルを生成する一連の条件文は目標変数として使用できます。

1.1. 相場

(o, h, l, cl, v, d) ベクトルとして端末から取得するOHLC相場、数量と時間。dataFrameで端末から受け取ったベクトルを結合する関数を書く必要があります。そのために、バーの開始時刻の形式をPOSIXct形式に変更します。

#---pr.OHLCV------------------- pr.OHLCV <- function(d, o, h, l, cl, v){ # (d, o, h, l, cl, v)- ベクトル require('magrittr') require('dplyr') require('anytime') price <- cbind(Data = rev(d), Open = rev(o), High = rev(h), Low = rev(l), Close = rev(cl), Vol = rev(v)) %>% as.tibble() price$Data %<>% anytime(., tz = "CET") return (price) }

相場ベクトルは環境envに読み込まれているので、dataFrame prを計算し、未使用変数から環境envをクリアします。

evalq({pr <- pr.OHLCV(Data, Open , High , Low , Close , Volume ) rm(list = c("Data", " Open ", " High ", " Low ", " Close ", " Volume ")) }, env)

> head(env$pr) # A tibble: 6 x 6 Data Open High Low Close < dttm > < dbl > < dbl > < dbl > < dbl > 1 2017-01-10 11:00:00 122.758 122.893 122.746 122.859 2 2017-01-10 11:15:00 122.860 122.924 122.818 122.848 3 2017-01-10 11:30:00 122.850 122.856 122.705 122.720 4 2017-01-10 11:45:00 122.721 122.737 122.654 122.693 5 2017-01-10 12:00:00 122.692 122.850 122.692 122.818 6 2017-01-10 12:15:00 122.820 122.937 122.785 122.920 # ... 追加変数をあと一つ：Vol < dbl >

このdataFrameの始まりがどのようであるかを見てみたいと思います。

そして下記は最後です。

> tail(env$pr) # A tibble: 6 x 6 Data Open High Low Close < dttm > < dbl > < dbl > < dbl > < dbl > 1 2017-05-05 20:30:00 123.795 123.895 123.780 123.888 2 2017-05-05 20:45:00 123.889 123.893 123.813 123.831 3 2017-05-05 21:00:00 123.833 123.934 123.825 123.916 4 2017-05-05 21:15:00 123.914 123.938 123.851 123.858 5 2017-05-05 21:30:00 123.859 123.864 123.781 123.781 6 2017-05-05 21:45:00 123.779 123.864 123.781 123.781 # ... 追加変数をあと一つ：Vol < dbl >

つまり、開始日が10.01.2017、終了日が05.05.2017の8000のバーがあることになります。価格の派生物である平均価格、標準価格及び加重終値をdataframe prに加えましょう。

evalq(pr %<>% mutate(., Med = ( High + Low )/ 2 , Typ = ( High + Low + Close )/ 3 , Wg = ( High + Low + 2 * Close )/ 4 , #CO = 終値 - 始値 、 #HO = 終値 - 始値 、 #LO = 低値 - 始値 、 dH = c(NA, diff( High )), dL = c(NA, diff( Low )) ), env)

1.2. 予測子

ここでは一連の単純化された予測変数を使って作業します。その役割を果たすのはFATL、SATL、RFTL、RSTLデジタルフィルタです。それらは、V. Kravchukによる論文"New Adaptive Method of Following the Tendency and Market Cycles"（動向及び市場サイクルに従う新しい適応的方法）に記載されています。この記事は、本稿に添付されたファイルにあります（"New Tools of Technical Analysis and their Interpretation"（新しい分析ツールとその解釈）章を参照） 。ここではそれらを一覧するだけにします。

FATL（高速適応トレンドライン）

SATL（低速適応トレンドライン）

RFTL（参照高速トレンドライン）

RSTL（参照低速トレンドライン）



FATSとSALTの変化率は、 FILM（高速トレンドラインモメンタム）と STLM（低速トレンドラインモメンタム）指標を使用して監視できます。

RBCIとPCCIの2つのオシレータが必要です。RBCI (Range Bound Channel Index)インデックスは、チャネルフィルタを使用して計算される帯域幅限定チャネルインデックスです。このフィルタは、低周波トレンドと低周波ノイズを除去します。PCCI (Perfect Commodity Channel Index)インデックスは、完璧なコモディティチャネルインデックスです。

FATL、SATL、RFTL、RSTLデジタルフィルタを計算する関数は次のようになります。

#-----DigFiltr------------------------- DigFiltr <- function(X, type = 1 ){ # X - ベクトル require(rowr) fatl <- c( + 0.4360409450 , + 0.3658689069 , + 0.2460452079 , + 0.1104506886 , - 0.0054034585 , - 0.0760367731 , - 0.0933058722 , - 0.0670110374 , - 0.0190795053 , + 0.0259609206 , + 0.0502044896 , + 0.0477818607 , + 0.0249252327 , - 0.0047706151 , - 0.0272432537 , - 0.0338917071 , - 0.0244141482 , - 0.0055774838 , + 0.0128149838 , + 0.0226522218 , + 0.0208778257 , + 0.0100299086 , - 0.0036771622 , - 0.0136744850 , - 0.0160483392 , - 0.0108597376 , - 0.0016060704 , + 0.0069480557 , + 0.0110573605 , + 0.0095711419 , + 0.0040444064 , - 0.0023824623 , - 0.0067093714 , - 0.0072003400 , - 0.0047717710 , 0.0005541115 , 0.0007860160 , 0.0130129076 , 0.0040364019 ) rftl <- c(- 0.0025097319 , + 0.0513007762 , + 0.1142800493 , + 0.1699342860 , + 0.2025269304 , + 0.2025269304 , + 0.1699342860 , + 0.1142800493 , + 0.0513007762 , - 0.0025097319 , - 0.0353166244 , - 0.0433375629 , - 0.0311244617 , - 0.0088618137 , + 0.0120580088 , + 0.0233183633 , + 0.0221931304 , + 0.0115769653 , - 0.0022157966 , - 0.0126536111 , - 0.0157416029 , - 0.0113395830 , - 0.0025905610 , + 0.0059521459 , + 0.0105212252 , + 0.0096970755 , + 0.0046585685 , - 0.0017079230 , - 0.0063513565 , - 0.0074539350 , - 0.0050439973 , - 0.0007459678 , + 0.0032271474 , + 0.0051357867 , + 0.0044454862 , + 0.0018784961 , - 0.0011065767 , - 0.0031162862 , - 0.0033443253 , - 0.0022163335 , + 0.0002573669 , + 0.0003650790 , + 0.0060440751 , + 0.0018747783 ) satl <- c(+ 0.0982862174 , + 0.0975682269 , + 0.0961401078 , + 0.0940230544 , + 0.0912437090 , + 0.0878391006 , + 0.0838544303 , + 0.0793406350 ,+ 0.0743569346 ,+ 0.0689666682 , + 0.0632381578 ,+ 0.0572428925 , + 0.0510534242 ,+ 0.0447468229 , + 0.0383959950 , + 0.0320735368 , + 0.0258537721 ,+ 0.0198005183 , + 0.0139807863 ,+ 0.0084512448 , + 0.0032639979 , - 0.0015350359 , - 0.0059060082 ,- 0.0098190256 , - 0.0132507215 , - 0.0161875265 , - 0.0186164872 , - 0.0205446727 , - 0.0219739146 ,- 0.0229204861 , - 0.0234080863 ,- 0.0234566315 , - 0.0231017777 , - 0.0223796900 , - 0.0213300463 ,- 0.0199924534 , - 0.0184126992 ,- 0.0166377699 , - 0.0147139428 , - 0.0126796776 , - 0.0105938331 ,- 0.0084736770 , - 0.0063841850 ,- 0.0043466731 , - 0.0023956944 , - 0.0005535180 , + 0.0011421469 ,+ 0.0026845693 , + 0.0040471369 ,+ 0.0052380201 , + 0.0062194591 , + 0.0070340085 , + 0.0076266453 ,+ 0.0080376628 , + 0.0083037666 ,+ 0.0083694798 , + 0.0082901022 , + 0.0080741359 , + 0.0077543820 ,+ 0.0073260526 , + 0.0068163569 ,+ 0.0062325477 , + 0.0056078229 , + 0.0049516078 , + 0.0161380976 ) rstl <- c(- 0.0074151919 ,- 0.0060698985 ,- 0.0044979052 ,- 0.0027054278 ,- 0.0007031702 ,+ 0.0014951741 , + 0.0038713513 ,+ 0.0064043271 ,+ 0.0090702334 ,+ 0.0118431116 ,+ 0.0146922652 ,+ 0.0175884606 , + 0.0204976517 ,+ 0.0233865835 ,+ 0.0262218588 ,+ 0.0289681736 ,+ 0.0315922931 ,+ 0.0340614696 , + 0.0363444061 ,+ 0.0384120882 ,+ 0.0402373884 ,+ 0.0417969735 ,+ 0.0430701377 ,+ 0.0440399188 , + 0.0446941124 ,+ 0.0450230100 ,+ 0.0450230100 ,+ 0.0446941124 ,+ 0.0440399188 ,+ 0.0430701377 , + 0.0417969735 ,+ 0.0402373884 ,+ 0.0384120882 ,+ 0.0363444061 ,+ 0.0340614696 ,+ 0.0315922931 , + 0.0289681736 ,+ 0.0262218588 ,+ 0.0233865835 ,+ 0.0204976517 ,+ 0.0175884606 ,+ 0.0146922652 , + 0.0118431116 ,+ 0.0090702334 ,+ 0.0064043271 ,+ 0.0038713513 ,+ 0.0014951741 ,- 0.0007031702 , - 0.0027054278 ,- 0.0044979052 ,- 0.0060698985 ,- 0.0074151919 ,- 0.0085278517 ,- 0.0094111161 , - 0.0100658241 ,- 0.0104994302 ,- 0.0107227904 ,- 0.0107450280 ,- 0.0105824763 ,- 0.0102517019 , - 0.0097708805 ,- 0.0091581551 ,- 0.0084345004 ,- 0.0076214397 ,- 0.0067401718 ,- 0.0058083144 , - 0.0048528295 ,- 0.0038816271 ,- 0.0029244713 ,- 0.0019911267 ,- 0.0010974211 ,- 0.0002535559 , + 0.0005231953 ,+ 0.0012297491 ,+ 0.0018539149 ,+ 0.0023994354 ,+ 0.0028490136 ,+ 0.0032221429 , + 0.0034936183 ,+ 0.0036818974 ,+ 0.0038037944 ,+ 0.0038338964 ,+ 0.0037975350 ,+ 0.0036986051 , + 0.0035521320 ,+ 0.0033559226 ,+ 0.0031224409 ,+ 0.0028550092 ,+ 0.0025688349 ,+ 0.0022682355 , + 0.0073925495 ) if (type == 1 ) {k = fatl} if (type == 2 ) {k = rftl} if (type == 3 ) {k = satl} if (type == 4 ) {k = rstl} n <- length(k) m <- length(X) k <- rev(k) f <- rowr::rollApply(data = X, fun = function(x) {sum(x * k)}, window = n, minimum = n, align = "right" ) while (length(f) < m) { f <- c(NA,f)} return (f) }

計算後は、それらをデータフレームprに追加します。

evalq(pr %<>% mutate(., fatl = DigFiltr( Close , 1 ), rftl = DigFiltr( Close , 2 ), satl = DigFiltr( Close , 3 ), rstl = DigFiltr( Close , 4 ) ), env)

FTLM、STLM、RBCI、PCCIオシレータとデジタルフィルタの最初の違いと最初の違いをデータフレーム prに追加します。

evalq(pr % < > % mutate(., ftlm = fatl - rftl, rbci = fatl - satl, stlm = satl - rstl, pcci = Close - fatl, v.fatl = c(NA, diff(fatl)), v.rftl = c(NA, diff(rftl)), v.satl = c(NA, diff(satl)), v.rstl = c(NA, diff(rstl)*10) ), env) evalq(pr % < > % mutate(., v.ftlm = c(NA, diff(ftlm)), v.stlm = c(NA, diff(stlm)), v.rbci = c(NA, diff(rbci)), v.pcci = c(NA, diff(pcci)) ), env)

1.3. 目標変数

ZigZag()は目標変数を生成する指標として使用されます。

計算のための関数は時系列と屈曲の最小長（intまたはdouble）と計算のための価格の種類(Close、Med、Typ、Wd、(High, Low)を伴う )の2つのパラメータを受け取ります。

#------ZZ----------------------------------- par <- c( 25 , 5 ) ZZ <- function(x, par) { # x - ベクトル require(TTR) require(magrittr) ch = par[ 1 ] mode = par[ 2 ] if (ch > 1 ) ch <- ch/( 10 ^ (Dig - 1 )) switch (mode, xx <- x$ Close , xx <- x$Med, xx <- x$Typ, xx <- x$Wd, xx <- x %>% select( High , Low )) zz <- ZigZag(xx, change = ch, percent = F, retrace = F, lastExtreme = T) n <- 1 :length(zz) for (i in n) { if (is.na(zz[i])) zz[i] = zz[i - 1 ]} return (zz) }

ジグザグ、最初の差、最初の差の符号を計算し、それらをデータフレームprに加えます。

evalq(pr % < > % cbind(., zigz = ZZ(., par = par)), env) evalq(pr % < > % cbind(., dz = diff(pr$zigz) %>% c(NA, .)), env) evalq(pr % < > % cbind(., sig = sign(pr$dz)), env)

1.4. 初期データセット

計算の結果としてどのようなデータが得られるかをまとめましょう。

端末から、EURJPYのM15時間枠にOHLCVベクトルとバーの始まりの一時的なマークを受け取りました。これらのデータはprデータフレームを形成しました。変数 FAT、SALT、RFTL、RSTL、FILM、STLM、RBCI、PCCIとその最初の違いがこのデータフレームに追加されました。ジグザグは25ポイント（小数点以下4桁）を最小限に活用し、その最初の差と、シグナルとして使用される最初の差（-1,1）の符号もデータフレームに追加されました。

これらのデータはすべてグローバル環境ではなく、すべての計算が実行される新しい子環境envに読み込まれました。この隔離によって、計算中に名前の競合が発生することなく、異なる銘柄や時間枠のデータセットを使用できます。

以下にデータフレームpr全体の構造を示します。以下の計算に必要な変数は、これから簡単に抽出できます。

str(env$pr) 'data.frame': 8000 obs. of 30 variables: $ Data : POSIXct, format: " 2017 - 01 - 10 11 : 00 : 00 " ... $ Open : num 123 123 123 123 123 ... $ High : num 123 123 123 123 123 ... $ Low : num 123 123 123 123 123 ... $ Close : num 123 123 123 123 123 ... $ Vol : num 3830 3360 3220 3241 3071 ... $ Med : num 123 123 123 123 123 ... $ Typ : num 123 123 123 123 123 ... $ Wg : num 123 123 123 123 123 ... $ dH : num NA 0.031 - 0.068 - 0.119 0.113 ... $ dL : num NA 0.072 - 0.113 - 0.051 0.038 ... $ fatl : num NA NA NA NA NA NA NA NA NA NA ... $ rftl : num NA NA NA NA NA NA NA NA NA NA ... $ satl : num NA NA NA NA NA NA NA NA NA NA ... $ rstl : num NA NA NA NA NA NA NA NA NA NA ... $ ftlm : num NA NA NA NA NA NA NA NA NA NA ... $ rbci : num NA NA NA NA NA NA NA NA NA NA ... $ stlm : num NA NA NA NA NA NA NA NA NA NA ... $ pcci : num NA NA NA NA NA NA NA NA NA NA ... $ v.fatl: num NA NA NA NA NA NA NA NA NA NA ... $ v.rftl: num NA NA NA NA NA NA NA NA NA NA ... $ v.satl: num NA NA NA NA NA NA NA NA NA NA ... $ v.rstl: num NA NA NA NA NA NA NA NA NA NA ... $ v.ftlm: num NA NA NA NA NA NA NA NA NA NA ... $ v.stlm: num NA NA NA NA NA NA NA NA NA NA ... $ v.rbci: num NA NA NA NA NA NA NA NA NA NA ... $ v.pcci: num NA NA NA NA NA NA NA NA NA NA ... $ zigz : num 123 123 123 123 123 ... $ dz : num NA - 0.0162 - 0.0162 - 0.0162 - 0.0162 ... $ sig : num NA - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 - 1 ...

dataSetデータフレームから以前に計算されたすべての予測子を選択します。目標変数sigを係数に変換し、1バー分前方（将来）に移動します。

evalq(dataSet <- pr %>% tbl_df() %>% dplyr::select(Data, ftlm, stlm, rbci, pcci, v.fatl, v.satl, v.rftl, v.rstl, v.ftlm, v.stlm, v.rbci, v.pcci, sig) %>% dplyr::filter(., sig != 0 ) %>% mutate(., Class = factor(sig, ordered = F) %>% dplyr::lead()) %>% dplyr::select(-sig), env)

データ分析の可視化

OHLCチャートの描画にはggplot2パッケージを使用します。最後の2日間のデータをとって、棒グラフで図表を描きます。

evalq(pr %>% tail(., 200 ) %>% ggplot(aes(x = Data, y = Close )) + geom_candlestick(aes(open = Open , high = High , low = Low , close = Close )) + labs(title = "EURJPY Candlestick Chart", y = " Close Price", x = "") + theme_tq(), env)

図1 相場のチャート

FATL, SATL, RFTL, RSTLとZZのチャートを描画します。

evalq(pr %>% tail(., 200 ) %>% ggplot(aes(x = Data, y = Close )) + geom_candlestick(aes(open = Open , high = High , low = Low , close = Close )) + geom_line(aes(Data, fatl), color = "steelblue", size = 1 ) + geom_line(aes(Data, rftl), color = "red", size = 1 ) + geom_line(aes(Data, satl), color = "gold", size = 1 ) + geom_line(aes(Data, rstl), color = "green", size = 1 ) + geom_line(aes(Data, zigz), color = "black", size = 1 ) + labs(title = "EURJPY Candlestick Chart", subtitle = "Combining Chart Geoms", y = " Close Price", x = "") + theme_tq(), env)

図2 FATL、SATL、RFTL、RSTL 及びZZ

より便利な表現のためにオシレーターを3つのグループに分けます。

require(dygraphs) evalq(dataSet %>% tail(., 200 ) %>% tk_tbl %>% select(Data, ftlm, stlm, rbci, pcci) %>% tk_xts() %>% dygraph(., main = "Oscilator base" ) %>% dyOptions(., fillGraph = TRUE, fillAlpha = 0.2 , drawGapEdgePoints = TRUE, colors = c( "green" , "violet" , "red" , "blue" ), digitsAfterDecimal = Dig) %>% dyLegend(show = "always" , hideOnMouseOut = TRUE), env)

図3 基本オシレータ

evalq(dataSet %>% tail(., 200 ) %>% tk_tbl %>% select(Data, v.fatl, v.satl, v.rftl, v.rstl) %>% tk_xts() %>% dygraph(., main = "Oscilator 2" ) %>% dyOptions(., fillGraph = TRUE, fillAlpha = 0.2 , drawGapEdgePoints = TRUE, colors = c( "green" , "violet" , "red" , "darkblue" ), digitsAfterDecimal = Dig) %>% dyLegend(show = "always" , hideOnMouseOut = TRUE), env)

図4 第2群のオシレータ

第3群のオシレータは、最後の100バーに描画されます。

evalq(dataSet %>% tail(., 100 ) %>% tk_tbl %>% select(Data, v.ftlm, v.stlm, v.rbci, v.pcci) %>% tk_xts() %>% dygraph(., main = "Oscilator 3" ) %>% dyOptions(., fillGraph = TRUE, fillAlpha = 0.2 , drawGapEdgePoints = TRUE, colors = c( "green" , "violet" , "red" , "darkblue" ), digitsAfterDecimal = Dig) %>% dyLegend(show = "always" , hideOnMouseOut = TRUE), env)

図5 第3群のオシレータ

2. 探索的データ解析（EDA）