交易中的机器学习:理论、模型、实践和算法交易 - 页 2040

 
Aleksey Vyazmikin:

那里有一些东西--我不知道它是什么。

周日、月日、小时、分钟、......出场也一样......、交易时间(分钟)、SL、TP、结果+1

2 6 0 4 2 6 57 57 100 100 -1
4 2 6 0 4 2 6 57 57 100 200 -1
4 2 6 0 4 2 6 57 57 100 300 -1
4 2 6 0 4 2 6 57 57 100 400 -1
4 2 6 0 4 2 6 57 57 100 500 -1
4 2 6 0 4 2 6 57 57 100 600 -1
4 2 6 0 4 2 6 57 57 100 700 -1
4 2 6 0 4 2 6 57 57 100 800 -1
4 2 6 0 4 2 6 57 57 100 900 -1
4 2 6 0 4 2 6 57 57 100 1000 -1
4 2 6 0 4 2 6 57 57 100 1100 -1
4 2 6 0 4 2 6 57 57 100 1200 -1
4 2 6 0 4 2 6 57 57 100 1300 -1
4 2 6 0 4 2 6 57 57 100 1400 -1
4 2 6 0 4 2 6 57 57 100 1500 -1
4 2 6 0 4 2 6 57 57 100 1600 -1
4 2 6 0 4 2 6 57 57 100 1700 -1
4 2 6 0 4 2 6 57 57 100 1800 -1
4 2 6 0 4 2 6 57 57 100 1900 -1
4 2 6 0 4 2 6 57 57 100 2000 -1
4 2 6 0 4 2 6 57 57 100 2100 -1
4 2 6 0 4 2 6 57 57 100 2200 -1
4 2 6 0 4 2 6 57 57 100 2300 -1
4 2 6 0 4 2 6 57 57 100 2400 -1
4 2 6 0 4 2 6 57 57 100 2500 -1

我有8GB的内存。

正如我从你的结果中所理解的那样,条目信息根本没有被考虑在内。这很奇怪,因为有一整类的系统是基于进入时间的。

那么,50%是从交易完成日开始提取的?
 
Rorschach:

周日、月日、小时、分钟、......出场也一样......、交易时间(分钟)、SL、TP、结果+1

我有8GB的内存。

正如我从你的结果中所理解的那样,条目信息根本没有被考虑在内。这很奇怪,因为有一整类系统是基于进入时间的。

你不能准备这样的文件夹。列值的范围应该是相称的。对于分类是由范热做的
 
Rorschach:

周日、月日、小时、分钟、......出场也一样......、交易时间(分钟)、SL、TP、结果+1

我有8GB的内存。

正如我从你的结果中所理解的那样,条目信息根本没有被考虑在内。很奇怪,因为有一整类系统是基于进入时间的。

那么,50%是从交易的收盘日提取的?

事实上,结果并不奇怪--我们看到,有些日子里,趋势变化更频繁,或者出现平坦,所以无摆动的运动不是无限的,平均来说,它在某个值的点之后结束,因此,停留和TP与SL的时间已经到来。而按时间进场原来并不重要,因为它不能保证无障碍运动--它是对未来的预测--如果我们在寻找它--盈利交易的进场时间,我们会找到最高概率。一般来说,如果有更多的预测因素,那么也许当时和某人一起进入会有利可图。

百分比很可能只说明在树上与预测器的分割有多高。我还没有处理过这个问题。以下是通过翻译器的描述。

"

每个输入对象的单独重要性值(非排名指标的对象重要性的默认计算方法)。

对于每个对象,预测值的变化显示了当对象的价值发生变化时,预测的平均变化程度。重要性值越大,平均来说,如果改变该特征,预测值的变化就越大。

"

 
马克西姆-德米特里耶夫斯基
,这不是编写小册子的方法。列值范围应具有可比性。对于分类的,它是由范热完成的。

为什么你认为时间是分类的?或者说我们谈论的是什么功能?

 
Aleksey Vyazmikin:

为什么你认为时间是分类的?或者说我们在谈论的是什么标志?

那里的时间在哪里?周的日,月的日,日的小时,小时的分钟。时间是一个连续值,有顺序的类别
 
Aleksey Vyazmikin:

顺便问一下,你有没有见过这样一个发生器,它能从一个数组中随机输出一个数字而不重复--我需要的正是这样一个发生器。

我是这样做的:

1) 我创建了一个字符串索引数组,其长度等于字符串的数量,用从0到N个字符串的值填充它

2) 我对这个数组进行洗牌

RandomizeIdx(int &idx[], int rows) {//ссылка на массив и его длина
        int j = 0, c = 0;
        for (int r = 0; r<rows; r++) {//перебор train участка
                j = RandomInteger(rows);//номер строки с которой поменять 
                c = idx[r]; idx[r] = idx[j]; idx[j] = c;
        }
}

其中RandomInteger()------的任何变体

3)然后我在一个循环中取这些索引的所有值,并从主数组 中使用它们来获得正确的字符串,结果发现在混合索引后是一个伪随机字符串。
 

有没有人试着对大量的班级进行分类,比如说10k?

这到底有没有用?

 
mytarmailS:

有没有人试着对大量的班级进行分类,比如说10k?

它到底有没有作用?

树木/森林/焚烧可以。但没有试过3个以上的,没有这样的任务。
 
elibrarius:
树木/森林/焚烧可以。但没有试过3个以上的,没有这样的任务。

森林挂了,没有足够的内存

 
mytarmailS:

脚手架挂起来,没有足够的RAM

更少的树木,更少的深度,也许足够了,至少是为了测试。