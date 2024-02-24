交易中的机器学习：理论、模型、实践和算法交易 - 页 2791

mytarmailS #:
我认为平均分配是一个坏主意，一个非常坏的主意...
尤其是不相关的行，这才是它应该起的作用，山。行
我们应该使用 100 条预测线中的哪一条？平均值是最明显的解决方案。
 
elibrarius #:
那么在 100 条预测线中，该对哪一条进行预测呢？平均是最明显的解决方案。
好吧，假设 50 条预测线向上 50 条向下，求平均值，得到一条水平预测线，然后呢？）
 
mytarmailS #:
好吧，比方说，50 次预测上 50 次预测下，取平均值，得到一个水平预测，然后呢？）
就这样...你有什么选择？
 
elibrarius #:
就是这样。你有什么选择？
嗯，就像我上面建议的那样
 
elibrarius #:
那么在 100 条预测线中，该对哪一条进行预测呢？
我没有看到建议）
信息 "标记的一种变体，即笔测试：

def labeling_entropy(dataset, min_Mi = 0.1, min=15, max=15):
    labels = []
    MIs = []
    for i in range(max, dataset.shape[0]-max*2):
        rand = random.randint(min, max)
        curr_pr = dataset['close'][i]
        future_pr = dataset['close'][i + rand]
        full_pr = dataset[i-rand:i+rand]

        mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])
        MIs.append(mi.mean())

        if future_pr + MARKUP < curr_pr and mi.mean() > min_Mi:
            labels.append(1.0)
        elif future_pr - MARKUP > curr_pr and mi.mean() > min_Mi:
            labels.append(0.0)
        else:
            labels.append(2.0)
    
    dataset = dataset.iloc[max:]
    dataset = dataset.iloc[:len(labels)].copy()
    dataset['labels'] = labels
    return dataset.dropna(), MIs

与我的文章一样，我们将一组符号和标签标记起来，但要考虑到开仓前符号集的 n 个字符串与未来价格的 n 个字符串之间的互信息（回归类型）。

如果互信息低于阈值，我们就标记为不交易。

然后从 2019 年开始，对信号和交易/不交易两个模型进行训练

结果

这种方法收效甚微

 
elibrarius #:
没有看到建议）
好吧，重新看一下我的帖子，最后一张图片。
上面仍然写着
合乎逻辑的做法是尝试其他方案：

mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand], full_pr[full_pr.columns[0]].iloc[0:rand]) сравниваем фичи и цены в момент предсказания
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[0:rand*2], full_pr[full_pr.columns[0]].iloc[0:rand*2]) сравниваем на глубину предсказания вперед + назад
mi = mutual_info_regression(full_pr[full_pr.columns[1:]].iloc[rand:rand*2], full_pr[full_pr.columns[0]].iloc[rand:rand*2]) только вперед
mi = mutual_info_regression(full_pr.iloc[0:rand], full_pr[full_pr.columns[0]].iloc[rand:rand*2])текущие цены и фичи в момент предсказания VS будущие цены

所有选项都不产生任何结果

 
mytarmailS #:
重新看一下我的帖子，最后一张照片。
还是写着

前 25 条只有 2 个变体。2 个错误就是一个小错误。
而且这只是成千上万个图表中的一个变体，碰巧吸引了你的眼球。其他图表的情况会有所不同。您需要制定一个策略（您还没有制定），并观察新数据的平衡线（马克西姆将他的想法进行到底，一切顿时变得清晰）。
一年多前，我也用聚类法做了同样的事情，然后确定了图片中的平均水平，并以此为基础下单。分为向上、向下、均值回归 3 个群组。
有趣的是，无论你使用什么特殊手段，都无法从随机中获得任何好的结果
