Обсуждение статьи "Машинное обучение и Data Science (Часть 8): Кластеризация методом k-средних в MQL5"

MetaQuotes 2022.12.21 16:26

Опубликована статья Машинное обучение и Data Science (Часть 8): Кластеризация методом k-средних в MQL5:

Для всех, кто работает с данными, включая трейдеров, data mining может открыть совершенно новые возможности, ведь зачастую данные не такие простые, какими кажутся. Человеческому глазу сложно увидеть глубинные закономерности и отношения в наборе данных. Одно из решений — алгоритм К-средних. Давайте посмотрим, полезен ли он.

Кластерный анализ — задача упорядочивания множества объектов по группам таким образом, чтобы объекты с одинаковыми атрибутами помещались в одни и те же группы (кластеры).

Например, в магазинах схожие продукты располагаются вместе. Кто-то рассортировал их по группам. Когда данные в наборе не рассортированы по группам, кластерный анализ сделает то же самое — он соберет по группам (кластерам) наиболее схожие значения данных, выделив данные из общего набора.

Кластерный анализ сам по себе не является алгоритмом. Для решения основной задачи можно использовать различные алгоритмы, существенно различающиеся по своему пониманию того, что же представляет собой кластер.

Источник изображения: Википедия

Наиболее широко известны три типа кластеризации:

Исключающая
Перекрывающая
Иерархическая

Автор: Omega J Msigwa

Zhiqiang Zhu 2023.02.11 06:08 #1

Прежде всего, я хотел бы поблагодарить автора за то, что он поделился этой статьей. Надеюсь, что автор, помимо объяснения теорий, сможет привести примеры использования кластеризации K-mean в реальной торговле, если соответствующих примеров нет, то эта или другие статьи автора практически неотличимы от учебников. Машинное обучение используется во многих областях.

Было бы неплохо, если бы автор смог лучше проиллюстрировать эти теории машинного обучения на примерах торговых механизмов МТ5. Еще раз спасибо, что поделились.

Машинное обучение в трейдинге: Обсуждение статьи "Создай торговый Обсуждение статьи "Нейросети это

Mahdi Ebrahimzadeh 2024.01.21 15:43 #2

MetaQuotes:

Новая статья Наука о данных и машинное обучение (часть 08): Кластеризация K-Means на простом MQL5 опубликована:

Автор: Omega J Msigwa

m_cols = Matrix.Cols();
      n = Matrix.Rows(); //количество элементов | строк матрицы
      
      InitialCentroids.Resize(m_clusters,m_cols);     
      vector cluster_comb_v = {};
      matrix cluster_comb_m = {};      
      vector rand_v = {};
      
      for (ulong i=0; i<m_clusters; i++) 
        {
          rand_v = Matrix.Row(i * m_clusters); 
          InitialCentroids.Row(rand_v,i);
        }     
     Print("Initial Centroids matrix\n",InitialCentroids);

Привет Omega J Msigwa, спасибо за вашу очень полезную статью.

Я что-то пропустил или в приведенном выше коде вы имеете в виду DMatrix?

Omega J Msigwa 2024.01.22 07:35 #3

Mahdi Ebrahimzadeh #:

Здравствуйте, Omega J Msigwa, спасибо за вашу очень полезную статью.

Я что-то упустил, или в приведенном выше коде вы имеете в виду DMatrix?

Я имею в виду Matrix, как объясняется в статье, поскольку этот код находится под функцией

void CKMeans::KMeansClustering(const matrix &Matrix, matrix &clustered_matrix,int iterations = 10)
 { 
      m_cols = Matrix.Cols();
      n = Matrix.Rows(); //количество элементов | строк матрицы
      
      InitialCentroids.Resize(m_clusters,m_cols);
      cluster_assign.Resize(n);
            
      clustered_matrix.Resize(m_clusters, m_clusters*n);
      clustered_matrix.Fill(NULL);
      
      vector cluster_comb_v = {};
      matrix cluster_comb_m = {};      
      vector rand_v = {};      
      for (ulong i=0; i<m_clusters; i++) 
        {
          rand_v = Matrix.Row(i * m_clusters); 
          InitialCentroids.Row(rand_v,i);
        }     
     Print("Initial Centroids matrix\n",InitialCentroids);    
.... rest of the code

Новый комментарий