文章 "数据科学与机器学习(第 09 部分):K-最近邻算法(KNN)"

 

新文章 数据科学与机器学习(第 09 部分):K-最近邻算法(KNN)已发布:

这是一种惰性算法,它不是基于训练数据集学习,而是以存储数据集替代,并在给定新样本时立即采取行动。 尽管它很简单,但它能用于各种实际应用。

K-最近邻算法是一种非参数监督学习分类器,它运用邻近度对单个数据点的分组进行分类或预测。 虽然此算法主要用于分类问题,但它也可解决回归问题。 它通常作为分类算法,由于它假设数据集中的相似点可以在彼此的附近找到。 k-最近邻算法是监督机器学习中最简单的算法之一。 我们将在本文中构筑我们的算法作为分类器。


kNN 算法

作者:Omega J Msigwa

 
祝贺您的文章!我正在回顾更新。
 
您好!

如果我的假设有误,请原谅,但我认为
void CKNNNearestNeighbors::VectorRemoveIndex(vector &v, ulong index)
 {
   vector new_v(v.Size()-1);
   
   for (ulong i=0, count = 0; i<v.Size(); i++)
      if (i == index)
        {
          new_v[count] = new_v[i];
          count++;
        }
 }
是无用的。代码取自 KNN_neareast_neighbors.mqh 文件。
我认为它应该删除具有特定索引的矢量元素,但它什么也没删除,因为原始矢量什么也没发生,函数什么也没返回。

我说错了吗?