按照help来说,输出值IDX里面应该是输入的N个数据,每个所属的聚类中心,确定的方法是最小欧氏距离。
用kmeans函数聚类,输入的是2,500,000*576的矩阵,输出10个聚类中心,和2,500,000个数据每个所落在的聚类中心,按照道理来说判断一个点落在哪个聚类中心里面,就是分别算出这个点和10个聚类中心的欧式距离,哪个欧氏距离最小,就落在哪个聚类中心里面。
但是我发现事实并不是这样,我得到idx和c后,自己手动算了一遍欧氏距离,并且取最小值,发现自己得到的这N个数据所落在的聚类中心和idx不一样!!!!!!!!!!!!!是数据量太大而聚类中心选取太小的缘故么????