基于C均值(K均值)对数据进行聚类分析.doc
《基于C均值(K均值)对数据进行聚类分析.doc》由会员分享,可在线阅读,更多相关《基于C均值(K均值)对数据进行聚类分析.doc(16页珍藏版)》请在沃文网上搜索。
1、题目:对数据进行聚类分析的实验(五)一、基本要求用FAMALE.TXT、MALE.TXT和test2.txt的数据作为本次实验使用的样本集,利用C均值和分级聚类方法对样本集进行聚类分析,对结果进行分析,从而加深对所学内容的理解和感性认识。二、 主要思想1、把FAMALE.TXT和MALE.TXT两个文件合并成一个,同时采用身高和体重数据作为特征,设类别数为2,利用C均值聚类方法对数据进行聚类,并将聚类结果表示在二维平面上。尝试不同初始值对此数据集是否会造成不同的结果。2、对1中的数据利用C均值聚类方法分别进行两类、三类、四类、五类聚类,画出聚类指标与类别数之间的关系曲线,探讨是否可以确定出合理
2、的类别数目。3、对1中的数据利用分级聚类方法进行聚类,分析聚类结果,体会分级聚类方法。4、利用test2.txt数据或者把test2.txt的数据与上述1中的数据合并在一起,重复上述实验,考察结果是否有变化,对观察到的现象进行分析,写出体会。三、 实验原理1、 C均值聚类方法(1)C均值算法思想基于使聚类性能指标最小化,所用的聚类准则函数是聚类 集中每一个样本点到该类中心的距离平方之和,并使其最小化。 (2)C均值算法步骤: 1、任选C个初始聚类中心 。一般以开头C个样本作为初始中心。 2、将模式样本集的每一样本按最小距离原则分配给C个聚类中心,即在第m次迭代时,若则, , 表示第m次迭代时,
3、以第j个聚类中心为代表的聚类域3由步骤2计算新的聚类中心,即: 式中Ni为第i个聚类域 中的样本个数。其均值向量作为新的聚类中心,因为这样可以使误差平方和准则函数: 达到最小值。4若 ,算法收敛,计算完毕。否则返回到步骤2,进行下一次迭代。 (3)算法流程图开 始读入要分类的数据设置初始聚类中心计算数据到C个聚类中心的距离将数据分入与其距离最小的聚类计算新的聚类中心聚类中心是否收敛?否输出C个分类好的聚类结 束是四、 实验源代码1、主程序clear allclcFH FW=textread(C:UserslenvoDesktopFEMALE.txt,%f %f);MH MW=textread(
4、C:UserslenvoDesktopMALE.txt,%f %f);Data(1:50,1)=FH;Data(51:100,1)=MH;Data(1:50,2)=FW;Data(51:100,2)=MW;C=input(C)U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm(Data,C)plot(Data(:,1), Data(:,2),o); hold on; maxU = max(U); index1 = find(U(1,:) = maxU); index2 = find(U(2,:) = maxU); line(Data(index1,1),Data
5、(index1,2),marker,*,color,g); line(Data(index2,1),Data(index2,2),marker,*,color,r); plot(P(1 2,1),P(1 2,2),*,color,k) hold off; 2、子程序function U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm(Data,C,plotflag,M,epsm)if nargin5 epsm=1.0e-6; endif nargin4 M=2;endif nargin4 | plotflag Obj_Fcn(iter)=sum(sum(Um.*
6、Dist.2); end % FCM if norm(U-U0,Inf) 3 res = maxrowf(U); for c = 1:C v = find(res=c); Cluster_Res(c,1:length(v)=v; endendif plotflag fcmplot(Data,U,P,Obj_Fcn);endfunction U,P,Dist,Cluster_Res,Obj_Fcn,iter=fuzzycm2(Data,P0,plotflag,M,epsm)if nargin5 epsm=1.0e-6; endif nargin4 M=2;endif nargin4 | plot
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 均值 数据 进行 聚类分析
