广东策智市场信息咨询股份有限公司
公司地址:广州市天河区林和中路188号附楼三楼A之D08
其它地址:湖南省长沙市天心区劳动西路293号嘉盛奥美城1708室 ;湖北省武汉市建设大道538号同城广场A栋1202;
联系电话:13148420404
公司传真:020-29819059
办公手机:18620250304
官方网址:http://www.gdczdy.com/
企业邮箱:guangdongcezhi@163.com
行业动态
您当前位置:首页 > 行业动态
聚类分析的主要步骤
信息来源:   发布时间:2018-3-21   浏览:

聚类分析的主要步骤

1.数据预处理,
2.为衡量数据点间的相似度定义一个距离函数,
3.聚类或分组,
4.评估输出。
数据预处理包括选择数量,类型和特征的标度,它依靠特征选择和特征抽取,特征选择选择重要的特征,特征抽取把输入的特征转化为一个新的显著特征,它们经常被用来获取一个合适的特征集来为避免“维数灾”进行聚类,数据预处理还包括将孤立点移出数据,孤立点是不依附于一般数据行为或模型的数据,因此孤立点经常会导致有偏差的聚类结果,因此为了得到正确的聚类,我们必须将它们剔除。
既然相类似性是定义一个类的基础,那么不同数据之间在同一个特征空间相似度的衡量对于聚类步骤是很重要的,由于特征类型和特征标度的多样性,距离度量必须谨慎,它经常依赖于应用,例如,通常通过定义在特征空间的距离度量来评估不同对象的相异性,很多距离度都应用在一些不同的领域,一个简单的距离度量,如Euclidean距离,经常被用作反映不同数据间的相异性,一些有关相似性的度量,例如PMC和SMC,能够被用来特征化不同数据的概念相似性,在图像聚类上,子图图像的误差更正能够被用来衡量两个图形的相似性。

相关热点
版权所有  广东策智市场信息咨询股份有限公司 http://www.gdczdy.com/ 
公司地址:广州市天河区林和中路188号附楼三楼A之D08 分公司地址:湖南省长沙市天心区劳动西路293号嘉盛奥美城1708室 ;湖北省武汉市建设大道538号同城广场A栋1202; 
电话:13148420404  手机:18620250304  传真:020-29819059 联系人:胡先生 
网站ICP备案号:粤ICP备2023013887号-1  术支持:斌网网络
在线客服 资深顾问