基于密度敏感距离和模糊划分的改进FCM算法

TP391.9; 传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法.首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式.此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:计算机科学 Jg. 49; H. z1; S. 285 - 290
Hauptverfasser: 毛森林, 夏镇, 耿新宇, 陈剑辉, 蒋宏霞
Format: Journal Article
Sprache:Chinesisch
Veröffentlicht: 西南石油大学计算机科学学院 成都 610500 16.06.2022
Schlagworte:
ISSN:1002-137X
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:TP391.9; 传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法.首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式.此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离来选取初始聚类中心点.最后通过实验对比表明,与传统FCM聚类算法及其派生算法相比,改进算法不仅具有更高的聚类性能和抗噪性,且收敛速度也显著提高.
ISSN:1002-137X
DOI:10.11896/jsjkx.210700042