基于加权网格和信息熵的并行密度聚类算法
TP311; 针对大数据下基于密度的聚类算法中存在的数据网格划分不合理,聚类结果准确度不高以及并行化效率较低等问题,提出了基于MapReduce和加权网格信息熵的DBWGIE-MR算法.首先提出自适应网格划分策略(ADG)来划分网格单元;其次提出邻居网格扩展策略(NE)用于构建每个数据分区的加权网格,以此提高聚类效果;同时提出加权网格信息熵策略(WGIE)来计算网格密度以及密度聚类算法的ε邻域和核心对象,使密度聚类算法更适用于加权网格;接着结合MapReduce计算模型,提出并行计算局部簇算法(COMCORE-MR),从而加快获取局部簇;最后提出了基于并查集的并行合并局部簇算法(MECORE-...
Gespeichert in:
| Veröffentlicht in: | 计算机科学与探索 Jg. 14; H. 12; S. 2094 - 2107 |
|---|---|
| Hauptverfasser: | , , |
| Format: | Journal Article |
| Sprache: | Chinesisch |
| Veröffentlicht: |
江西理工大学 应用科学学院 信息工程系,江西 赣州 341000%江西理工大学 信息工程学院,江西 赣州 341000
01.12.2020
江西理工大学 信息工程学院,江西 赣州 341000 |
| Schlagworte: | |
| ISSN: | 1673-9418 |
| Online-Zugang: | Volltext |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Schreiben Sie den ersten Kommentar!