A Scalable Similarity Join Algorithm Based on MapReduce and LSH

Similarity joins are recognized to be among the most useful data processing and analysis operations. A similarity join is used to retrieve all data pairs whose distances are smaller than a predefined threshold λ . In this paper, we introduce the MRS-join algorithm to perform similarity joins on larg...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:International journal of parallel programming Jg. 50; H. 3-4; S. 360 - 380
Hauptverfasser: Rivault, Sébastien, Bamha, Mostafa, Limet, Sébastien, Robert, Sophie
Format: Journal Article
Sprache:Englisch
Veröffentlicht: New York Springer US 01.08.2022
Springer Nature B.V
Springer Verlag
Schlagworte:
ISSN:0885-7458, 1573-7640
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!