Implementation of Indexing Techniques to Prevent Data Leakage and Duplication in Internet

Research in this area aims to create a new and efficient method for detecting near-duplicates in online content. Web pages that a search engine has scoured are first parsed to remove HTML elements and java scripts. After this phase, remove common keywords or stop words from the crawled pages. The af...

Celý popis

Uloženo v:
Podrobná bibliografie
Vydáno v:2022 International Conference on Advances in Computing, Communication and Applied Informatics (ACCAI) s. 1 - 9
Hlavní autoři: Nalini, M. K., K, Dhinakaran, D, Elantamilan, Gnanavel, R., Vinod, D.
Médium: Konferenční příspěvek
Jazyk:angličtina
Vydáno: IEEE 28.01.2022
Témata:
On-line přístup:Získat plný text
Tagy: Přidat tag
Žádné tagy, Buďte první, kdo vytvoří štítek k tomuto záznamu!
Buďte první, kdo okomentuje tento záznam!
Nejprve se musíte přihlásit.