Óbudai Egyetem Digitális Archívum
    • magyar
    • English
  • magyar 
    • magyar
    • English
  • Bejelentkezés
Megtekintés 
  •   ÓDA repozitórium kezdőoldal
  • 5. Folyóiratcikkek
  • Acta Polytechnica Hungarica
  • 2.3. 2024 Volume 21, Issue No. 9.
  • Megtekintés
  •   ÓDA repozitórium kezdőoldal
  • 5. Folyóiratcikkek
  • Acta Polytechnica Hungarica
  • 2.3. 2024 Volume 21, Issue No. 9.
  • Megtekintés
JavaScript is disabled for your browser. Some features of this site may not work without it.

Detecting Text Similarity Based on Discrete Wavelet Transformation

Thumbnail
Megtekintés/Megnyitás
Vo_Felde_Ho_Nguyen_149.pdf (976.6KB)
Metaadat
Teljes megjelenítés
Link a dokumentumra való hivatkozáshoz:
http://hdl.handle.net/20.500.14044/32902
Gyűjtemény
  • 2.3. 2024 Volume 21, Issue No. 9. [17]
Absztrakt
Detecting similarities between texts is an important stage of many different applications such as text classification, plagiarism detection, fake news identification,... In this paper, we propose a new approach to detect similarities between texts based on the Discrete Wavelet Transform (DWT) method. Specifically, the available source documents are converted into a set of real numbers called DNAs (Deoxyribose Nucleic Acid) through DWT. To check the similarity of any text, we also use DWT to generate DNAs for that text and calculate the smallest Euclidean distance from these DNAs to the source DNAs. Finally, by comparing with a threshold, the distance values will indicate whether the evaluation text is similar to a certain source text or not. Experimental results demonstrate that our proposed algorithm is highly effective in detecting text similarity by testing on a standard data set at the Annual International Conference on Plagiarism Detection (Plagiarism Analysis, Authorship Identification, and Near-Duplicate detection – PAN).
Cím és alcím
Detecting Text Similarity Based on Discrete Wavelet Transformation
Szerző
Vo, Trung Hung
Felde, Imre
Ho, Phan Hieu
Nguye, Ngoc Anh Thi
Megjelenés ideje
2024
Hozzáférés szintje
Open access
ISSN, e-ISSN
1785-8860
Nyelv
en
Terjedelem
15 p.
Tárgyszó
text similarity, text analysis, discrete wavelet transformation, natural language processing, fake new detection
Változat
Kiadói változat
Egyéb azonosítók
DOI: 10.12700/APH.21.9.2024.9.18
A cikket/könyvrészletet tartalmazó dokumentum címe
Acta Polytechnica Hungarica
A forrás folyóirat éve
2024
A forrás folyóirat évfolyama
21. évf.
A forrás folyóirat száma
9. sz.
Műfaj
Tudományos cikk
Tudományterület
Műszaki tudományok - informatikai tudományok
Egyetem
Óbudai Egyetem

DSpace software copyright © 2002-2016  DuraSpace
Kapcsolat | Visszajelzés
Theme by 
Atmire NV
 

 

Böngészés

A teljes ÓDA-banKategóriák és gyűjteményekMegjelenés dátumaSzerzőCímTárgyszóA gyűjteménybenMegjelenés dátumaSzerzőCímTárgyszó

Személyes felhasználói fiók

BejelentkezésRegisztráció

DSpace software copyright © 2002-2016  DuraSpace
Kapcsolat | Visszajelzés
Theme by 
Atmire NV