Detecting Text Similarity Based on Discrete Wavelet Transformation

Megtekintés/ Megnyitás
Metaadat
Teljes megjelenítés
Link a dokumentumra való hivatkozáshoz:
Gyűjtemény
Absztrakt
Detecting similarities between texts is an important stage of many different
applications such as text classification, plagiarism detection, fake news identification,...
In this paper, we propose a new approach to detect similarities between texts based on the
Discrete Wavelet Transform (DWT) method. Specifically, the available source documents
are converted into a set of real numbers called DNAs (Deoxyribose Nucleic Acid) through
DWT. To check the similarity of any text, we also use DWT to generate DNAs for that text
and calculate the smallest Euclidean distance from these DNAs to the source DNAs. Finally,
by comparing with a threshold, the distance values will indicate whether the evaluation text
is similar to a certain source text or not. Experimental results demonstrate that our proposed
algorithm is highly effective in detecting text similarity by testing on a standard data set at
the Annual International Conference on Plagiarism Detection (Plagiarism Analysis,
Authorship Identification, and Near-Duplicate detection – PAN).
- Cím és alcím
- Detecting Text Similarity Based on Discrete Wavelet Transformation
- Szerző
- Vo, Trung Hung
- Felde, Imre
- Ho, Phan Hieu
- Nguye, Ngoc Anh Thi
- Megjelenés ideje
- 2024
- Hozzáférés szintje
- Open access
- ISSN, e-ISSN
- 1785-8860
- Nyelv
- en
- Terjedelem
- 15 p.
- Tárgyszó
- text similarity, text analysis, discrete wavelet transformation, natural language processing, fake new detection
- Változat
- Kiadói változat
- Egyéb azonosítók
- DOI: 10.12700/APH.21.9.2024.9.18
- A cikket/könyvrészletet tartalmazó dokumentum címe
- Acta Polytechnica Hungarica
- A forrás folyóirat éve
- 2024
- A forrás folyóirat évfolyama
- 21. évf.
- A forrás folyóirat száma
- 9. sz.
- Műfaj
- Tudományos cikk
- Tudományterület
- Műszaki tudományok - informatikai tudományok
- Egyetem
- Óbudai Egyetem