|
Paper
#29 |
|
|
|
F.
Mandreoli, R. Martoglia, P. Tiberio "Un
Metodo per il Riconoscimento di Duplicati in
Collezioni di Documenti"
|
|
Keywords:
duplicate detection, information retrieval, document processing
|
|
|
|
I recenti avanzamenti nel calcolo e nelle telecomunicazioni hanno creato le giuste condizioni per la diffusione di informazioni elettroniche e di nuovi strumenti per
l'analisi del loro contenuto, sollevando problemi di duplicate detection.
In questo articolo introduciamo DANCER, un sistema di duplicate detection che sfrutta idee innovative
nell'ambito dell'information retrieval per l'identificazione dei documenti duplicati, utilizzando algoritmi e misure di similarità inedite in questo campo.
|
|