ISSN: 2165- 7866
Mgbeafulike IJ und Christopher Ejiofor
Trotz der zunehmenden Verfügbarkeit von Dokumenten in elektronischer Form und der Verfügbarkeit von Desktop-Publishing-Software werden Abstracts weiterhin manuell erstellt. Der Zweck von CONDENZA besteht darin, ein System zur Extraktion von Abstracts aus einem bestimmten Quelldokument zu entwickeln. CONDENZA beschreibt ein System für automatische Methoden zum Erhalten von Abstracts. Der Grundgedanke von Abstracts besteht darin, eine schnelle und genaue Identifizierung des Themas veröffentlichter Arbeiten zu ermöglichen. Die Idee besteht darin, einem potenziellen Leser Zeit und Mühe bei der Suche nach nützlichen Informationen in einem bestimmten Artikel oder Bericht zu ersparen. Das System generiert eine kürzere Version eines bestimmten Satzes und versucht dabei, dessen Bedeutung beizubehalten. Diese Aufgabe wird mithilfe von Zusammenfassungstechniken ausgeführt. CONDENZA implementiert eine Methode, die einen Apriori-Algorithmus zur Erkennung der Schlüsselworthäufigkeit mit einem clusterbasierten Ansatz zum Gruppieren ähnlicher Sätze kombiniert. Das Ergebnis des Systems zeigt, dass unser Ansatz dabei hilft, die Textdokumente effizient zusammenzufassen, indem Redundanz zwischen den Wörtern im Dokument vermieden wird und höchste Relevanz für den Eingabetext gewährleistet wird. Die Leitfaktoren unserer Ergebnisse sind das Verhältnis von Eingabe- zu Ausgabesätzen nach der Zusammenfassung.