ISSN: 2165- 7866
Abaynew Guadie*, Debela Tesfaye, Teferi Kebebew
In diesem Artikel wird die Zusammenfassung amharischer Texte für in sozialen Medien veröffentlichte Nachrichten vorgestellt, um die in amharischen Texten veröffentlichten Nachrichten und die in sozialen Medien auf Twitter und Facebook veröffentlichten Dokumente zusammenzufassen. Das Hauptproblem der in sozialen Medien veröffentlichten Texte besteht darin, dass die meisten Leute die in amharischen Texten veröffentlichten Dokumente wahrscheinlich doppelt lesen würden. Um jedoch die gesuchten Informationen zu finden, muss der Benutzer Zusammenfassungen veröffentlichter Texte finden und wichtige Teile der Posts als amharische Dokumente lesen, um die gewünschten Informationen aus sozialen Medien zu extrahieren. Bei der Zusammenfassung geht es um die Bewältigung einer Informationsüberflutung, indem ein Textdokument für die aktuelle Zeitdarstellung der veröffentlichten Dokumente präsentiert und veröffentlicht wird, um eine Zusammenfassung zu erhalten. Unser vorgeschlagener Ansatz besteht aus drei Hauptkomponenten: Erstens wird die Ähnlichkeit zwischen jedem veröffentlichten Dokument innerhalb der beiden Satzpaare berechnet. Zweitens wird eine Clusterung basierend auf den Ähnlichkeitsergebnissen der Dokumente durchgeführt, um sie mithilfe des Kmeans-Algorithmus zu gruppieren. Drittens werden die geclusterten veröffentlichten Dokumente einzeln mithilfe von TF-IDF-Algorithmen zusammengefasst, bei denen statistische Methoden zur Rangfolge der häufigen Begriffe in den Dokumenten gefunden werden. Die von uns angewendete Zusammenfassungstechnik ist ein extraktiver Zusammenfassungsansatz, der die Sätze mit dem höchsten Rang in den geposteten Dokumenten extrahiert, um die Zusammenfassungen zu bilden, wobei die Größe der Zusammenfassung vom Benutzer ermittelt werden kann. Im ersten Experiment beträgt der höchste F-Maßwert 87,07 % für eine Extraktionsrate bei 30 % in der gruppierten Gruppe der Protestposts. Im zweiten Experiment beträgt der höchste F-Maßwert 84 % für eine Extraktionsrate bei 30 % in den Dürrepostgruppen. Im dritten Experiment beträgt der höchste F-Maßwert 91,37 % für eine Extraktionsrate bei 30 % in den Sportpostgruppen und auch im vierten Experiment beträgt der höchste F-Maßwert 93,52 % für eine Extraktionsrate bei 30 %, um die zusammenfassenden Posttexte zu generieren. Wenn die Größe des Systems zur Generierung der Zusammenfassung erhöht wird, erhöht sich auch die Extraktionsrate in den geposteten Texten. Dafür hat das Bewertungssystem sehr gute Ergebnisse beim Zusammenfassen der geposteten Texte in sozialen Medien gezeigt.