ISSN: 2165- 7866
Workineh Tesema
In diesem Artikel wird die Bedeutungsclusterung von Wörtern mit mehreren Bedeutungen in Afan Oromo vorgestellt. Die Hauptidee dieser Arbeit besteht darin, Kontexte zu clustern, was eine nützliche Methode zur Entdeckung semantisch verwandter Bedeutungen bietet. Die ähnlichen Kontexte einer bestimmten Bedeutung des Zielworts werden mithilfe von drei hierarchischen und zwei partitionalen Clustern geclustert. Alle Kontexte verwandter Bedeutungen werden in die Clusterung einbezogen und somit für alle Kontexte im Korpus durchgeführt. Die zugrunde liegende Hypothese ist, dass die Clusterung die reflektierte Einheit zwischen den Kontexten erfasst und jede Clusterung mögliche Beziehungen zwischen den Kontexten aufdeckt. Wie das Experiment zeigt, ergeben sich aus den insgesamt fünf Clustern die EM- und K-Means-Cluster, die eine deutlich höhere Genauigkeit erzielen als hierarchische (Einzelclusterung, vollständige Clusterung und durchschnittliche Clusterung). Für Afan Oromo verbessern EM und K-Means die Genauigkeit der Bedeutungsclusterung im Vergleich zu hierarchischen Clusterungsalgorithmen. Jede Clusterung stellt eine einzigartige Bedeutung dar. Einige Wörter haben zwei Bedeutungen der fünf Bedeutungen. Wie das Ergebnis zeigt, betrug die durchschnittliche Genauigkeit des Testsatzes 85,5 %, was bei der unbeaufsichtigten maschinellen Lernarbeit ermutigend ist. Bei diesem Ansatz ist das Finden der richtigen Anzahl von Clustern gleichbedeutend mit dem Finden der Anzahl von Sinnen. Das erreichte Ergebnis war ermutigend, obwohl es weniger Ressourcen erforderte.