.

Design and Development of a Multilingual Balkan WordNet (Balkanet)

ΕΠΙΣΤΗΜΟΝΙΚΟΣ ΥΠΕΥΘΥΝΟΣ: Γρηγοριάδου Μαρία
ΧΡΗΜΑΤΟΔΟΤΗΣ: Ευρωπαϊκή Ένωση
ΗΜ/ΝΙΑ ΕΝΑΡΞΗΣ: 01/09/2001
ΗΜ/ΝΙΑ ΛΗΞΗΣ: 30/08/2004
ΣΥΝΤΟΜΗ ΠΕΡΙΓΡΑΦΗ:
Ο κύριος στόχος του προγράμματος BalkaNet είναι η ανάπτυξη ενός πολύγλωσσου σημασιολογικού δικτύου για τις εξής γλώσσες: βουλγαρικά, τσεχικά, ελληνικά, ρουμανικά, σερβικά, τουρκικά. Αυτό το δίκτυο περιέχει έννοιες από όλες τις γλώσσες συνδεδεμένες μεταξύ τους μέσω ενός διαγλωσσικού ευρετηρίου (Inter-Lingual-Index - ILI) το οποίο περιέχει καθορισμένες λεξικές και σημασιολογικές σχέσεις. Το ILI λειτουργεί ως ένα σύνολο από έννοιες στα Αγγλικά, μέσω του οποίου οι μονογλωσσικές βαλκανικές έννοιες συνδέονται μεταξύ τους, επιτρέποντας έτσι την πλοήγηση μεταξύ διαφορετικών μονόγλωσσων σημασιολογικών δικτύων. Το βασικό κίνητρο για την δημιουργία ενός τέτοιου προγράμματος είναι η επιτυχία ανάλογων προγραμμάτων όπως το Princeton WordNet και το EuroWordNet. Συνεπώς και το BalkaNet αναπτύσσεται με την ίδια λογική όπως και τα παραπάνω προγράμματα και η βασική του γλωσσική μονάδα είναι το σύνολο συνονύμων όρων (synset). Κάθε synset περιέχει τους όρους μιας γλώσσας που έχουν την ίδια σημασιολογική έννοια. Οι όροι μέσα στο ίδιο synset συνδέονται με τη βοήθεια γλωσσικών εσωτερικών λεξικολογικών σχέσεων (π.χ. συνωνυμία) ενώ τα synsets συνδέονται μεταξύ τους μέσω προκαθορισμένων σημασιολογικών σχέσεων (π.χ. υπονυμία, μερονυμία κ.λπ.). Κάθε μονόγλωσσο wordnet αναπτύσσεται με τη χρησιμοποίηση διάφορων λεξικολογικών πόρων, όπως τα επεξηγηματικά λεξικά, σώματα κειμένων, δίγλωσσα λεξικά, θησαυροί συνωνύμων, γλωσσάρια όρων κ.λπ. Οι όροι που εξάγονται από τους προαναφερθέντες πόρους υποβάλλονται σε επεξεργασία και εισάγονται μέσω του προγράμματος επεξεργασίας VisDic σε κάθε μονόγλωσσο Wordnet. Αφού το κύριο σύνολο όρων επιλεχθεί και εισαχθεί στο Wordnet, αυτοί οι όροι συνδέονται μεταξύ τους με τις σημασιολογικές σχέσεις.
Έρευνα > Ερευνητικά Προγράμματα