Skip to main content
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
9 Απριλίου 2024

Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης

Δημήτρης Μαλλάς

Ένας από τους βασικούς λόγους που γίνεται τόσος λόγος για την τεχνητή νοημοσύνη τον τελευταίο 1,5 χρόνο είναι το γεγονός ότι το ChatGPT έδωσε τη δυνατότητα στους χρήστες να επικοινωνούν με μία εφαρμογή ΑΙ με έναν πιο φυσικό τρόπο. Αυτό επετεύχθη χάρη στην υλοποίηση ενός μεγάλου γλωσσικού μοντέλου (large language model – LLM), όπως ονομάζονται αυτές οι υλοποιήσεις, οι περισσότερες εκ των οποίων είναι στα αγγλικά. Και τώρα ήρθε η ώρα να δούμε το πρώτο LLM στα ελληνικά.

Το όνομα του πρώτου LLM για την ελληνική γλώσσα είναι Meltemi και είναι το αποτέλεσμα έρευνας και ανάπτυξης του ιδιαίτερα δραστήριου Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά (ΙΕΛ/ΕΚ Αθηνά). Μία κίνηση η οποία, όπως εξηγεί στο CNN Greece, ο Βασίλης Κατσούρος, διευθυντής του ΙΕΛ, έχει ως στόχο να βάλει και την ελληνική γλώσσα μέσα στο «παιχνίδι» της τεχνητής νοημοσύνης και ιδίως στον τομέα του GenAI, όπου τα γλωσσικά μοντέλα διαδραματίζουν σημαντικό ρόλο.

Το Meltemi είναι ένα ανοιχτό μεγάλο γλωσσικό μοντέλο για τα ελληνικά, διαθέσιμο για ερευνητικούς αλλά και εμπορικούς σκοπούς. Αυτό σημαίνει ότι μπορούν να το χρησιμοποιήσουν τόσο ερευνητές όσο και επιχειρήσεις που θέλουν να αναπτύξουν εφαρμογές που αξιοποιούν το GenAI και να δίνουν τη δυνατότητα διάδρασης στα ελληνικά. Το Meltemi βασίζεται στην πλατφόρμα Mistral-7Β και βελτιώνει σε σημαντικό βαθμό τις επιδόσεις του Mistral στην κατανόηση και παραγωγή γλώσσας στα ελληνικά, καθώς έχει αναπτυχθεί μέσω συνεχιζόμενης προ-εκπαίδευσης (continual pre-training) σε ένα μεγάλο σώμα ελληνικών κειμένων υψηλής ποιότητας (28.5 δισ. tokens). Σύμφωνα με τον κ. Κατσούρο, χρειάστηκαν περίπου 9 μήνες για την ανάπτυξη του, ενώ εργάστηκαν πάνω στο συγκεκριμένο έργο πάνω από 10 ερευνητές με διαφορετικές ειδικότητες από το ινστιτούτο και όχι μόνο. Επίσης, αξίζει να σημειωθεί ότι η εκπαίδευση των μοντέλων πραγματοποιήθηκε σε υποδομές cloud της Amazon, οι οποίες παρέχονται στην ερευνητική και ακαδημαϊκή κοινότητα από το Εθνικό Δίκτυο Υποδομών Τεχνολογίας και Έρευνας (ΕΔΥΤΕ Α.Ε.–GRNET).

Πως θα αξιοποιηθεί

Το βασικό ερώτημα είναι πως θα μπορεί να αξιοποιηθεί. Όπως αναφέρει ο κ. Κατσούρος, θα υπάρξουν αρκετές εφαρμογές σε κάθετους κλάδους όπως είναι ο χρηματοπιστωτικός αλλά ακόμη και αυτός της παραγωγής περιεχομένου, οι οποίες θα χρησιμοποιήσουν το Meltemi προκειμένου να προσφέρουν τη δυνατότητα στους πελάτες τους να κάνουν ερωτήσεις -και να παίρνουν απαντήσεις- στα ελληνικά. Ουσιαστικά, κάθε μεγάλη εταιρεία είναι σε θέση να αξιοποιήσει ένα LLM προκειμένου να δώσει πρόσβαση στη γνώση που διαθέτει και ακόμη και η ενότητα των «συχνών ερωτήσεων» θα μπορούσε να είναι πλέον ουσιαστικά ένας διάλογος.

Επιπλέον, υπάρχουν πολλές δυνατότητες και προοπτικές στο χώρο της εκπαίδευσης, έναν τομέα με τον οποίο ασχολείται ιδιαίτερα το ΙΕΛ έχοντας αναπτύξει εφαρμογές που επιτρέπουν σε μαθητές να κάνουν ερωτήσεις -και να λαμβάνουν απαντήσεις- αναφορικά με το περιεχόμενο ενός σχολικού βιβλίου!

Το ζητούμενο, βέβαια, είναι να γίνεται η σωστή ερώτηση προκειμένου η απάντηση να είναι καλύτερη. «Οι πολίτες θα πρέπει να εκπαιδευτούν για να κάνουν τη σωστή ερώτηση» αναφέρει ο κ. Κατσούρος.

Ένα άλλο ζητούμενο είναι να μπορέσει η ελληνική γλώσσα να «επιβιώσει» σε αυτό τον νέο κόσμο που δημιουργείται. Ο κ. Κατσούρος εκτιμά ότι θα υπάρξουν και άλλα ελληνικά LLM, κάτι που θα αποτελέσει μία θετική εξέλιξη.

Με δεδομένο, όμως, ότι το ίδιο ζήτημα υπάρχει για αρκετές γλώσσες, ιδίως για χώρες της Ευρωπαϊκής Ένωσης, είναι εξίσου σημαντικό να υπάρχει υποστήριξη πολυγλωσσικών μοντέλων. Υπό αυτό το πρίσμα έχει ιδιαίτερο ενδιαφέρον η δημιουργία από την ΕΕ της ευρωπαϊκής ψηφιακής υποδομής «Συμμαχία για τις Γλωσσικές Τεχνολογίες» (ALT-EDIC: Alliance for Language Technologies – European Digital Infrastructure Consortium), στην οποία συμμετέχει η Ελλάδα με το υπουργείο Ψηφιακής Διακυβέρνησης να συνεργάζεται στενά με το Ερευνητικό Κέντρο Αθηνά για το συγκεκριμένο θέμα. Ιδιαίτερα σημαντική θα είναι η συμβολή της ALT-EDIC στην ανάπτυξη εφαρμογών Τεχνητής Νοημοσύνης που στηρίζονται σε μεγάλα γλωσσικά μοντέλα ειδικά για γλώσσες με μικρότερο αριθμό ομιλητών, όπως η ελληνική. Μέσω της κατάλληλης διαχείρισης γλωσσικών δεδομένων από την Ελληνική και άλλες ευρωπαϊκές γλώσσες, αναμένεται να συγκεντρωθεί ο ενδεδειγμένος όγκος και να δημιουργηθούν γλωσσικά δεδομένα για εξειδικευμένους τομείς ενδιαφέροντος με διαπιστωμένες ελλείψεις στην τεχνολογική τους κάλυψη, όπως ο τουρισμός, ο πολιτισμός, η τραπεζική, οι κατασκευές, οι μεταφορές, η δικαιοσύνη, η ναυτιλία, κ.ά. Στο πλαίσιο της λειτουργίας της ALT-EDIC, το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά θα συντονίσει την εθνική συμμετοχή, ενώ θα πρέπει να σημειωθεί ότι θα υπάρξουν σημαντικές χρηματοδοτήσεις από την πλευρά της ΕΕ όσον αφορά την ανάπτυξη πολυγλωσσικών LLMs.

Πηγή: https://www.cnn.gr

  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU

ΕΝΔΙΑΦΕΡΟΝΤΑ

Στα πλαίσια των εκδηλώσεων «Πεσσάδεια 2024», Ημέρες Τέχνης & Λόγου την Κυριακή 28 Ιουλίου στ…
Την Παρασκευή 26 Ιουλίου 2024 προσφέρθηκε από τον Δήμο Αργοστολίου δωρεάν μέτρηση σακχάρου προς …
Ο Γιάννης Σερβετάς αυτές τις μέρες κάνει διακοπές στην Κεφαλονιά και ήδη έχουμε δει μερικές αναρ…
Η Alys μας, το τελευταίο από τα 6 κουτάβια που είχαν βρεθεί παρατημένα μαζί με τη μητέρα τους στ…
Η επιθυμία να μασάτε παγάκια σίγουρα δεν είναι σπάνια και πολλοί την εφαρμόζουν για να κόψουν τ…
Η Ευρωπαϊκή Ένωση ανάγκασε την Apple να ανοίξει το οικοσύστημά της σε εναλλακτικά iOS marketplac…
  • YOU
  • YOU
  • YOU
  • YOU

ΕΚΔΗΛΩΣΕΙΣ

27 Ιουλίου 2024
Πραγματοποιήθηκε σήμερα Παρασκευή 26 Ιουλίου και ώρα 21.00, στα Μεταξάτα η εκδήλωση για τα 200 …
26 Ιουλίου 2024
Παρευρεθήκαμε σήμερα στη διατομική έκθεση “Υποθαλάσσιες πολυμορφίες” / “Underwaterdiversities” …
26 Ιουλίου 2024
Με ομιλία από τον Διονύση Γαρμπή και χορούς από τον Καλλιτεχνικο-Χορευτικό Σύλλογο Φραγκάτων «Ο …
26 Ιουλίου 2024
Πραγματοποιήθηκε σήμερα , στο Δημοτικό Θέατρο Αργοστολίου “Κέφαλος”, η συνέντευξη τύπου των διορ…
  • YOU
  • YOU
  • YOU
  • YOU

ΑΦΙΕΡΩΜΑΤΑ

Ανακαλύψτε το Μέλλον της Μετακίνησης στην Νippy eco mobility
17 Ιουλίου 2024
Eίναι το νέο σημείο αναφοράς για e-bikes, e-scooters και αξεσουάρ, την οδό Σουηδίας 125. Εκεί θα…
«Τρυπώσαμε» στις πρόβες της θεατρικής παράστασης «Το θεριό του ταύρου»
11 Ιουλίου 2024
ΘΕΑΤΡΙΚΗ ΠΑΡΑΣΤΑΣΗ «ΤΟ ΘΕΡΙΟ ΤΟΥ ΤΑΥΡΟΥ» Σάββατο 13 & Κυριακή 14 Ιουλίου και ώρα 21:00, σ…
«Παραδοσιακό Μαγειριό» η νέα επιχείρηση στην οδό Σιτεμπόρων στο Αργοστόλι
8 Ιουλίου 2024
Το νέο παραδοσιακό μαγειρείο στην οδό Σιτεμπόρων Αργοστόλι άνοιξε και σας περιμένει! Μια νέα …
Tzannatos Jewellers Corner : Το νέο κόσμημα του Λιθοστρώτου
21 Ιουνίου 2024
Ο στόχος μας πάντα είναι να προσφέρουμε ποιοτικά, διαχρονικά αλλά και μοντέρνα σχέδια για την το…
  • YOU
  • YOU
  • YOU
  • YOU