Skip to main content
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης
9 Απριλίου 2024

Ένα Meltemi φέρνει τα ελληνικά στο χώρο της τεχνητής νοημοσύνης

Δημήτρης Μαλλάς

Ένας από τους βασικούς λόγους που γίνεται τόσος λόγος για την τεχνητή νοημοσύνη τον τελευταίο 1,5 χρόνο είναι το γεγονός ότι το ChatGPT έδωσε τη δυνατότητα στους χρήστες να επικοινωνούν με μία εφαρμογή ΑΙ με έναν πιο φυσικό τρόπο. Αυτό επετεύχθη χάρη στην υλοποίηση ενός μεγάλου γλωσσικού μοντέλου (large language model – LLM), όπως ονομάζονται αυτές οι υλοποιήσεις, οι περισσότερες εκ των οποίων είναι στα αγγλικά. Και τώρα ήρθε η ώρα να δούμε το πρώτο LLM στα ελληνικά.

Το όνομα του πρώτου LLM για την ελληνική γλώσσα είναι Meltemi και είναι το αποτέλεσμα έρευνας και ανάπτυξης του ιδιαίτερα δραστήριου Ινστιτούτου Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά (ΙΕΛ/ΕΚ Αθηνά). Μία κίνηση η οποία, όπως εξηγεί στο CNN Greece, ο Βασίλης Κατσούρος, διευθυντής του ΙΕΛ, έχει ως στόχο να βάλει και την ελληνική γλώσσα μέσα στο «παιχνίδι» της τεχνητής νοημοσύνης και ιδίως στον τομέα του GenAI, όπου τα γλωσσικά μοντέλα διαδραματίζουν σημαντικό ρόλο.

Το Meltemi είναι ένα ανοιχτό μεγάλο γλωσσικό μοντέλο για τα ελληνικά, διαθέσιμο για ερευνητικούς αλλά και εμπορικούς σκοπούς. Αυτό σημαίνει ότι μπορούν να το χρησιμοποιήσουν τόσο ερευνητές όσο και επιχειρήσεις που θέλουν να αναπτύξουν εφαρμογές που αξιοποιούν το GenAI και να δίνουν τη δυνατότητα διάδρασης στα ελληνικά. Το Meltemi βασίζεται στην πλατφόρμα Mistral-7Β και βελτιώνει σε σημαντικό βαθμό τις επιδόσεις του Mistral στην κατανόηση και παραγωγή γλώσσας στα ελληνικά, καθώς έχει αναπτυχθεί μέσω συνεχιζόμενης προ-εκπαίδευσης (continual pre-training) σε ένα μεγάλο σώμα ελληνικών κειμένων υψηλής ποιότητας (28.5 δισ. tokens). Σύμφωνα με τον κ. Κατσούρο, χρειάστηκαν περίπου 9 μήνες για την ανάπτυξη του, ενώ εργάστηκαν πάνω στο συγκεκριμένο έργο πάνω από 10 ερευνητές με διαφορετικές ειδικότητες από το ινστιτούτο και όχι μόνο. Επίσης, αξίζει να σημειωθεί ότι η εκπαίδευση των μοντέλων πραγματοποιήθηκε σε υποδομές cloud της Amazon, οι οποίες παρέχονται στην ερευνητική και ακαδημαϊκή κοινότητα από το Εθνικό Δίκτυο Υποδομών Τεχνολογίας και Έρευνας (ΕΔΥΤΕ Α.Ε.–GRNET).

Πως θα αξιοποιηθεί

Το βασικό ερώτημα είναι πως θα μπορεί να αξιοποιηθεί. Όπως αναφέρει ο κ. Κατσούρος, θα υπάρξουν αρκετές εφαρμογές σε κάθετους κλάδους όπως είναι ο χρηματοπιστωτικός αλλά ακόμη και αυτός της παραγωγής περιεχομένου, οι οποίες θα χρησιμοποιήσουν το Meltemi προκειμένου να προσφέρουν τη δυνατότητα στους πελάτες τους να κάνουν ερωτήσεις -και να παίρνουν απαντήσεις- στα ελληνικά. Ουσιαστικά, κάθε μεγάλη εταιρεία είναι σε θέση να αξιοποιήσει ένα LLM προκειμένου να δώσει πρόσβαση στη γνώση που διαθέτει και ακόμη και η ενότητα των «συχνών ερωτήσεων» θα μπορούσε να είναι πλέον ουσιαστικά ένας διάλογος.

Επιπλέον, υπάρχουν πολλές δυνατότητες και προοπτικές στο χώρο της εκπαίδευσης, έναν τομέα με τον οποίο ασχολείται ιδιαίτερα το ΙΕΛ έχοντας αναπτύξει εφαρμογές που επιτρέπουν σε μαθητές να κάνουν ερωτήσεις -και να λαμβάνουν απαντήσεις- αναφορικά με το περιεχόμενο ενός σχολικού βιβλίου!

Το ζητούμενο, βέβαια, είναι να γίνεται η σωστή ερώτηση προκειμένου η απάντηση να είναι καλύτερη. «Οι πολίτες θα πρέπει να εκπαιδευτούν για να κάνουν τη σωστή ερώτηση» αναφέρει ο κ. Κατσούρος.

Ένα άλλο ζητούμενο είναι να μπορέσει η ελληνική γλώσσα να «επιβιώσει» σε αυτό τον νέο κόσμο που δημιουργείται. Ο κ. Κατσούρος εκτιμά ότι θα υπάρξουν και άλλα ελληνικά LLM, κάτι που θα αποτελέσει μία θετική εξέλιξη.

Με δεδομένο, όμως, ότι το ίδιο ζήτημα υπάρχει για αρκετές γλώσσες, ιδίως για χώρες της Ευρωπαϊκής Ένωσης, είναι εξίσου σημαντικό να υπάρχει υποστήριξη πολυγλωσσικών μοντέλων. Υπό αυτό το πρίσμα έχει ιδιαίτερο ενδιαφέρον η δημιουργία από την ΕΕ της ευρωπαϊκής ψηφιακής υποδομής «Συμμαχία για τις Γλωσσικές Τεχνολογίες» (ALT-EDIC: Alliance for Language Technologies – European Digital Infrastructure Consortium), στην οποία συμμετέχει η Ελλάδα με το υπουργείο Ψηφιακής Διακυβέρνησης να συνεργάζεται στενά με το Ερευνητικό Κέντρο Αθηνά για το συγκεκριμένο θέμα. Ιδιαίτερα σημαντική θα είναι η συμβολή της ALT-EDIC στην ανάπτυξη εφαρμογών Τεχνητής Νοημοσύνης που στηρίζονται σε μεγάλα γλωσσικά μοντέλα ειδικά για γλώσσες με μικρότερο αριθμό ομιλητών, όπως η ελληνική. Μέσω της κατάλληλης διαχείρισης γλωσσικών δεδομένων από την Ελληνική και άλλες ευρωπαϊκές γλώσσες, αναμένεται να συγκεντρωθεί ο ενδεδειγμένος όγκος και να δημιουργηθούν γλωσσικά δεδομένα για εξειδικευμένους τομείς ενδιαφέροντος με διαπιστωμένες ελλείψεις στην τεχνολογική τους κάλυψη, όπως ο τουρισμός, ο πολιτισμός, η τραπεζική, οι κατασκευές, οι μεταφορές, η δικαιοσύνη, η ναυτιλία, κ.ά. Στο πλαίσιο της λειτουργίας της ALT-EDIC, το Ινστιτούτο Επεξεργασίας του Λόγου του Ερευνητικού Κέντρου Αθηνά θα συντονίσει την εθνική συμμετοχή, ενώ θα πρέπει να σημειωθεί ότι θα υπάρξουν σημαντικές χρηματοδοτήσεις από την πλευρά της ΕΕ όσον αφορά την ανάπτυξη πολυγλωσσικών LLMs.

Πηγή: https://www.cnn.gr

  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU
  • YOU

ΕΝΔΙΑΦΕΡΟΝΤΑ

Πρεμιέρα για 10 ταινίες: Περιπέτειες, δράματα, αίσθημα, θρίλερ στο μενού για τους σινεφίλ

Δέκα ταινίες κάνουν πρεμιέρα την Πέμπτη 16 Μαΐου στις κινηματογραφικές αίθουσες με του…

Λύθηκε το μυστήριο με το φόντο της Μόνα Λίζα – Τι υποστηρίζει φιλοτέχνης γεωλόγος

Πάνω από 500 χρόνια αφότου ο Λεονάρντο ντα Βίντσι ζωγράφισε τη Μόνα Λίζα, μία ακαδημαϊκός π…

Η Κάθριν Μπίγκελοου θα σκηνοθετήσει την επόμενη ταινία της για το Netflix

Η βραβευμένη με Όσκαρ σκηνοθέτης Κάθριν Μπίγκελοου θα σκηνοθετήσει την επόμενη μεγάλου…

Το Βρετανικό Μουσείο αναφέρει ότι ανέκτησε 626 κλεμμένα ή χαμένα αντικείμενα

Toν Αύγουστο του 2023 έγινε γνωστό ότι εκατοντάδες αντικείμενα είχαν χαθεί Bρετανικό Μουσείο:…

“It ends with us”: Στη νέα της ταινία η Blake Lively πέφτει θύμα κακοποίησης μέσα στη σχέση της

Στην κινηματογραφική μεταφορά του ομώνυμου best seller. Το εξαιρετικά δημοφιλές ρομαντικό μυθ…

Σε αυτά τα πέντε αεροδρόμια θα κάνετε την πιο θεαματική προσγείωση

Υπάρχουν πολλά που αγαπάμε στα ταξίδια. Η εμπειρία ενός νέου πολιτισμού. Να τρώμε υπέροχο φαγητό…
  • YOU
  • YOU
  • YOU
  • YOU

ΕΚΔΗΛΩΣΕΙΣ

20 Μαΐου 2024

Γυναικεία Χορωδία Δήμου Αργοστολίου: «Σαν του Μαϊού τες ευωδιές» @Κέφαλος [19.05.2024]

Πραγματοποιήθηκε σήμερα στα πλαίσια των εορταστικών εκδηλώσεων για την Ένωση των Επτανήσων με τη…
19 Μαΐου 2024

Κτήμα Χαριτάτος: Ανοιχτές Πόρτες 2024 [19.05.2024]

Με τον πρωινό ήλιο της Κυριακής αλλά και με το αεράκι της κυριακάτικης βραδιάς πραγματοποιήθηκε …
19 Μαΐου 2024

Συναυλία σπουδαστών της Φιλαρμονικής Σχολής Κεφαλληνίας @Αργοστόλι [18.05.2024]

Χθες Σάββατο 18 Μαΐου και ώρα 8μμ η αίθουσα συναυλιών της Φ.Σ.Κ. γέμισε από μουσική και ενθουσια…
19 Μαΐου 2024

1st Annual Kefalonia Distinguished Gentleman’s Ride [19.05.2024]

Tο Distinguished Gentleman’s Ride ενώνει αναβάτες κλασικής και vintage μοτοσικλέτας από όλο τον …
  • YOU
  • YOU
  • YOU
  • YOU

ΑΦΙΕΡΩΜΑΤΑ

Ταξιδεύοντας με τις γεύσεις του «Wokinn» [17.05.2024]
17 Μαΐου 2024

Ταξιδεύοντας με τις γεύσεις του «Wokinn» [17.05.2024]

Εάν δεν έχεις δοκιμάσει τα λαχταριστά πιάτα του Wokinn νομίζουμε πως ήρθε η στιγμή να τρέξεις……
Στο κατάστημα «Loukoumania» θα βρεις λαχταριστά γλυκίσματα
2 Μαΐου 2024

Στο κατάστημα «Loukoumania» θα βρεις λαχταριστά γλυκίσματα

Καθώς μπαίνει το Πάσχα τείνουμε όλοι να αναζητούμε πιο έντονα γλυκές λιχουδιές, το κατάστημα Lou…
Πασχαλινά γλυκίσματα από τον φούρνο «Τρίτη Γενιά»
2 Μαΐου 2024

Πασχαλινά γλυκίσματα από τον φούρνο «Τρίτη Γενιά»

Τσουρέκια απλά ,γεμιστά με Μπουένο , σοκολάτα , κάστανο , σοκολάτα μπανάνα ,λευκή σοκολάτα , έρε…
Στα καταστήματα «Voskopoula since 1910» θα βρείτε εξαιρετικές πασχαλινές λιχουδιές
2 Μαΐου 2024

Στα καταστήματα «Voskopoula since 1910» θα βρείτε εξαιρετικές πασχαλινές λιχουδιές

Στα καταστήματα «Voskopoula sinve 1910» σας περιμένουν πασχαλινές λιχουδιές από πασχαλινό πανετό…
  • YOU
  • YOU
  • YOU
  • YOU