Μια ομάδα από το Πανεπιστήμιο Martin Luther Halle-Wittenberg, το Πανεπιστήμιο Johannes Gutenberg Mainz και το Πανεπιστήμιο Εφαρμοσμένων Επιστημών του Mainz παρουσίασε ένα σύστημα AI (τεχνητή νοημοσύνη) το οποίο είναι ικανό να αποκρυπτογραφήσει αρχαία σφηνοειδή κείμενα. Αυτή η νέα τεχνολογία, που αξιοποιεί τρισδιάστατα μοντέλα, αποτελεί σημαντική πρόοδο στην κατανόηση μιας από τις πρώτες μορφές γραφής της ανθρωπότητας.
Η μελέτη των ερευνητών, που δημοσιεύθηκε στο περιοδικό The Eurographics Association, επικεντρώθηκε σε ένα σύνολο πλακών σφηνοειδούς γραφής από τη συλλογή Frau Professor Hilprecht. Οι πλάκες αυτές προέρχονται κυρίως από την αρχαία Μεσοποταμία, μια ιστορική περιοχή στο σημερινό Ιράκ. Στην περιοχή αυτή, που συχνά αναφέρεται ως το λίκνο του πολιτισμού, αναπτύχθηκαν μερικές από τις πρώτες ανθρώπινες κοινωνίες. Οι πλάκες είναι χαραγμένες με μια σειρά από σύμβολα, σημεία και σφήνες που αποτελούν τις γλώσσες της περιοχής, όπως η σουμεριακή, η ασσυριακή και η ακκαδική.
Πολλές από αυτές είναι ηλικίας άνω των 5.000 ετών και προσφέρουν μια ματιά στους αρχαίους πολιτισμούς, καλύπτοντας ένα ευρύ φάσμα θεμάτων από την καθημερινή ζωή έως τα νομικά ζητήματα.
«Τα πάντα μπορούν να βρεθούν στις πλάκες. Από λίστες με ψώνια μέχρι δικαστικές αποφάσεις. Παρέχουν μια ματιά στο παρελθόν της ανθρωπότητας πριν από αρκετές χιλιετίες. Ωστόσο, είναι έντονα διαβρωμένες και συνεπώς είναι δύσκολο να αποκρυπτογραφηθούν ακόμη και από εκπαιδευμένα μάτια» δήλωσε ο Hubert Mara, ένας από τους συγγραφείς της μελέτης.
Η ομάδα στράφηκε στην AI για βοήθεια
Χρησιμοποιώντας μια νέα διαδικασία τεχνητής νοημοσύνης για την αποκωδικοποίηση αρχαίων σφηνοειδών πλακών, αξιοποίησαν ένα εξελιγμένο μοντέλο AI βασισμένο στην αρχιτεκτονική Region-based Convolutional Neural Network (R-CNN), ένα εξειδικευμένο σύστημα σχεδιασμένο για την αναγνώριση αντικειμένων.
Η μελέτη χρησιμοποίησε ένα μοναδικό σύνολο δεδομένων που αποτελείται από τρισδιάστατα μοντέλα 1.977 σφηνοειδών πλακών, με λεπτομερή σχολιασμό 21.000 σφηνοειδών σημείων και 4.700 σφηνών.
Η μεθοδολογία της τεχνητής νοημοσύνης περιελάμβανε δύο τρήματα: αρχικά, ένας ανιχνευτής σημείων, που βασίστηκε σε ένα μοντέλο RepPoints με κορμό ResNet18, αναγνώρισε τους σφηνοειδείς χαρακτήρες στις πλάκες. Με απλά λόγια, το μοντέλο σαρώνει τη συλλογή εικόνων που συνδέεται με τις γλώσσες της Μεσοποταμίας και στη συνέχεια συνδυάζει τα μοτίβα για να «δει» το κείμενο. Αυτό το βήμα ήταν ζωτικής σημασίας για τον ακριβή εντοπισμό των σημείων.
Στη συνέχεια, ο ανιχνευτής σφηνών, χρησιμοποιώντας το Point R-CNN με προηγμένα χαρακτηριστικά όπως το Feature Pyramid Network (FPN) και το RoI Align, ταξινόμησε και προέβλεψε τις θέσεις των σφηνών, επιτρέποντας στην AI, στην πραγματικότητα, να «διαβάζει».
Το πρόβλημα που έλυσε η AI
Αυτά τα εργαλεία λαμβάνουν τις τρισδιάστατες σαρώσεις των πλακών και κοσκινίζουν το πλήθος των μετρήσεων για πράγματα όπως το βάθος αποτύπωσης που έκανε η γραφίδα στον πηλό ή η απόσταση μεταξύ των συμβόλων και των σφηνών. Αυτή η διαφοροποιημένη προσέγγιση επέτρεψε στην τεχνητή νοημοσύνη να ξεπεράσει τις προκλήσεις που παρουσιάζουν οι παραδοσιακές δισδιάστατες φωτογραφίες, όπως ο ασυνεπής φωτισμός και οι χρωματικοί περισπασμοί, παρέχοντας έτσι μια πιο ακριβή ανάλυση των αρχαίων κειμένων.
Η παραδοσιακή έρευνα σε αρχαία κείμενα χρησιμοποιεί λογισμικό οπτικής αναγνώρισης χαρακτήρων (OCR), το οποίο μετατρέπει σαρωμένες εικόνες ή δισδιάστατες φωτογραφίες της γραφής σε κείμενο αναγνώσιμο από μηχανήματα.
«Το OCR λειτουργεί συνήθως με φωτογραφίες ή σαρώσεις. Αυτό δεν αποτελεί πρόβλημα για μελάνι σε χαρτί ή περγαμηνή. Στην περίπτωση των σφηνοειδών πλακών, ωστόσο, τα πράγματα είναι πιο δύσκολα, επειδή το φως και η γωνία θέασης επηρεάζουν σε μεγάλο βαθμό το πόσο καλά μπορούν να αναγνωριστούν ορισμένοι χαρακτήρες», δήλωσε ο συν-συγγραφέας Ernst Stötzner.
Οι αρχαίοι πάπυροι, οι περγαμηνές και τα παλιά βιβλία είναι εύκολα – είναι ένα δισδιάστατο μέσο μεταφρασμένο σε ένα άλλο δισδιάστατο μέσο. Οι σφηνοειδείς πλάκες, ωστόσο, είναι τρισδιάστατες και όλο αυτό το βάθος επηρεάζει την ερμηνεία.
Για να το αντιμετωπίσει αυτό, η ερευνητική ομάδα υπέβαλε το σύστημα τεχνητής νοημοσύνης της σε ένα εκτεταμένο πρόγραμμα εκπαίδευσης, χρησιμοποιώντας τρισδιάστατες σαρώσεις και συμπληρωματικά δεδομένα. Σημαντικό μέρος αυτών των δεδομένων συνεισέφερε το Πανεπιστήμιο Εφαρμοσμένων Επιστημών του Μάιντς, το οποίο ηγείται επί του παρόντος ενός σημαντικού έργου που επικεντρώνεται στη δημιουργία τρισδιάστατων μοντέλων αυτών των αρχαίων πήλινων πλακών.
Αυτό επέτρεψε στην τεχνητή νοημοσύνη να επιτύχει αξιοσημείωτη επιτυχία στην ακριβή αναγνώριση των συμβόλων που είναι χαραγμένα στις πλάκες.
Η τεχνολογία αυτή όχι μόνο εκδημοκρατίζει την πρόσβαση σε αυτά τα αρχαία αρχεία, αλλά ανοίγει και νέους δρόμους για την έρευνα, επιτρέποντας την ευρύτερη ανάλυση και ερμηνεία των ιστορικών κειμένων. Μελλοντικές βελτιώσεις θα μπορούσαν να επεκτείνουν την εφαρμογή της και σε άλλες τρισδιάστατες γραφές, όπως οι διαβρωμένες επιγραφές που βρίσκονται σε νεκροταφεία.