Ποια είναι η περισσότερο «μονοσήμαντη» γλώσσα, κατάλληλη για μηχανική μετάφραση;

Tassos

New member
Γειά χαρά! :rolleyes:

Καταρχάς,
ένα μεγάλο μπράβο, στο πλούσιο σε υλικό –γνώσεις, αισθητική και μεράκι, site σας!! :up:

Θα ήθελα να ρωτήσω κάτι.
Λοιπόν,
ψάχνοντας να βρώ ελληνικούς υπότιτλους για μια ισπανική ταινία,
διαπίστωσα ότι, δεν υπάρχουν.


Οπότε, σκέφτηκα και βρήκα, ένα πρόγραμμα,
το οποίο, φορτώνει τους Υπότιτλους οποιασδήποτε γλώσσας,
και με την εφαρμογή του Google –translator,
σού δημιουργεί τις αντίστοιχες στιχομυθείες, στη γλώσσα της επιλογής σου…!! :up:

Το θέμα όμως είναι,
οτι, η κατά τ’άλλα, ταχύτατη αυτή μετάφρασή,
από τους αγγλικούς υπότιτλους στους αντίστοιχους ελληνικούς, έχει πολλά προβλήματα…
Για παράδειγμα,
το «miss», το μεταφράζει σαν «κυρία», ενώ από τα συμφραζόμενα,
θα έπρεπε να μεταφραστεί ως «μου λείπεις»…!


Οπότε σκέφτηκα,
αν ενδεχομένως, η αρχική γλώσσα διαθέσιμη, είναι περισσότερο ακριβής και μονοσήμαντη από την Αγγλική,
ίσως και η αντίστοιχη μετατροπή στα ελληνικά, να ήταν πολύ πιο ακριβής…


Πιο συγκεκριμένα,
οι διαθέσιμοι «αρχικοί» υπότιτλοι στο Διαδίκτυο, για την εν λόγω ταινία,
είναι στα,
Αγγλικά, Σλοβενικά, Ρωσσικά, Σλοβακικά, Βραζιλιάνικα, Ουγγρικά, Γαλλικά και Τσεχικά…!! :cool:


Σας ευχαριστώ πάρα πολύ για την προσοχή σας, και την όποια καθοδήγησή σας. :rolleyes:
Δεκτή εννοείται, κάθε παρατήρησή σας…!
 
Αυτό που λες δεν υπάρχει. Η ελληνική γλώσσα, απλά, έχει πιο αναλυτική γραμματική. Η αγγλική εκφράζει το ίδιο πράγμα με πιο αναλυτική σύνταξη. Π.χ. στα ελληνικά λέμε φεύγω, ενώ στα αγγλικά I am leaving. Ο λόγος που τα μεταφραστικά προγράμματα τα βρίσκουν σκούρα όταν έχουν να κάνουν με μετάφραση σε γλώσσες με αναλυτικότερη γραμματική, είναι γιατί παρουσιάζουν εγγενείς αδυναμίες στην συντακτική ανάλυση. Αν όντως υπήρχε αυτό που λες, το ίδιο πρόβλημα θα αντιμετώπιζε κι ο μεταφραστής -ο άνθρωπος.

Τα νεότερα προγράμματα, έχουν syntax parsers που βοηθάνε κάπως την κατάσταση. Το Google translate έχει τέτοιον parser και δεν μπορώ να σκεφτώ περίπτωση που να μετέφραζε το "I miss you" σαν κάτι διαφορετικό από το "μου λείπεις". Παλιότερα, τα μηχανάκια θα μετέφραζαν το "something is amiss" ως "κάτι είναι εσφαλμένος" ενώ σήμερα μεταφράζουν "κάτι δεν πάει καλά".

Υπόψιν ότι υπάρχει περίπτωση μια λέξη να ενέχει δυο μεταφράσεις, αν αφορά γένος που δεν αναφέρεται πουθενά (the teacher was lazy). Αλλά αυτό συνήθως χρησιμοποιείται ως όπλο της γλώσσας, όχι ως αδυναμία. Για να μεταφερθούν τέτοια κόλπα στα ελληνικά, πρέπει να μεταφράσεις με ουδέτερο.
 

drsiebenmal

HandyMod
Staff member
Καλώς όρισες, Τάσο!

Οπότε, σκέφτηκα και βρήκα, ένα πρόγραμμα, το οποίο, φορτώνει τους Υπότιτλους οποιασδήποτε γλώσσας,
και με την εφαρμογή του Google –translator, σού δημιουργεί τις αντίστοιχες στιχομυθείες, στη γλώσσα της επιλογής σου…!! :up:

Το θέμα όμως είναι, οτι, η κατά τ’άλλα, ταχύτατη αυτή μετάφρασή, από τους αγγλικούς υπότιτλους στους αντίστοιχους ελληνικούς, έχει πολλά προβλήματα…

Για παράδειγμα, το «miss», το μεταφράζει σαν «κυρία», ενώ από τα συμφραζόμενα, θα έπρεπε να μεταφραστεί ως «μου λείπεις»…!

Και ευτυχώς, θα έλεγα, που τα αυτόματα προγράμματα δεν μπορούν να υποκαταστήσουν την ανθρώπινη κριτική ικανότητα σε τέτοιες περιπτώσεις. Αλλιώς, από τι άραγε θα ζούσαμε εμείς, οι επαγγελματίες μεταφραστές; :)

Στο ζουμί, τώρα: Φαντάζομαι ότι θα περάσουν να πουν τη γνώμη τους και άλλες φίλες και άλλοι φίλοι, αλλά η πραγματικότητα είναι ότι η αυτόματη μετάφραση δεν θα είναι ποτέ τέλεια -- απλώς ανεκτή για να καταλάβεις μέσες άκρες τι γίνεται (και εφόσον το θέμα δεν είναι περίπλοκο ή ειδικευμένο). Ειδικά για το google translate πρέπει να έχεις υπόψη ότι είναι συνήθως καλύτερο στη μετάφραση από οποιαδήποτε γλώσσα προς τα αγγλικά. Έτσι, αν θέλεις μια γρήγορη μετάφραση από π.χ. τα ισπανικά στα ελληνικά, μπορεί να είναι καλύτερο να πας από ισπανικά στα αγγλικά και από αγγλικά στα ελληνικά. Όμως, τα λάθη όπως αυτά που εντόπισες, θα αυξάνονται με κάθε ενδιάμεση γλώσσα που θα χρησιμοποιείς.
 
Στο ζουμί, τώρα: Φαντάζομαι ότι θα περάσουν να πουν τη γνώμη τους και άλλες φίλες και άλλοι φίλοι, αλλά η πραγματικότητα είναι ότι η αυτόματη μετάφραση δεν θα είναι ποτέ τέλεια

Δεν θα είναι τέλεια, για αρκετό καιρό ακόμα, θα έπρεπε να πεις. Κάποια στιγμή θα είναι τέλεια, γιατί θα κάνει ό,τι κάνεις κι εσύ και με καλύτερο τρόπο: συντακτική και γραμματική ανάλυση. Ο τρόπος που θα το κάνει καλύτερα θα είναι η τεράστια βάση δεδομένων που θα έχει, ως προς τυπικές μεταφράσεις φράσεων, αναλυτικό λεξικό των πάντων και υπόδειγμα μεταφράσεων ιδιωματισμών. Όλα αυτά θα τα κάνει βάσει τεράστιας βιβλιογραφίας που θα έχει στην διάθεσή του. Αυτό το μέλλον είναι πιο κοντά απ' όσο φαντάζεστε. Η τεχνητή νοημοσύνη είναι πολύ κοντά σ' αυτόν τον στόχο, γιατί είναι από τα επαγγέλματα που δεν είναι απαραίτητες οι βασικές αισθήσεις (όραση, ακοή, κτλ). Το πράγμα βέβαια σκαλώνει προς το παρόν σε δύο πράγματα: την εξάρτηση επαγγελμάτων γύρω απ' την μετάφραση και τα πνευματικά δικαιώματα του απαραίτητου όγκου βιβλιογραφίας.
 

Palavra

Mod Almighty
Staff member
Τάσο, καλώς όρισες! Νομίζω ότι καλά τα λέει ο δόκτωρ: η αυτόματη μετάφραση δεν είναι ακόμα αρκετά εξελιγμένη ώστε να δίνει τόσο ικανοποιητικά αποτελέσματα όσο αυτό που θέλεις.

Ελληγενή, νομίζω πως αυτό που λες για την τεχνητή νοημοσύνη ισχύει για τα περισσότερα επαγγέλματα, και ιδίως για τις θετικές επιστήμες. Δεν είναι μακριά ο καιρός που θα βάζεις σε έναν υπολογιστή τα στοιχεία μιας περιοχής (κλίμα, έδαφος, τοπογραφικό κτλ κτλ), θα του ζητάς μια γέφυρα για το Χ σημείο και θα σου βγάζει 10 σχέδια. Εξάλλου, οι θετικές επιστήμες έχουν και πιο σαφή πλαίσια, οπότε είναι ευκολότερο να τροφοδοτήσουν και με πεπερασμένο υλικό έναν υπολογιστή.
 
Κάποια στιγμή θα είναι τέλεια,

Προσωπικά δεν συμφωνώ. Θα γίνει πιο τέλεια απ' ό,τι είναι τώρα, αλλά το 100% τέλειο αποκλείεται. Ένα παράδειγμα: τα λογοπαίγνια που βασανίζουν πολλά μέλη εδώ πέρα. Δεύτερο παράδειγμα: οι υπότιτλοι, που περιορίζονται ως προς το μήκος τους στην οθόνη (ανθρώπινη κρίση είναι το τι θα κρατήσεις και τι θα πετάξεις από το αρχικό κείμενο). Και τρίτο, στις βάσεις δεδομένων, όσο τεράστιες κι αν είναι, πολλές λέξεις εμφανίζονται μόνο λίγες φορές, πράγμα το οποίο σημαίνει ότι δεν παρέχουν αρκετά collocations για να αποφασίσει το μηχάνημα τι θα κάνει σε περίπτωση νέου συνδυασμού λέξεων.

Γενικά, οι βάσεις δεδομένων, όπως τα λεξικά, are always playing catch-up.
 
Προσωπικά δεν συμφωνώ. Θα γίνει πιο τέλεια απ' ό,τι είναι τώρα, αλλά το 100% τέλειο αποκλείεται. Ένα παράδειγμα: τα λογοπαίγνια που βασανίζουν πολλά μέλη εδώ πέρα. Δεύτερο παράδειγμα: οι υπότιτλοι, που περιορίζονται ως προς το μήκος τους στην οθόνη (ανθρώπινη κρίση είναι το τι θα κρατήσεις και τι θα πετάξεις από το αρχικό κείμενο). Και τρίτο, στις βάσεις δεδομένων, όσο τεράστιες κι αν είναι, πολλές λέξεις εμφανίζονται μόνο λίγες φορές, πράγμα το οποίο σημαίνει ότι δεν παρέχουν αρκετά collocations για να αποφασίσει το μηχάνημα τι θα κάνει σε περίπτωση νέου συνδυασμού λέξεων.

Γενικά, οι βάσεις δεδομένων, όπως τα λεξικά, are always playing catch-up.

Κάνεις το λάθος να νομίζεις ότι ο υπολογιστής δεν μπορεί να έχει κρίση. Τα λογοπαίγνια είναι δύσκολο πράγμα, αλλά για τον υπολογιστή θα είναι ευκολότερο γιατί θα έχει πρόσβαση σε απύθμενη βάση δεδομένων και θα αναζητά λύση βάσει μοτίβων. Παρότι αυτό κάνει κι ο άνθρωπος, η ικανότητά του να παράγει λύσεις τέτοιας φύσης εξαρτάται από το μνημονικό του (αυτό που λέμε "δεν μου έρχεται, τώρα") κι από την γνώση του. Ο υπολογιστής μπορεί να έχει περισσότερες γνώσεις και να συμπεριφέρονται μηχανικά ισότιμα, αφού η ανάκληση γίνεται με τον ίδιο τρόπο, κάθε φορά. Αντιθέτως, ο εγκέφαλος παίζει με την επαναληψιμότητα και την χρονική απόσταση. Μπορεί δηλαδή η τέλεια λύση σε ένα λογοπαίγνιο να βρίσκεται στο μυαλό σου, ως ωμή πληροφορία, αλλά να μην μπορείς να την αξιοποιήσεις γιατί ούτε που θυμάσαι την ύπαρξή της. Το τεράστιο πλεονέκτημα της μηχανής είναι ότι μπορεί να απομνημονεύσει την παγκόσμια γραμματεία, πράγμα που ο άνθρωπος αδυνατεί. Άρα, θα έχει πολύ περισσότερη "εμπειρία" από εσένα.

Η ανθρώπινη κρίση δεν είναι κάτι μαγικό, δουλεύει με patterns. Αυτό μπορεί να μιμηθεί η τεχνητή νοημοσύνη, η οποία είναι μεν μακριά από την αναλυτική σκέψη, αλλά πολύ κοντά σε dedicated tasks. Ουσιαστικά το μόνο που την χωρίζει αυτήν την στιγμή από την 100% αξιόπιστη μετάφραση είναι η έλλειψη εκτενούς κώδικα που να κάνει ακριβώς αυτό (ομολογουμένως είναι πολλή δουλειά). Μάλιστα και στα patterns μπορεί να δουλέψει καλύτερα από σένα. Σκέψου ότι μπορεί να μεταφράσει μια φράση ανάλογα με το context ολόκληρου του έργου που μεταφράζει, αφού θα σημειώνει κάθε συντακτικό, μορφολογικό και γραμματικό φαινόμενο που εντοπίζει, έχοντας έτσι έναν πλήρη χάρτη του έργου προς μετάφραση. Το έργο θα μπορεί να μεταφράζεται σε πολλαπλά στάδια, εφαρμόζοντας βελτίωση κάθε πρότασης ανάλογα με το context ολόκληρου του έργου, κάθε φορά που θα την ξανακάνει parse.

Στην περίπτωση των υποτίτλων, το θέμα για τον υπολογιστή είναι λίγο πιο απλό, αφού γνωρίζει εκ των προτέρων την βέλτιστη σύνταξη και επιλογή λεξιλογίου που θα ικανοποιεί το δεδομένο μήκος. Ένα βασικό μοντέλο, θα διαλέγει Χ συντάξεις με Υ συγκεκριμένες λέξεις και θα βαθμολογεί την σύνταξη και τις λέξεις βάσει context και μήκους. Οι συνώνυμες με την μεγαλύτερη βαθμολογία μήκους-context θα επιλέγονται. Επίσης θα έχει στην διάθεσή του βάση δεδομένων με κάθε μετάφραση που έχει γίνει στο παρελθόν, άρα ένα μέρος του έργου θα έχει αυτόματη λύση που θα χρειάζεται ίσως μικρή βελτιστοποίηση.

Ελληγενή, νομίζω πως αυτό που λες για την τεχνητή νοημοσύνη ισχύει για τα περισσότερα επαγγέλματα, και ιδίως για τις θετικές επιστήμες. Δεν είναι μακριά ο καιρός που θα βάζεις σε έναν υπολογιστή τα στοιχεία μιας περιοχής (κλίμα, έδαφος, τοπογραφικό κτλ κτλ), θα του ζητάς μια γέφυρα για το Χ σημείο και θα σου βγάζει 10 σχέδια. Εξάλλου, οι θετικές επιστήμες έχουν και πιο σαφή πλαίσια, οπότε είναι ευκολότερο να τροφοδοτήσουν και με πεπερασμένο υλικό έναν υπολογιστή.

Όχι μόνο δεν είναι μακριά, αλλά είναι ακριβώς εκεί. Δεν είναι καν τόσο πολύπλοκα αυτά τα προγράμματα. Ο λόγος που δεν έχει αντικαταστήσει τον άνθρωπο, και που έτσι θα μείνει για πολύ καιρό ακόμα, δεν είναι η τεχνοφοβία αλλά η ευθύνη. Χρειάζεται ο άνθρωπος για να αναλάβει την ευθύνη των επιλογών, γιατί αν κάτι πάει στραβά δεν μπορείς να κατηγορήσεις τον υπολογιστή.
 

daeman

Administrator
Staff member
...
The robots (Die Roboter) - Kraftwerk



The Man-Machine (Die Mensch-Maschine) - Kraftwerk

 
Προφανώς αν το "κάποια στιγμή" είναι το έτος 2525 δεν έχει νόημα να κάνουμε προβλέψεις, αλλά αν μιλάμε για έναν ορατό χρονικό ορίζοντα, π.χ. 20 χρόνια από τώρα, θεωρώ ότι το 100% τέλειο αποκλείεται. Είναι μερικά πράγματα στα οποία ούτε η ωμή δύναμη δουλεύει, ούτε οι αλγόριθμοι. Ένα άλλο τέτοιο παράδειγμα είναι το μπριτζ (το παιχνίδι), σε αντιδιαστολή με το σκάκι.
 

nickel

Administrator
Staff member
Πάντως, πολλοί από τους σημερινούς μεταφραστές θα μετατραπούν στη διάρκεια της ζωής τους σε διορθωτές μηχανικών μεταφράσεων — εκτός απ' αυτούς που ήδη κάνουν ακριβώς αυτό. Το 100% τέλειο θα είναι πάντα η ιδιαίτερη πινελιά του ανθρώπου.
 
Νομίζω ότι υποτιμάτε το επίπεδο της ΑΙ, σήμερα. Τα βήματα που έχουν γίνει είναι πάρα πολύ σημαντικά.

Το σκάκι πολλές φορές χρησιμοποιείται ως μέτρο σύγκρισης ΑΙ και το γεγονός ότι ο Γκασπάρωφ έχασε, το '97, από τον Deep Blue, αποδίδεται σε έλλειψη φόρμας του πρωταθλητή. Από τότε βέβαια πέρασαν 15 χρόνια και το λογισμικό τεχνητής νοημοσύνης έχει εξελιχτεί πολύ. Για το υλικό δεν το συζητάω. Ο DB κόστισε αρκετά εκατομμύρια δολλάρια, το 1997, και ανήκε στους υπερυπολογιστές, με δυνατότητα 11.38 δισεκατομμυρίων πράξεων κινητής υποδιαστολής, το δευτερόλεπτο. H GPU της Nvidia Tesla s2050, που πωλείται σήμερα προς 12,000 ευρώ, κάνει 5000 δισεκατομμύρια πράξεις, αντίστοιχα. Ακόμη και το τεσσάρων ετών laptop μου κάνει περισσότερες πράξεις από τον Deep Blue. Μετά τον DB, ποτέ grandmaster δεν ξανακέρδισε υπολογιστή σε τουρνουά.

Όμως δεν είναι απλώς το hardware που έχει εξελιχθεί τρελά, είναι και η AI. Το 2009, ένα προγραμματάκι που έτρεχε σε... κινητό τηλέφωνο, κέρδισε πρωτάθλημα grandmaster! Υπολόγιζε 20,000 σκακιστικές θέσεις το δευτερόλεπτο, σε αντιδιαστολή με το πολύ μεγαλύτερο νούμερο των 200 εκατομμυρίων θέσεων του DB.

Σχετικά με την μετάφραση, δεν γίνεται να επιτύχει το τέλειο, γιατί αυτό δεν υπάρχει. Όμως θα μπορεί να κάνει αυτό που κάνει ο μέσος μεταφραστής. Ήδη η ΤΝ διαθέτει τέτοιες δυνατότητες. Στο, όχι πολύ μακρινό, μέλλον, θα μπορεί να το κάνει καλύτερα από τον μέσο μεταφραστή. Το αν θα τον αντικαταστήσει, είναι άλλη συζήτηση.
 
Αν απαντάς σε μένα, Ελληγεννή, ξαναδιάβασε όσα γράφω και πρόσεξε ότι λέω "σε αντιδιαστολή με το σκάκι". Άρα, το να αναφέρεσαι διά μακρών στις αναμφισβήτητες επιτυχίες της ΑΙ στο σκάκι παραβιάζει ορθάνοιχτες θύρες. Κανείς δεν το αρνήθηκε, έλεος!
 
Το σκάκι το αναφέρω σαν μέτρο σύγκρισης ΑΙ, γιατί έτσι χρησιμοποιείται. Μπριτζ δεν ξέρω καν, οπότε το βουλώνω. Το διάβασα το σχόλιό σου. Ξέρω αρκετά γύρω από ΑΙ, γιατί έχω ασχοληθεί στο παρελθόν κι έχω διαβάσει αρκετά βιβλία και παρακολουθώ τις εξελίξεις τα τελευταία, περίπου, 10 χρόνια. Έχω φτιάξει μερικές dedicated μηχανές που λειτουργούν με βαθμολόγηση (μάλιστα και η πτυχιακή μου και η μεταπτυχιακή μου έκαναν χρήση τέτοιων δικών μου μηχανών). Αυτό βασικά είναι ένα στάδιο κάτω από ΑΙ, γιατί δεν διαθέτουν νοημοσύνη, απλά εκτελούν πράξεις βαθμολόγησης και ανακατάταξης. Δεν είναι ούτε εκπαιδεύσιμες ούτε παραγωγικές.

Πάντως εμπορικές απόπειρες για ΑΙ μεταφραστές ΔΕΝ έχουν γίνει ακόμα. Ούτε από την Systran ούτε από την Google ούτε από κανέναν.
 

nickel

Administrator
Staff member
Δεν θα έπρεπε να αποτελεί μέτρο σύγκρισης το σκάκι. Οι κινήσεις στο σκάκι έχουν πεπερασμένο αριθμό στοιχείων (16+16 πιόνια), τεράστιο αλλά πεπερασμένο αριθμό κινήσεων, και στο τέλος ο υπολογιστής μπορεί να ξέρει, με απόλυτη βεβαιότητα, ποιος κερδίζει. Η γλώσσα δεν έχει πεπερασμένο αριθμό επιλογών, εξελίσσεται συνεχώς και ο υπολογιστής δεν μπορεί να αποφασίζει (πάντα) ποιος κερδίζει. Έστω ότι εγώ μπορώ να προβλέψω ότι θα κερδίσει το Καλωσήρθες (με τα σημερινά δεδομένα ο υπολογιστής θα διάλεγε το Καλώς ήρθες) ή ότι η μετάφραση ενός ποιήματος θα αρέσει περισσότερο. Ο υπολογιστής θα κάνει συνεχώς συντηρητικές επιλογές και θα ανακόπτει την πορεία της γλώσσας.
 

SBE

¥
Το θέμα είναι ελληγενή ότι άλλο η μετάφραση π.χ ενός πτυχίου ή μιας ιατρικής έκθεσης κι άλλο η μετάφραση λογοτεχνικού έργου που θες το αποτέλεσμα να μοιάζει με λογοτεχνικό έργο. Η τεχνητή νοημοσύνη σου θα ξέρει να φτιάξει και την αισθητική αξία του κειμένου; Και όπως ειπώθηκε πιο πριν, για πότε μιλάμε;
 
Το θέμα είναι ελληγενή ότι άλλο η μετάφραση π.χ ενός πτυχίου ή μιας ιατρικής έκθεσης κι άλλο η μετάφραση λογοτεχνικού έργου που θες το αποτέλεσμα να μοιάζει με λογοτεχνικό έργο. Η τεχνητή νοημοσύνη σου θα ξέρει να φτιάξει και την αισθητική αξία του κειμένου; Και όπως ειπώθηκε πιο πριν, για πότε μιλάμε;

Ναι σε όλα. Η ΑΙ είναι σε στάδιο να κάνει αισθητικές επιλογές. Και όχι μόνο αυτό, αλλά το σκάκι παίζει πολύ μεγαλύτερο ρόλο σ' αυτό, απ' ό,τι φαντάζεστε. Υπάρχει π.χ. ο Ludwig, ένα πρόγραμμα σύνθεσης -ναι, σύνθεσης- μουσικής, βασισμένο σε σκακιστικό προγραμματισμό. Ορίστε ένα κομμάτι του:

http://www.write-music.com/fileadmin/AUDIO/Ludwig/woody_top_swingwaltz.mp3

Το τι είδους κείμενο έχει προς μετάφραση μπορεί να το καταλάβει με την χρήση templates. Αυτό δεν είναι καν από τα πιο δύσκολα σημεία στην δημιουργία τέτοιου προγράμματος.

Nickel, οι κινήσεις στο σκάκι είναι πεπερασμένες, όσο πεπερασμένες είναι και οι επιλογές σου στην γλώσσα. Ένα παιχνίδι 40 κινήσεων, έχει περίπου 10^120 πιθανούς συνδυασμούς, που είναι αριθμός 100 δωδεκάκις εκατομμύρια φορές μεγαλύτερος από το σύνολο των ατόμων στο ορατό -και γνωστό- σύμπαν. Πόσους συνδυασμούς έχει το "I want to be with you tonight"; 10; 100; 10,000; 1,000,000,000; Πάλι είναι αριθμός ασύγκριτα μικρότερος. Επιλέγεις την μετάφρασή σου αξιοποιώντας τα λεξιλογιακά αποθέματα, που μετρώνται το πολύ σε εκατομμύρια, τα γραμματικά και συντακτικά φαινόμενα που μετρώνται σε δεκάδες, ίσως και σε εκατοντάδες χιλιάδες και πάλι οι συνδυασμοί σου δεν βγαίνουν σε μέγεθος συγκρίσιμο με το 10^120, δεδομένου ότι σχεδόν το σύνολό τους είναι αλληλοαποκλειόμενο. Αυτό γιατί η πρότασή σου πρέπει να βγάζει νόημα, άρα οι λέξεις, η γραμματική και το συντακτικό που θα χρησιμοποιήσεις περιορίζουν τον αριθμό των συνδυασμών, δραστικά.

Τώρα, το πόσο συντηρητικές επιλογές θα κάνει η ΑΙ, εξαρτάται από την προσωπικότητα που θα της έχεις δώσει. Δεν μιλάω για στατική επιλογή με διαβαθμίσεις, αλλά κανονική προσωπικότητα, που επηρεάζεται από αυτά που μεταφράζει, αξιολογεί τα έργα άλλων μεταφραστών -μηχανικών ή μη- και κάνει επιλογές στην "καριέρα" της αλλά και αισθητικές επιλογές σε μικροεπίπεδο, του τύπου "εδώ θα γράψω καλώς όρισες κι εκεί καλωσόρισες". Αυτά δεν είναι εξωγήινα πράγματα του αύριο, αλλά πολύ υπαρκτά -αν και πειραματικά- χαρακτηριστικά της ΑΙ του 21ου αιώνα.

Η εικόνα που έχετε για την ΑΙ είναι λίγο παραμορφωμένη από την χρήση της παντού. Το Google translator δεν είναι AI ούτε είναι ΑΙ ο υπολογιστής σε βιντεοπαιχνίδια στρατηγικής. Δεν αξιολογούν, δεν επαναπροσδιορίζονται, δεν μαθαίνουν από μόνα τους, η απάντηση που δίνουν είναι πάντα η ίδια όταν τα δεδομένα είναι ίδια. Υπόψιν ότι δεν λέω πως σήμερα υπάρχει η δυνατότητα για τέλειο μεταφραστή, αλλά αυτή η στιγμή είναι μάλλον σε ορίζοντα μικρότερο της 20ετίας. Κάτι τέτοιο απαιτεί την συνεργασία γλωσσολόγων, μεταφραστών, κοινωνιολόγων και ψυχολόγων, πάνω στην χρήση της γλώσσας, τις συμπεριφορές, τα μοντέλα εξέλιξης και ένα μάτσο άλλους τομείς. Δηλαδή λείπει η μαγιά, η βάση για να φτιαχτεί αυτό το πράγμα στον υπέρτατο βαθμό. Είναι πιθανό να μην φτιαχτεί και στην διάρκεια της δικής μας ζωής, ακριβώς γιατί προς το παρόν δεν υπάρχει αγορά γι' αυτό και κανείς δεν προτίθεται να ξοδέψει εκατομμύρια σε τόσο εκτενές project.

Το ένα τεράστιο μειονέκτημα που έχει σήμερα μια ΑΙ, ακόμη κι αν είχε όλα τα παραπάνω, θα ήταν ο συνυπολογισμός του προφορικού λόγου, μιας και οι δυνατότητες κατανόησης φωνής είναι ακόμη σε νηπιακό στάδιο. Ο μεταφραστής έχει αυτό το όπλο, με αποτέλεσμα να αναγνωρίζει πράγματα που δεν έχουν γραφτεί, υπάρχουν όμως στην γλώσσα. Όλα τα άλλα, δεδομένης της συνεργασίας που προανάφερα, είναι εφικτά, σήμερα.
 

SBE

¥
Να ρωτήσω επομένως κάτι ακόμα, επειδή εγώ είμαι άσχετη δεν ξέρω τίποτα από τεχνολογία. Έχουμε περιπτώσεις που ο μεταφραστής χρειάστηκε να επικοινωνήσει με τον συγγραφέα για να ξεκαθαρίσει τι εννοεί ο συγγραφέας σε κάποιο σημείο διφορούμενο. Και η απάντηση που έλαβε μπορεί να ήταν εξίσου διφορούμενη ή ξεκάθαρη ή να προήρθε μετά από ώρες κουβέντας. Να υποθέσω ότι το ρομπότ της μετάφρασης θα επικοινωνεί με τον συγγραφέα με κάποιο τρόπο για να βγάλει άκρη;

Επίσης, η μέθοδος "έχει το τάδε χαρακτηριστικό άρα ανήκει στην τάδε κατηγορία" εφαρμόζεται π.χ. στις συστάσεις του Άμαζον, κι έτσι σου βγάζει ότι επειδή αγόρασες τα Ανεμοδαρμένα Ύψη, θα σου αρέσει και το σίκουελ που είναι ανθυποάρλεκιν που γράφτηκε από κάποιον ατάλαντο 150 χρόνια μετά. Ή σου προτείνει το "Εγχειρίδιο Θερμομονωτικών Υλικών, Ειδική Έκδοση για Ορεινές Περιοχές". Ή επειδή πολλοί αγόρασαν τα Ανεμοδαρμένα Ύψη και μετά αγόρασαν και την Σύγχρονη Ζαχαροπλαστική, θα σου αρέσει κι εσένα. Το ξέρω ότι αυτά τα προγράμματα μαθαίνουν αλλά πόσο ελιτίστικα μπορεί να γίνουν;
 

daeman

Administrator
Staff member
Ναι σε όλα. Η ΑΙ είναι σε στάδιο να κάνει αισθητικές επιλογές. Και όχι μόνο αυτό, αλλά το σκάκι παίζει πολύ μεγαλύτερο ρόλο σ' αυτό, απ' ό,τι φαντάζεστε. Υπάρχει π.χ. ο Ludwig, ένα πρόγραμμα σύνθεσης -ναι, σύνθεσης- μουσικής, βασισμένο σε σκακιστικό προγραμματισμό. Ορίστε ένα κομμάτι του:

http://www.write-music.com/fileadmin/AUDIO/Ludwig/woody_top_swingwaltz.mp3

[...]


Ludwig 3.0 - Write great songs with automatic arrangements:

Ludwig is a music software for Windows that helps you to write your own songs. You simply enter or play a melody. Ludwig does the rest: he finds the proper chords and writes all parts of a professionally sounding band. It was never easier to compose, arrange or accompany songs!

Ludwigs artificial intelligence approach is innovative and unique: The parts are written note by note, like a human would do. This achieves an unrivaled musical quality.

Ludwig is easy to use. It takes a few clicks to get a full arrangement from a broad variety of styles. And if you don't want to enter your own melodies: Just load them from the included database of 450 public domain songs.
http://www.write-music.com/

You enter a melody and Ludwig arranges it. The software composes accompaniments for a full band. The musical styles vary from classical four-part scores to Jazz, Latin, Pop and Rock.

You enter notes by keyboard or mouse. If you own a midi keyboard, entering melodies is as easy as playing them.

Automatic arranging with Ludwig still allows for an enormous creativity on your part. You control the emotional development of your song. You decide how to set contrasts and where to achieve a climax. Not all verses of your song should sound alike.

If you get deeper into the program, you control your arrangements by deciding which instruments should play together at a given drama stage. Ludwig knows more than a dozen ways to combine two or more instruments to play a melody. From trivial doubling to sectional writing, from small fills to full counter melodies, from four part choral writing to jazz guide lines.
http://www.write-music.com/arranging.html



Άλλο σύνθια και γεμίσματα κι άλλο σύνθεση μουσικής.
 

drsiebenmal

HandyMod
Staff member
Ως πληροφορικάριος μηχανικός, βετεράνος μετρ σκακιστής και μεταφραστής μάλλον δεν είμαι ο καταλληλότερος να συμμετάσχω σε αυτή τη συζήτηση. Ας πω όμως τη γνώμη μου, παρόλα αυτά.

Ο Ελληγενής έχει δίκιο. Θεωρητικά, όλα αυτά που περιγράφει μπορεί να γίνουν. Είναι θέμα πόρων (πολλών!), προγραμματισμού και, κυρίως, κτηνωδώς τεράστιων βάσεων δεδομένων, που θα έχουν δημιουργηθεί, θα έχουν υποστεί κατάλληλη επεξεργασία κλπ κλπ. Αυτά όμως, δεν είναι θέμα ΑΙ μόνο, αλλά και ωμής δύναμης, δηλαδή τεράστιων υπολογιστικών μηχανών και αποθηκευτικών συστοιχιών.

Στο σκάκι, η αρχική προσέγγισή του ήταν να αντιμετωπιστεί πληροφορικά μόνο ως ΑΙ. Τα προγράμματα όμως που επικρατούν σήμερα σε συνθήκες αγώνων είναι σε μεγαλύτερο ποσοστό ωμή δύναμη και βάσεις δεδομένων και σε μικρότερο ΑΙ. Μπορεί να κάνω λάθος, επειδή δεν παρακολουθώ πια από κοντά τους σκακιστικούς αγώνες Η/Υ, αλλά κανένα πρόγραμμα δεν έχει δημιουργήσει ακόμη μια εμπνευσμένη θυσία, έναν αμφίρροπο στρατηγικό ελιγμό --και πολύ λογικά, αφού μπορεί να μετρήσει καλύτερα από τον άνθρωπο, να διαβλέψει έτσι και τις πιο απίθανες αμυντικές δυνατότητες, και να αποφύγει τις σκολιές ατραπούς. Το παιχνίδι παραμένει σκάκι, αλλά το δημιουργικό στοιχείο μειώνεται, αφού το δημιουργικό είναι εγγενώς μη ακριβές και, κυρίως, είναι πρωτοεμφανιζόμενο --άρα δεν υπάρχει σε βάσεις κλπ κλπ.

Τέλος, πριν φύγω από τα σκακιστικά, οι αριθμοί είναι όχι απλώς τεράστιοι αλλά αστρονομικά ασύλληπτοι. Ας πούμε, για παράδειγμα, ότι αυτή τη στιγμή, από όσο ξέρω, υπάρχει πλήρης λύση μόνο στο «πρόβλημα των 5 πεσσών», δηλαδή όταν υπάρχουν στη σκακιέρα, σε οποιαδήποτε νόμιμη θέση, οι δύο βασιλιάδες και άλλα τρία βαριά κομμάτια (όχι πιόνια, δηλαδή).

Το ότι προγράμματα που παίζουν σε τηλέφωνα μπορούν να κερδίζουν πολύ κόσμο δεν λέει τίποτε. Πραγματικά ποιοτικό και πραγματικά δημιουργικό σκάκι κορυφής είναι ζήτημα αν παίζουν 1000 άνθρωποι στον κόσμο. (Και, Helle, Κασπάροφ, όχι Γκα...).

Στο μεταφραστικό κομμάτι, έγιναν πολύ σημαντικές παρατηρήσεις. Ο Νίκελ (που κάτι ξέρει επίσης από προγραμματισμό) εξήγησε γιατί ο υπολογιστής θα επιλέγει πάντα παρωχημένες, συντηρητικές λύσεις· η SBE (που κάτι ξέρει επίσης από τεχνολογία) παρουσίασε τη μεταφραστική διαφορά όχι μόνο του συγκείμενου, αλλά και του συνολικότερου περιβάλλοντος (ακόμη και κοινωνικού) όπου πρέπει να γίνονται οι μεταφραστικές επιλογές.

Προφανώς, ακόμη και αυτές οι απαιτήσεις είναι δυνατόν, θεωρητικά, να ψηφιοποιηθούν. Με τέτοιο κόστος, όμως, που να είναι πρακτικά άχρηστες --όπως παραδέχεται κάπου στο δια ταύτα και ο Helle, επιτρέποντας στον πρακτικό άνθρωπο, τον ορθολογιστή μηχανικό (που ώρες ώρες εξαφανίζει) μέσα του, να πάρει μια ανάσα.

Τελικά, αυτή η συζήτηση καταλήγει κτγμ στο ρηθέν υπό του Προφήτου:

Θεωρητικά, θεωρία και πράξη είναι το ίδιο πράγμα. Στην πράξη, όμως, διαφέρουν.
 

Earion

Moderator
Staff member
Τάσο, καλωσήρθες. Καμιά γλώσσα, καμιά φυσική γλώσσα δεν είναι μονοσήμαντη, εφόσον έχει έστω και στο ελάχιστο χρησιμεύσει ως όργανο επικοινωνίας μιας ανθρώπινης κοινωνίας, καλύπτοντας ένα φυσιολογικό εύρος αναγκών (από οδηγίες για το πώς κυνηγάμε αντιλόπες μέχρι έκφραση ερωτικού πάθους). Αφήνω ανοιχτό το ενδεχόμενο μήπως καμιά τεχνητή γλώσσα ανταποκρίνεται σ' αυτό που έχεις κατά νου.
 
Top