Page 2 of 4 FirstFirst 1 2 3 4 LastLast
Results 11 to 20 of 39

Thread: NLP - Μορφολογικό λεξικό

  1. #11
    Administrator Zazula's Avatar
    Join Date
    Feb 2008
    Location
    127.0.0.1
    Posts
    17,413
    Gender
    Male
    Quote Originally Posted by ian View Post
    Η μητρική μου γλώσσα είναι η C++, οπότε συγχωρέστε μου τα λάθη
    Πολύ καλό!

    Quote Originally Posted by ian View Post
    Πάντα είχα αυτή την απορία, εφόσον η γλώσσα είναι ένα φυσικό φαινόμενο και δουλειά του γλωσσολόγου είναι να καταγράψει τη χρήση, ως προς τι ορίζεται το σωστό και το λάθος;
    Στη γλωσσολογία λάθος είναι μόνον κάτι αντιγραμματικό που θα δεις αποκλειστικά από μη φυσικούς ομιλητές· οι φυσικοί ομιλητές επί της ουσίας δεν κάνουν λάθη αλλά εξελίσσουν τη γλώσσα (χωρίς ωστόσο αυτό να σημαίνει πως ό,τι προκύπτει επιβιώνει ή εδραιώνεται κιόλα — όπως και στα ζωντανά όντα κάθε μετάλλαξη δεν είναι σίγουρο ότι θα επιβιώσει ή θα κυριαρχήσει· αλλά απ' την άλλη και κάθε νέα εξέλιξη έχει κι αυτή το ίδιο δικαίωμα στη ζωή). Επίσης στη γλωσσολογία το βάρος δίνεται στον προφορικό λόγο — γι' αυτό και το γεγονός πως χάρη στο ίντερνετ βλέπουμε πώς εκφράζεται φυσικά πολύ ευρύτερο τμήμα του πληθυσμού έχει κάνει τεράστιο καλό. Τέλος, η σύγχρονη γλωσσολογία παρατηρεί και καταγράφει, δεν επιχειρεί να ρυθμίσει. Όσο για την ορθογραφία, μια σύμβαση είναι και —όπως και τα κοινωνικοπολιτικά συμβόλαια— μπορεί να αλλάζει.

  2. #12
    HandyMod drsiebenmal's Avatar
    Join Date
    Mar 2009
    Location
    Athens, Greece
    Posts
    28,497
    Gender
    Male
    Και ας προσθέσω στο ζαζούλειον πιο πάνω ότι και η γραμματική αποτελεί μια σύμβαση (απλώς μια σύμβαση μακρότερου χρόνου) και άρα και η γραμματική αλλάζει (πολύ πιο αργά, όμως, και συχνά με άνωθεν αποφάσεις ειδικών βλ. Ακαδημία Αθηνών ή πολιτικές αποφάσεις με συμβουλή ειδικών, βλ. μονοτονικό).

    Επίσης, αφού εδώ άνοιξε η συζήτηση με ενδιαφέροντα θέματα, αξίζει να αναφέρουμε ότι υπάρχουν και σήμερα fuzzy σημεία της γλώσσας που αποτελούν ναρκοπέδιο για τη γραμματική και όσους ασχολούνταν πάντα με αυτήν. Έγραψα «ασχολούνταν», άλλος μπορεί να έγραφε «ασχολιόνταν» και αυτό είναι π.χ. ένα τέτοιο σημείο γραμματικής ασάφειας.

    Και καλωσόρισες. (Και δεν αρχίζουμε ποτέ προτάσεις με «και».)
    Wer die Wahrheit nicht weiß, der ist bloß ein Dummkopf. Aber wer sie weiß, und sie eine Lüge nennt, der ist ein Verbrecher!
    We base decisions on facts, not superstition, not what our ideology tells us but rather what we can observe

    δεῖ δὲ χρημάτων, καὶ ἄνευ τούτων οὐδὲν ἔστι γενέσθαι τῶν δεόντων
    Η Ελλάδα είναι Ευρώπη, η Ευρώπη είναι Ελλάδα!

  3. #13
    Junior Member
    Join Date
    May 2018
    Posts
    11
    Συνεπώς η μέθοδος που χρησιμοποίησα για το λεξικό, δηλαδή να πάρω τις λέξεις του Τριανταφυλλίδη και να τις κλίνω σύμφωνα με τους κανόνες που δίνει, είναι λίγο πολύ λάθος.

    Θεωρητικά πάντα, ο ιδανικός τρόπος για να μελετηθεί η γραμματική χρήση της γλώσσας, είναι να καταγραφεί κάθε μόρφημα που έχει χρησιμοποιηθεί και να κατηγοριοποιηθεί σύμφωνα με τους ισχύοντες μηχανισμούς της γλώσσας, κάθε μόρφημα συνοδευόμενο με τη συχνότητα εμφάνισης. (Έχοντας ένα στατιστικό κατώφλι θορύβου, π.χ. τυπογραφικά λάθη)

    Στην πράξη τώρα, ένα λεξικό αποτυπώνει ένα τρέχον στιγμιότυπο της γλώσσας, τίποτα περισσότερο τίποτα λιγότερο.

    Προσεγγίσεις τύπου "το λέμε σωστά το γράφουμε σωστά;" είναι ενδιαφέροντες μεν, χωρίς πρακτική χρησιμότητα δε.

    Δεν έχω ο ίδιος γνώμη επί του θέματος, απλά το παρατηρώ με όλη την τυπολατρία που συνοδεύει το αντικείμενό μου.

  4. #14
    Administrator nickel's Avatar
    Join Date
    Feb 2008
    Location
    38.113583, 23.862870
    Posts
    47,190
    Gender
    Male
    Καλημέρα. Να καταλάβω: Θέλεις μια συλλογή των διάφορων μορφολογικών εκδοχών που κυκλοφορούν, ίσως με κάποιον μετρητή που να κόβει ό,τι έχει κάτω από έναν αριθμό εμφανίσεων στο διαδίκτυο; Π.χ. 67% συνωμοσία, 29% συνομωσία; Ενδιαφέρον θα έχει για μελέτη, από γλωσσολόγους που μελετούν αυτά τα πράγματα. 'Η θέλεις έναν οδηγό για την κλίση των κλινόμενων λέξεων που θα μπορούν να χρησιμοποιούν άφοβα κάποιοι που θέλουν να προσέξουν το γραπτό τους επειδή θα το κρίνουν κάποιοι άλλοι (π.χ. μαθητές και φοιτητές, συγγραφείς, μεταφραστές, δημοσιογράφοι, υπάλληλοι του δημόσιου και ιδιωτικού τομέα, διάφοροι δημοσιογραφούντες που δεν θέλουν να ρεζιλεύονται επιδεικνύοντας αμορφωσιά ή προχειρότητα, κ.ά.); Σε τέτοιες περιπτώσεις τα ευαίσθητα, υπεύθυνα και έγκυρα συγγράμματα για την (προτεινόμενη, έστω) σωστή χρήση έχουν 100% πρακτική χρησιμότητα.
    Μένω ΕυρώπηΣύγκρουση ιδεών, όχι βία και μισαλλοδοξία: δεν οδηγούν πουθενά. (Λ. Κύρκος)Άντε, πέρασε κι αυτό
    ΕΝΑ ΝΗΜΑ ΤΗΝ ΗΜΕΡΑ ΤΗΝ ΑΝΙΑ ΚΑΝΕΙ ΠΕΡΑ. Staying hungry, staying foolish. Το διαδίκτυο βλάπτει όταν δεν σκέφτεσαι.

  5. #15
    Administrator Zazula's Avatar
    Join Date
    Feb 2008
    Location
    127.0.0.1
    Posts
    17,413
    Gender
    Male
    Αν πάρεις ένα λεξικό με τόσες ελλείψεις (πλέον), και με συντηρητική άποψη για τη γεν. πληθ. πολλών θηλυκών —όπως είναι το ΛΚΝ— τότε θα βγάλεις ένα καλό κι αποδεκτό μορφολογικό λεξικό που θα δείχνει ~90% τι ισχύει για το λημματολόγιό του — και το υπόλοιπο 10% θα 'ναι πράγματα που ούτε τότε ούτε ακόμη τώρα τα δέχονται κάποιοι, μαζί με πράγματα που ξεπεράστηκαν απ' τις εξελίξεις. Αλλά ως μηχανικός καταλαβαίνω ότι πολύ συχνά η πραγματιστική FAPPική προσέγγιση «good enough for all practical purposes» επαρκεί. Αρκεί στη συνέχεια να μην το εγκαταλείψεις (όπως πια δείχνει να 'χει συμβεί με το ΛΚΝ), επειδή κάθε ζωντανή γλώσσα εξελίσσεται — προσφέροντας ατέλειωτη ευχαρίστηση σ' όσους παρακολουθούν τις αντιδράσεις των ρυθμιστικών. Μην ξεχνάς πως κάποτε το «ήμασταν» ήταν διαλεκτικό (αλήθεια, συ θα συμπεριλάβεις διαλεκτικούς τύπους;), ενώ κάποιοι συνεχίζουν να ορθογραφούν με παλιότερες μορφές (κι εδώ, θα 'χεις εσύ παλιότερους τρόπους γραφής — και με τι κριτήριο συμπερίληψης;). Καλή δύναμη, πάντως!

  6. #16
    Administrator nickel's Avatar
    Join Date
    Feb 2008
    Location
    38.113583, 23.862870
    Posts
    47,190
    Gender
    Male
    Quote Originally Posted by Zazula View Post
    αλήθεια, συ θα συμπεριλάβεις διαλεκτικούς τύπους;
    Το κλιτικό της Lexigram περιλαμβάνει μια γερή δόση διαλεκτικών τύπων (με την ένδειξη «(προφ.)»).
    Μένω ΕυρώπηΣύγκρουση ιδεών, όχι βία και μισαλλοδοξία: δεν οδηγούν πουθενά. (Λ. Κύρκος)Άντε, πέρασε κι αυτό
    ΕΝΑ ΝΗΜΑ ΤΗΝ ΗΜΕΡΑ ΤΗΝ ΑΝΙΑ ΚΑΝΕΙ ΠΕΡΑ. Staying hungry, staying foolish. Το διαδίκτυο βλάπτει όταν δεν σκέφτεσαι.

  7. #17
    Junior Member
    Join Date
    May 2018
    Posts
    11
    Το καθαρό ενδιαφέρον μου είναι για semantics. Το κίνητρό μου αφορά τη μηχανική μάθηση και τη φιλοσοφία (είμαι Wittgensteinικός). Άλλοι ψαρεύουν

    Σε αυτή την περίπτωση φαίνεται πως η προσέγγιση good enough for practical purposes μοιάζει καλή. Ωστόσο οι προγραμματιστές έχουμε δυσκολία το βράδυ στον ύπνο εάν έχουμε κατασκευάσει κάτι που μερικές φορές μπορεί να μην δουλεύει.

    Το ενδιαφέρον μου για το λεξικό προέκυψε στην πορεία κατά λάθος, καθώς για να μελετήσεις semantics, αναγκαστικά θα μπλέξεις με τη γλώσσα.
    Με όλο το θράσος που μου δίνει η υπολογιστική ισχύς και όντας άσχετος, βλέποντας τη δουλειά που έχει γίνει στον Τριανταφυλλίδη, θεώρησα ότι θα είχα τελειώσει σε ένα απόγευμα.

    Ωστόσο καταπιάνοντας αυτά τα θέματα, μου κίνησε το ενδιαφέρον η γλώσσα καθεαυτή ως φυσικό φαινόμενο.
    Και ειλικρινά απόρησα με τον τρόπο που αντιμετωπίζονται οι πηγές στα ελληνικά. Λες και οι λέξεις είναι copyrighted από κάποιον. Βλέπω μια νοοτροπία, "έγινε κόπος να μαζέψω λέξεις, θα πρέπει να πληρώσεις για να τις πάρεις", (στην πραγματικότητα τις περισσότερες φορές ο κόπος έγινε από φοιτητές υποθέτω) στην εποχή που η διάδοση της πληροφορίας γίνεται όλο και πιο ελεύθερη και ακαριαία.

    Δεν (θα έπρεπε να) λειτουργεί έτσι η επιστήμη. Σκεφτείτε αντίστοιχα να έπρεπε να πληρώσει κάποιος για να πάρει τον πίνακα χημικών στοιχείων συνοδευόμενο από όρους χρήσης.

    Θεωρώ λοιπόν ότι αφού τα εθνικά ιδρύματα βρίσκονται σε κάποιον άλλον χωροχρόνο και οι εταιρείες είναι εταιρείες, θα έπρεπε να ξεκινήσει μια ανοιχτή σχετική προσπάθεια προσβάσιμη από όλους.

    Το ξέρω ότι έχω ανοίξει αρκετά θέματα άσχετα μεταξύ τους οπότε συγχωρέστε με. Ελπίζω ωστόσο να είναι ενδιαφέροντα.

  8. #18
    Junior Member
    Join Date
    May 2018
    Posts
    11
    Quote Originally Posted by nickel View Post
    Καλημέρα. Να καταλάβω: Θέλεις μια συλλογή των διάφορων μορφολογικών εκδοχών που κυκλοφορούν, ίσως με κάποιον μετρητή που να κόβει ό,τι έχει κάτω από έναν αριθμό εμφανίσεων στο διαδίκτυο; Π.χ. 67% συνωμοσία, 29% συνομωσία; Ενδιαφέρον θα έχει για μελέτη, από γλωσσολόγους που μελετούν αυτά τα πράγματα. 'Η θέλεις έναν οδηγό για την κλίση των κλινόμενων λέξεων που θα μπορούν να χρησιμοποιούν άφοβα κάποιοι που θέλουν να προσέξουν το γραπτό τους επειδή θα το κρίνουν κάποιοι άλλοι (π.χ. μαθητές και φοιτητές, συγγραφείς, μεταφραστές, δημοσιογράφοι, υπάλληλοι του δημόσιου και ιδιωτικού τομέα, διάφοροι δημοσιογραφούντες που δεν θέλουν να ρεζιλεύονται επιδεικνύοντας αμορφωσιά ή προχειρότητα, κ.ά.); Σε τέτοιες περιπτώσεις τα ευαίσθητα, υπεύθυνα και έγκυρα συγγράμματα για την (προτεινόμενη, έστω) σωστή χρήση έχουν 100% πρακτική χρησιμότητα.
    Προφανώς δεν το έχω ξεκάθαρα θεωρητικά, αλλά μου φαίνεται λογικό πως αν η γλωσσολογία είναι η μελέτη της χρήσης της γλώσσας, τότε ένα λεξικό δεν είναι παρά μια αποτύπωση και όχι οδηγίες χρήσης. Από όσο καταλαβαίνω τουλάχιστον, δεν έχει ρυθμιστική χρήση. Από εκεί και πέρα, εάν ένα κείμενο σε κάποιους κύκλους κρίνεται ως προς τη φόρμα με κάποιο συμβατικό κριτήριο και όχι ως προς το περιεχόμενο, έχει κοινωνικό και ψυχολογικό ενδιαφέρον, αλλά όχι επιστημονικό. Διορθώστε με εάν έχω παρανοήσει.

    Quote Originally Posted by Zazula View Post
    Αν πάρεις ένα λεξικό με τόσες ελλείψεις (πλέον), και με συντηρητική άποψη για τη γεν. πληθ. πολλών θηλυκών —όπως είναι το ΛΚΝ— τότε θα βγάλεις ένα καλό κι αποδεκτό μορφολογικό λεξικό που θα δείχνει ~90% τι ισχύει για το λημματολόγιό του — και το υπόλοιπο 10% θα 'ναι πράγματα που ούτε τότε ούτε ακόμη τώρα τα δέχονται κάποιοι, μαζί με πράγματα που ξεπεράστηκαν απ' τις εξελίξεις. Αλλά ως μηχανικός καταλαβαίνω ότι πολύ συχνά η πραγματιστική FAPPική προσέγγιση «good enough for all practical purposes» επαρκεί. Αρκεί στη συνέχεια να μην το εγκαταλείψεις (όπως πια δείχνει να 'χει συμβεί με το ΛΚΝ), επειδή κάθε ζωντανή γλώσσα εξελίσσεται — προσφέροντας ατέλειωτη ευχαρίστηση σ' όσους παρακολουθούν τις αντιδράσεις των ρυθμιστικών. Μην ξεχνάς πως κάποτε το «ήμασταν» ήταν διαλεκτικό (αλήθεια, συ θα συμπεριλάβεις διαλεκτικούς τύπους, ενώ κάποιοι συνεχίζουν να ορθογραφούν με παλιότερες μορφές (κι εδώ, θα 'χεις εσύ παλιότερους τρόπους γραφής — και με τι κριτήριο συμπερίληψης.
    Είναι πολύ σωστή παρατήρηση. Όσο το σκέφτομαι λοιπόν όντως φαίνεται καλή ιδέα να εμπλουτιστεί με spider. Από εκεί και πέρα, θα συμπεριλάβω ό,τι χρησιμοποιείται στο internet Έχω την αίσθηση πως αν τουλάχιστον έχω ήδη ένα βασικό λεξικό, το να "πέσουν" παρόμοιες μορφές μιας λέξης δεν θα με δυσκολέψει. Για τις εντελώς άγνωστες, ίσως έχει ενδιαφέρον να δω αν θα μπορούσε να λειτουργήσει κάτι που θα έχει εκπαιδευτεί να τις κατατάσσει από παραδείγματα. Δεν ξέρω αν υπάρχει ήδη κάτι σχετικό.

    Καλή δύναμη, πάντως!
    Ευχαριστώ πολύ

  9. #19
    Administrator nickel's Avatar
    Join Date
    Feb 2008
    Location
    38.113583, 23.862870
    Posts
    47,190
    Gender
    Male
    Quote Originally Posted by ian View Post
    βλέποντας τη δουλειά που έχει γίνει στον Τριανταφυλλίδη, θεώρησα ότι θα είχα τελειώσει σε ένα απόγευμα.
    Quote Originally Posted by ian View Post
    Θεωρώ λοιπόν ότι αφού τα εθνικά ιδρύματα βρίσκονται σε κάποιον άλλον χωροχρόνο και οι εταιρείες είναι εταιρείες, θα έπρεπε να ξεκινήσει μια ανοιχτή σχετική προσπάθεια προσβάσιμη από όλους.

    Έστω λοιπόν ότι σε καλεί η Λεξιλογία να φτιάξουμε έναν πλήρη κατάλογο των λέξεων της νέας ελληνικής γλώσσας και των διάφορων αποδεκτών και λιγότερο αποδεκτών τύπων (ή και των μη αποδεκτών αλλά χρησιμοποιούμενων, με σχετική σήμανση). Με παραπομπές σε συζητήσεις για τις περιπτώσεις πολλαπλών τύπων. Με συνεχή εμπλουτισμό με τη βοήθεια της αράχνης. Έτσι που να μπορεί να βρίσκει κάποιος σε ένα σημείο όλους τους τύπους με τους οποίους θα μπορεί να νιώθει ασφαλής. Απλώς ορισμένες φορές θα ρίχνουμε κανένα καβγά για τη σήμανση που θα συνοδεύει π.χ. το επίρρημα επισταμένα.

    Πόσο ρεαλιστική θα ήταν μια τέτοια σκέψη;
    Μένω ΕυρώπηΣύγκρουση ιδεών, όχι βία και μισαλλοδοξία: δεν οδηγούν πουθενά. (Λ. Κύρκος)Άντε, πέρασε κι αυτό
    ΕΝΑ ΝΗΜΑ ΤΗΝ ΗΜΕΡΑ ΤΗΝ ΑΝΙΑ ΚΑΝΕΙ ΠΕΡΑ. Staying hungry, staying foolish. Το διαδίκτυο βλάπτει όταν δεν σκέφτεσαι.

  10. #20
    Administrator Zazula's Avatar
    Join Date
    Feb 2008
    Location
    127.0.0.1
    Posts
    17,413
    Gender
    Male
    Quote Originally Posted by nickel View Post
    Έστω λοιπόν ότι σε καλεί η Λεξιλογία να φτιάξουμε έναν πλήρη κατάλογο των λέξεων της νέας ελληνικής γλώσσας και των διάφορων αποδεκτών και λιγότερο αποδεκτών τύπων (ή και των μη αποδεκτών αλλά χρησιμοποιούμενων, με σχετική σήμανση). Με παραπομπές σε συζητήσεις για τις περιπτώσεις πολλαπλών τύπων. Με συνεχή εμπλουτισμό με τη βοήθεια της αράχνης. Έτσι που να μπορεί να βρίσκει κάποιος σε ένα σημείο όλους τους τύπους με τους οποίους θα μπορεί να νιώθει ασφαλής. Απλώς ορισμένες φορές θα ρίχνουμε κανένα καβγά για τη σήμανση που θα συνοδεύει π.χ. το επίρρημα επισταμένα.
    Κανείς καβγάς δεν θα γίνεται, θα του λέω εγώ τι να βάζει. Άλλωστε συνεννοούμαστε· αυτός είναι φυσικός ομιλητής της C++ κι εγώ της R.

Page 2 of 4 FirstFirst 1 2 3 4 LastLast

Bookmarks

Bookmarks

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •