Page 4 of 4 FirstFirst 1 2 3 4
Results 31 to 39 of 39

Thread: NLP - Μορφολογικό λεξικό

  1. #31
    Junior Member
    Join Date
    May 2018
    Posts
    11
    Μια σκέψη ακόμα για να απαντήσω σε μερικούς προβληματισμούς που άνοιξα πιο πριν.

    Τις πρώτες μέρες των μηχανών αναζήτησης ήταν λίγο πολύ αυτονόητο ότι η μηχανή θα πρέπει να σου επιστρέψει ψηλότερα τις σελίδες που εμφανίζεται συχνά ο όρος που ψάχνεις.

    Αυτό που η Google έκανε διαφορετικά, ήταν να χρησιμοποιήσει το PageRank με το οποίο η μηχανή αναζήτησης λάμβανε υπόψη την αξιοπιστία της σελίδας.

    Ο συντελεστής αξιοπιστίας μιας σελίδας υπολογιζόταν χοντρικά σε συνάρτηση του πόσες άλλες σελίδες δείχνουν σε αυτή.

    Μια σκέψη τώρα πάνω σε αυτό είναι ότι κατ' αντιστοιχία μπορεί να συμμετέχει ένας τέτοιος όρος αξιοπιστίας στην κατασκευή ενός λεξικού.

    Έτσι η "συνωμοσία" της Καθημερινής θα είναι (μάλλον) ψηλότερα από τη "συνομωσία" ενός blog, ανεξάρτητα από τη συχνότητα εμφάνισης.

    Κάτι τέτοιο ταυτίζει τη δημοφιλία ενός site με την "ορθή" χρήση της γλώσσας, κάτι που δεν μου είναι προφανές γλωσσολογικά.

    Ωστόσο κάποιος θα μπορούσε να υποστηρίξει ότι όσο πιο δημοφιλές είναι ένα site, τόσο μεγαλύτερες πιθανότητες έχει να επηρεάσει στο τέλος τη χρήση της γλώσσας. Ή τουλάχιστον του γραπτού λόγου.

    Αναρωτιέμαι πώς φαίνεται αυτή η ιδέα σε γλωσσολόγους

  2. #32
    Senior Member Themis's Avatar
    Join Date
    Feb 2010
    Posts
    3,720
    Gender
    Male
    Quote Originally Posted by ian View Post
    Αναρωτιέμαι πώς φαίνεται αυτή η ιδέα σε γλωσσολόγους
    Ίσως να τους φαίνεται επικίνδυνη μεν, αναπόφευκτη δε.
    Aπ' ό,τι κάλλη έχει άνθρωπος, τα λόγια έχουν τη χάρη / να κάμουσι κάθε καρδιά παρηγοριά να πάρη
    κι οπού κατέχει να μιλεί με γνώση και με τρόπο / κάνει και κλαίσι και γελούν τα μάτια των ανθρώπω.

  3. #33
    Administrator Zazula's Avatar
    Join Date
    Feb 2008
    Location
    127.0.0.1
    Posts
    17,442
    Gender
    Male
    Quote Originally Posted by ian View Post
    Κάτι τέτοιο ταυτίζει τη δημοφιλία ενός site με την "ορθή" χρήση της γλώσσας, κάτι που δεν μου είναι προφανές γλωσσολογικά.

    Ωστόσο κάποιος θα μπορούσε να υποστηρίξει ότι όσο πιο δημοφιλές είναι ένα site, τόσο μεγαλύτερες πιθανότητες έχει να επηρεάσει στο τέλος τη χρήση της γλώσσας. Ή τουλάχιστον του γραπτού λόγου.

    Αναρωτιέμαι πώς φαίνεται αυτή η ιδέα σε γλωσσολόγους
    H δημοφιλία είναι ο ασφαλέστερος γλωσσολογικός δείκτης για την ορθότητα, αυτό είναι η θεμελιώδης αρχή της περιγραφικής γλωσσολογίας. Usus est norma loquendi.

  4. #34
    Senior Member
    Join Date
    Feb 2008
    Posts
    5,109
    Gender
    Male
    Να μη μπλέξουμε όμως τη δημοφιλία του σάιτ με τη δημοφιλία των γλωσσικών τύπων.

    Επίσης, η ορθογραφία είναι σε πολύ μεγάλο βαθμό σύμβαση, άρα υπόκειται λιγότερο στον κανόνα της πλειοψηφίας απ' ό,τι άλλες πτυχές της γλώσσας.

  5. #35
    Administrator Zazula's Avatar
    Join Date
    Feb 2008
    Location
    127.0.0.1
    Posts
    17,442
    Gender
    Male
    Για δεκαετίες οι εφημερίδες διαμόρφωναν τη χρησιμοποιούμενη γλώσσα. Στις εφημερίδες οφείλουμε και την πίεση για την υιοθέτηση του μονοτονικού — που αφορά τις ορθογραφικές συμβάσεις. Η δημοφιλία συγκεκριμένων εφημερίδων παλιότερα, και ιστοτόπων σήμερα, ρίχνει νερό στον μύλο της γλωσσικής εξέλιξης — κι ενίοτε δρα καταλυτικά. Παρότι κι εγώ δεν ταυτίζω τη δημοφιλία (ή την αίσθηση κύρους, ξερωγώ) μιας ιστοσελίδας με τη συχνότητα χρήσης ενός γλωσσικού τύπου, η αλήθεια είναι πως όσο περισσότεροι βλέπουν ή ακούν κάτι, τόσο περισσότερο αυτό διαδίδεται.

  6. #36
    Senior Member stazybohorn's Avatar
    Join Date
    Sep 2009
    Posts
    199
    Δεν είναι μόνο οι ειδήσεις που αναπαράγονται κοπιπαστί.

    Υπάρχουν ολόκληρα δίκτυα ιστολογίων - ιστοσελίδων, που αναπαράγουν την ίδια σαβούρα -κατά κανόνα- ακριβώς για να γεμίσουν τον ιστό με αυτήν. Πρόχειρα παραδείγματα, ακροδεξιά δίκτυα, δίκτυα συνωμοσιολογίας, τσαρλατανισμού, κλπ. Σχεδόν όλα κλικοπαγίδες…

    Και για να μην αναγνωρίζονται εύκολα φροντίζουν συχνά να έχουν διαφορετική εισαγωγική παράγραφο, ή αναδιάταξη στο κείμενο. Άμα τους δώσεις και pagerank θα τους ανεβάσεις στα ύψη, εκτός αν μπορείς να εντοπίσεις συστάδες, με ανάλυση δικτύων - γράφων.
    It's the end of the Web as we know it…

  7. #37
    Senior Member stazybohorn's Avatar
    Join Date
    Sep 2009
    Posts
    199
    Και λίγες πηγές θα μπορούσαν να έχουν α πριόρι αξιοπιστία για σωστούς τύπους. Εδώ, στα μισά πανεπιστήμια, οι σημειώσεις κι οι διαφάνειες και οι σελίδες μαθήματος, μιλάνε για αντικειμενοστραφή προγραμματισμό, κι αν τους πεις κάτι, σου λένε «και το γκουγκλ αυτό βγάζει», τη στιγμή που οι ίδιοι ευθύνονται για αυτό (η βιτσιόζα θηλιά)…
    It's the end of the Web as we know it…

  8. #38
    Junior Member
    Join Date
    Aug 2019
    Posts
    1
    Όσον αφορά το θέμα έχω φτιάξει ένα μορφολογικό λεξικό με βάση τους κλιτικούς πίνακες που βρίσκονται στο Βικιλεξικό. Το μορφολογικό λεξικό είναι σε μορφή βάσης SQL.
    Μπορείτε να το κατεβάσετε από εδώ https://github.com/eellak/gsoc2019-greek-morpho.

    Επιπλέον περιέχει συνώνυμα, αντώνυμα, ορισμούς, ετυμολογίες, μεταφράσεις, συγγενικές λέξεις, και κανoνικοποίηση λέξεων π.χ. εφτά - επτά.

  9. #39
    Administrator nickel's Avatar
    Join Date
    Feb 2008
    Location
    38.113583, 23.862870
    Posts
    47,446
    Gender
    Male
    Γέρασα και με κουράζουν πια τα προγράμματα που δεν είναι σε επίπεδο «Πατάω ένα κουμπί και βγαίνει μια... εφαρμογή».

    Ξέρω, τα καλά κόποις κτώνται. Να δούμε πότε θα φτάσει εδώ η ιεράρχηση κόπων.
    Μένω ΕυρώπηΣύγκρουση ιδεών, όχι βία και μισαλλοδοξία: δεν οδηγούν πουθενά. (Λ. Κύρκος)Αριστεία, ρε!
    ΕΝΑ ΝΗΜΑ ΤΗΝ ΗΜΕΡΑ ΤΗΝ ΑΝΙΑ ΚΑΝΕΙ ΠΕΡΑ. Staying hungry, staying foolish. Το διαδίκτυο βλάπτει όταν δεν σκέφτεσαι.

Page 4 of 4 FirstFirst 1 2 3 4

Bookmarks

Bookmarks

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •