Τι κατέβασα από την Ανέμη

nickel

Administrator
Staff member
Απ' ό,τι βλέπω, όμως, αναζήτηση μέσα στο PDF δεν είναι δυνατή.
Στης Ανέμης τις σαρώσεις, που είναι σε τελική ανάλυση (χαμηλής ανάλυσης) φωτογραφίες, δεν μπορείς να κάνεις αναζητήσεις. Στου http://books.google.com/ τα βιβλία μπορείς να κάνεις ψάξιμο όσο είναι εκεί, αλλά σε φωτογραφίες που δεν μπορείς να ψάξεις καταλήγεις αν τα αντιγράψεις στο δίσκο σου (όσα αντιγράφονται).
 

pidyo

New member
Στης Ανέμης τις σαρώσεις, που είναι σε τελική ανάλυση (χαμηλής ανάλυσης) φωτογραφίες, δεν μπορείς να κάνεις αναζητήσεις.
Εάν δεν κάνω λάθος, το ζήτημα δεν είναι η ανάλυση, αλλά αν έχει παραχθεί image pdf ή OCR pdf. Στα πρώτα η αναζήτηση είναι εξ ορισμού ανέφικτη. Η δεύτερη κοστίζει σε ανθρωποώρες.

(Εντόπισα το νήμα από σχόλιο στου Σαραντάκου. Διακειμενικότητα.)
 

Zazula

Administrator
Staff member
Δίκιο έχεις, πιδύε, κι εγώ από την Ανέμη δεν έτυχε να δω ποτέ pdf που να 'χει περαστεί από OCR. Άλλωστε θα είναι ακόμη πιο χρονοβόρο κι επίπονο λόγω των πολυτονικών κειμένων.
 

nickel

Administrator
Staff member
Τα προβλήματα είναι τρία με τις φωτογραφίες των παλιών βιβλίων:
  1. αν είναι πολυτονισμένο το κείμενο, η αναγνώριση μπορεί να γίνει μόνο με το ένα ελληνικό πρόγραμμα που χειρίζεται πολυτονικό κείμενο. Δεν μπορεί να γίνει σε ικανοποιητικό βαθμό από προγράμματα όπως το ABBYY, εκτός αν πρέπει να γίνει μεγάλη δουλειά και κάτσεις να διδάξεις το πρόγραμμα να μετατρέπει τους χαρακτήρες με τους τόνους και τα πνεύματα σε αντίστοιχους τονισμένους ή άτονους χαρακτήρες.
  2. αν είναι πολύ παλιό το βιβλίο, ενδέχεται η γραμματοσειρά να μην αναγνωρίζεται εύκολα από το πρόγραμμα. Αυτό ισχύει και στην περίπτωση των κειμένων με λατινικό αλφάβητο. Πάλι θα μπορεί κανείς να διδάξει το πρόγραμμα.
  3. αν η ανάλυση είναι χαμηλή, τα λάθη πολλαπλασιάζονται σε όλα τα κείμενα.
 

nickel

Administrator
Staff member
Ας κάνει κάποιος τον κόπο να προσπαθήσει να κατεβάσει κάτι από την Ανέμη (ολόκληρο βιβλίο, Download document).
http://anemi.lib.uoc.gr/search/?go=Submit

Μετά την υποβολή (Submit) του Captcha code, με επιστρέφει στη φόρμα αναζήτησης.
Αν έχετε το ίδιο πρόβλημα, να τους το πούμε.
 

daeman

Administrator
Staff member
[...]Μετά την υποβολή (Submit) του Captcha code, με επιστρέφει στη φόρμα αναζήτησης.
Αν έχετε το ίδιο πρόβλημα, να τους το πούμε.

Ditto (Opera 11.62 build 1347, IE 8.0.6001).
 

nickel

Administrator
Staff member
Τους ειδοποίησα — αν λειτουργεί το «Contact us», γιατί άλλη εντύπωση μού έδωσε...
 

vfaronov

New member
Έχω το ίδιο πρόβλημα, αλλά βρήκα έναν τρόπο να το παρακάμψω, μπορείτε να το δοκιμάσετε αν χρειάζεστε κάτι βιαστικά.

  1. αντιγράψτε το URL «Permanent Link» από το πρώτο slash ως το «.tkl», π.χ. /metadata/b/7/e/metadata-96-0000042 — ας το λέμε PATH
  2. μετατρέψτε το δεύτερο «metadata-» σε «attached-metadata-» στο PATH
  3. κάντε κλικ στο «Preservation info» και αντιγράψτε το Filename, π.χ. 253154.pdf — ας το λέμε FILE
  4. ανοίξτε το εξής URL: http://anemi.lib.uoc.gr/php/pdf_dump.php?filename=PATH/FILE

Π.χ. http://anemi.lib.uoc.gr/php/pdf_dump.php?filename=/metadata/6/6/8/metadata-01-0000333/74380.pdf
 

nickel

Administrator
Staff member
Ευχαριστούμε, πολύ πολύ. Λειτουργεί άψογα!
 

vfaronov

New member
Βρήκα αυτό το άριστο βιβλίο του Μέγα σε δύο τόμους, τον πρώτο μπορώ μια χαρά να τον κατεβάσω, τον δεύτερο όμως — και φυσικά τον πιο ενδιαφέροντα... «δεν έχετε δικαίωμα». Ενώ αναφέρουν και το όνομα αρχείου και όλα τα στοιχεία σαν να με κοροϊδεύουν! ΓΙΑΤΙ; Φταίει το copyright;
 
Αν έχω καταλάβει καλά, στην Ανέμη υπάρχουν μερικά βιβλία που έχουν κοπιράιτ και που ενώ εμφανίζεται εικονίδιό τους, δεν μπορεί κανείς να τα κατεβάσει παρά μόνο από το πανεπιστήμιο Κρήτης, από το ενδοδίκτυο, και τα χρησιμοποιούν για μαθήματα.

Παλιότερα είχα βρει τρόπο να τα παρακάμπτω, ίδιον μ' αυτόν που κι εσύ βρήκες πιο πάνω. Δεν ξέρω αν θα δουλέψει εδώ.
 

vfaronov

New member
Παλιότερα είχα βρει τρόπο να τα παρακάμπτω, ίδιον μ' αυτόν που κι εσύ βρήκες πιο πάνω. Δεν ξέρω αν θα δουλέψει εδώ.

Όχι, δεν δουλεύει, «invalid file» λέει.

Από την άλλη πλευρά, εάν φταίει το κοπυράιτ, θα καταλήξει σε δύο χρόνια τοψ, αφού ο πρώτος τόμος δημοσιευμένος δύο χρόνια νωρίτερα είναι ήδη διαθέσιμος.
 

nickel

Administrator
Staff member
Καλημέρα. Εγώ δεν έχω καταλάβει ακριβώς τις ανανεώσεις των πνευματικών δικαιωμάτων, αλλά το βλέπουμε σε διάφορες ψηφιακές βιβλιοθήκες, όπως και στα Google books, ότι βιβλία που ο συγγραφέας του έχει πεθάνει πριν από το (μεγαλύτερο, νομίζω) όριο των 70 ετών, δεν προσφέρονται δωρεάν για κατέβασμα αν υπάρχει πρόσφατη κυκλοφορία τους σε έντυπη έκδοση. Εδώ, δηλαδή, δεν νομίζω ότι προστατεύονται τα πνευματικά δικαιώματα των κληρονόμων του Αναστασίου Μέγα, αλλά υπάρχει κάποια ρύθμιση που προστατεύει την πρόσφατη επένδυση της Δωδώνης στην επανέκδοση του βιβλίου.
 

SBE

¥
Αυτό μου φαίνεται λίγο παράξενο, Νίκελ.
Αφού η Ιλιάδα δεν έχει κοπιράιτ, οποιοσδήποτε μπορεί να την εκδώσει με νέο, φαντεζί εξώφυλλο χωρίς να αλλάζει τίποτα.
Κι αν εκτός από εξώφυλλο βάλεις μετάφραση και σχολιασμό, το κοπιράιτ περιλαμβάνει μόνο αυτά, όχι το κείμενο της Ιλιάδας.
 

nickel

Administrator
Staff member
Αντιλαμβάνομαι αυτό που λες, αλλά, αν υπάρχει κάποια διαφορετική ρύθμιση, μπορεί να έχει να κάνει με άλλες αλλαγές, από την πιο απλή (μετατροπή πολυτονικού κειμένου σε μονοτονικό) μέχρι πιο πολύπλοκη (προσαρμογή κειμένου στη δημοτική). Αλλά δήλωσα ήδη άγνοια.
 
Δεν είναι τόσο απλό με το κοπιράιτ. Για την Ιλιάδα δεν ξέρω, αλλά αν εκδώσεις έναν αρχαίο κάπου θα στηριχτείς και αυτή η δουλειά έχει κοπιράιτ. Δηλαδή το TLG έχει κοπιράιτ για την αναστήλωση των κειμένων και ξέρω από πρώτο χέρι ότι κάνουν φασαρία σε όσους δεν ζητάνε άδεια.
 
Top