Google, το αναξιόπιστο

Θύμα της επιτυχίας του ή της μανίας των υπευθύνων του για όλο και περισσότερα χιτ, στην αρχή κατάργησε τη διάκριση τονουμένων, μετά έβαλε και όλους τους λεκτικούς τύπους μιας λέξης, ύστερα και τα γκρίκλις, τώρα διαπιστώνω πολύ ανησυχητικές ανακολουθίες.

Υπόψη, ότι αυτά τα κάνω σε διεθνές γκουγκλ. Ίσως στο ελληνικό να διαφέρει.

Ανακολουθία πρώτη, οι ανευρέσεις που δεν είναι εκεί.
Κάνω αναζήτηση του όρου "ιστοχώρος".
http://www.google.com/advanced_search?q=ιστοχώρος&hl=en&lr=&as_qdr=all

Βρίσκω 189.000 ανευρέσεις. Ωστόσο, στην πρώτη σελίδα, οι δύο πρώτες ανευρέσεις (!) και συνολικά τουλάχιστο οι 4 στις 10 της πρώτης σελίδας ΔΕΝ περιέχουν τη λέξη "ιστοχώρος" στο κείμενό τους, που άλλωστε είναι όλο αγγλικό. Μπορεί να την περιέχουν σε ταγκζ, σε μέτα, σε σκέτα, σε γμσέτα, αλλά στο κείμενό τους όχι.

Ανακολουθία νάμπερ τού, το μέρος που είναι μεγαλύτερο από το όλο.
Για να αποφύγω τον παραπάνω σκόπελο, ζητάω να μου δώσει όλες τις ανευρέσεις του όρου ιστοχώρος που προέρχονται από ελληνόγλωσσα σάιτ. Η κοινή λογική αλλά και η μαθηματική λογική λένε ότι ο αριθμός αυτός πρέπει να είναι μικρότερος ή το πολύ ίσος με τον παραπάνω, 189.000. Ωστόσο είναι κατάτι μεγαλύτερος, 194.000:
http://www.google.com/search?hl=en&...=&as_occt=any&cr=&as_nlo=&as_nhi=&safe=images

Εντάξει, μικρή η διαφορά. Έστω τώρα ότι του ζητάω τις ανευρέσεις της λέξης ιστοχώρος σε σάιτ ελληνόγλωσσα ΚΑΙ ελλαδικά (δηλ. με το παρέκταμα .gr, έτσι ώστε π.χ. να αποκλείεται το δοξασμένο sarantakos.com)
Ε, αυτά είναι.... πολύ περισσότερα, 312.000:
http://www.google.com/search?hl=en&...=&as_occt=any&cr=&as_nlo=&as_nhi=&safe=images

Τέτοιο φαινόμενο παρατηρείται βέβαια και στου χωριάτη το σκοινί, που μονό δεν φτάνει και διπλό περισσεύει, κάτι παρόμοιο υπάρχει και στην Αλίκη στη χώρα των Θαυμάτων, αλλά στο γκουγκλ....;
 

nickel

Administrator
Staff member
Με αφορμή την αναζήτησή σου, Νίκο, ανακάλυψα κι εγώ ότι ο ιστοχώρος είναι θηλυκό ουσιαστικό: Βικιλεξικό - ιστοχώρος
Τώρα εξηγείται. La donna è mobile.

Θα είναι πληκτικό να δώσω τα δικά μου ευρήματα, που είναι εντελώς διαφορετικά και εξίσου αναξιόπιστα.
 

nickel

Administrator
Staff member
Μπορώ ωστόσο να αναδείξω μια άλλη διάσταση:

Ζητώ "ιστοχώρος" site:gr, μου αναφέρει κάπου 92.000 ευρήματα. Προχωρώ σελίδα σελίδα, και κάποια στιγμή το Γκουγκλ, εξαντλημένο (κι αυτό), ομολογεί ότι έχει να μου δείξει μόνο 480!

 

Zazula

Administrator
Staff member
Ζητώ "ιστοχώρος" site:gr, μου αναφέρει κάπου 92.000 ευρήματα. Προχωρώ σελίδα σελίδα, και κάποια στιγμή το Γκουγκλ, εξαντλημένο (κι αυτό), ομολογεί ότι έχει να μου δείξει μόνο 480!
Μα, και website να βάλεις (που θα σου δώσει 1.740.000.000 ευρήματα), μόνο τα πρώτα 1000 αποτελέσματα θα σου εμφανίσει. (Αν είσαι πιο large, βάλε a να λάβεις 17.540.000.000 ευρήματα.)

Εγώ έκανα διάφορα πειράματα με τους τρεις όρους αναζήτησης που έθεσε ο Ν.Σ. και σε ποικίλους συνδυασμούς, και κάθε φορά κατέληγα σε διαφορετικούς συνολικούς αριθμούς τελικών ανευρέσεων. Και παίζοντας με το πού τελειώνει η παράθεση, πάντοτε κατέληγα σε τριψήφιους αριθμούς (αλλά διαφορετικούς κάθε φορά - λ.χ. 209, 668, 860).

ΥΓ Μία εγγενής αδυναμία τού όρου αναζήτησης "ιστοχώρος" είναι το γεγονός ότι (ιδίως οι αυτόματες μεταφράσεις) κοτσάρουν κι από ένα "ιστοχώρος" στο footnote καθεμιάς ιστοσελίδας για άπειρους ιστοτόπους που γράφουν π.χ. "Website Copyright © 2008" - καταλήγοντας έτσι σε αναρίθμητα redundant ευρήματα.

References
[URL="http://www.googleguide.com/interpreting_queries.html"]Interpreting Your Query[/URL]
[URL="http://www.googleguide.com/google_works.html"]How Google Works[/URL]
 
Top