12 Οκτωβρίου 2016

To αόρατο ή σκοτεινό Web, υπερβολές και η αλήθεια




- Ξεκινώντας την περιήγησή μας στα αχαρτογράφητα ΄΄νερά΄΄ του μη ορατού τμήματος του παγκόσμιου ιστού μέρους του οποίου ανήκει το internet όπως το γνωρίζουμε ρίχνοντας φως στον δαιδαλώδη μηχανισμό που τον αποτελεί και που τον περιγράφει ως το αόρατο ή σκοτεινό μέρος του παγκόσμιου ιστού περιγράφοντας τα τεχνικά χαρακτηριστικά του με τον απλούστερο δυνατό τρόπο ώστε και ο πιο αδαής αναγνώστης να μπορέσει να το κατανοήσει.

- Ο παγκόσμιος ιστός (Web) θεωρείται το δίκτυο των συνδεδεμένων υπολογιστών και δικτύων σε παγκόσμια κλίμακα, και το οποίο χρησιμοποιεί μία συγκεκριμένη ομάδα πρωτοκόλλων&επικοινωνίας, γνωστή και ως "http". Κάθε δίκτυο-δομική μονάδα του διαδικτύου αποτελείται από συνδεδεμένους υπολογιστές σε τοπικό επίπεδο, για παράδειγμα το δίκτυο υπολογιστών των κεντρικών γραφείων μιας εταιρίας.

- Αυτά τα δίκτυα με τη σειρά τους συνδέονται σε ευρύτερα δίκτυα, όπως εθνικά και υπερεθνικά. Το ευρύτερο δίκτυο στον κόσμο λέγεται παγκόσμιος ιστός το οποίο είναι μοναδικό (δηλαδή δεν υπάρχουν παραπάνω από ένα δίκτυα υπολογιστών παγκόσμιας κλίμακας), και συμπεριλαμβάνεται τόσο τα γήινα δίκτυα, όσο και τα δίκτυα των δορυφόρων της και άλλων διαστημικών συσκευών που είναι συνδεδεμένα σε αυτό. Η τεχνολογία του ιστού καθιστά δυνατή την δημιουργία "υπερκειμένων", μία διασύνδεση δηλαδή πάρα πολλών μη ιεραρχημένων στοιχείων που παλαιότερα ήταν απομονωμένα. Τα στοιχεία αυτά μπορούν να πάρουν και άλλες μορφές πέραν της μορφής του γραπτού κειμένου, όπως εικόνας και ήχου.

Ας εξετάσουμε όμως λίγο πιο προσεκτικά ώστε να κατανοήσουμε τι ακριβώς είναι αυτό που ονομάζεται Deep Web δηλαδή σε απλά ελληνικά το αόρατο-σκοτεινό Web ή για είμαι πιο ακριβής το κρυφό Web ώστε να απομυθοποιήσουμε τον αποκρυφιστικός τρόπο με το οποίο προβάλλεται. Τo Deep Web ( γνωστό και ως Deepnet, DarkNet, Undernet, το αόρατο Web ή αλλιώς το κρυμμένο Web) αναφέρεται στο περιεχόμενο του World Wide Web που δεν ανήκει στο Επιφανειακό Web (Surface Web), που μπορεί να ανακαλύψει μία συνηθισμένη μηχανή αναζήτησης. Mike Bergman, ιδρυτής του BrightPlanet είχε πει χαρακτηριστικά ένα πρακτικό παράδειγμα που θα μας βοηθήσει να το κατανοήσουμε, το να ψάχνει κανείς στο Internet, είναι σαν να σέρνει ένα δίχτυ στην επιφάνεια του ωκεανού άρα πολλά μπορεί να πιαστούν στο δίχτυ, αλλά υπάρχει πάντα κάτι περισσότερο που δεν θα πιαστεί, επομένως πράγματι στο internet βρίσκουμε ένα πολύ μεγάλο σχεδόν ανεξάντλητο θα έλεγα πλούτο πληροφοριών που βρίσκεται πολύ βαθιά και επομένως δεν μπορεί να πιαστεί από το δίχτυ της τεχνολογίας.

- Οι περισσότερες πληροφορίες στο Web είναι ΄΄θαμμένες΄΄ μέσα σε ιστότοπους με δυναμικά παραγόμενες ιστοσελίδες, και οι συνηθισμένες μηχανές αναζήτησης δεν μπορούν να τις εντοπίσουν και ανακτήσουν το περιεχόμενό τους γιατί πολύ απλά οι ιστοσελίδες αυτές δεν υπάρχουν για τις μηχανές αναζήτησης μέχρι να δημιουργηθούν δυναμικά ως το αποτέλεσμα μιας συγκεκριμένης αναζήτησης. Σύμφωνα με εκτιμήσεις που έγιναν σε μία μελέτη στο Πανεπιστήμιο Berkeley της Καλιφόρνια (University of California, Berkeley) το 2001 το deep Web αποτελείτο περίπου από 91.000 terabytes. Αντίθετα το επιφανειακό Web (που είναι εύκολα προσπελάσιμο από τις μηχανές αναζήτησης) είναι περίπου 167 terabytes. Για παράδειγμα η Βιβλιοθήκη του Αμερικάνικου Κογκρέσου υπολογίστηκε πως το 1997 είχε 3.000 terabytes, το 2011, το YouTube υπολογίζεται ότι είχε αποθηκευμένα περίπου 200 εκατομμύρια βίντεο, συνολικού μεγέθους 5 petabytes ή 5000 terabytes.

- Ο υπολογισμός ωστόσο του μεγέθους του web διαφέρει από πηγή σε πηγή και έτσι υπάρχει ένα μεγάλο περιθώριο λάθους και κανένας αριθμός δε μπορεί να θεωρηθεί ως ακριβής. Για να κατανοήσουμε όμως καλύτερα τους λόγους για τους οποίους ένα μεγάλος μέρος αυτών των πηγών δεν είναι εμφανής ας δούμε κάποιους σημαντικούς λόγους της μη εμφάνισης τους. Το δυναμικά παραγόμενο περιεχόμενο δηλαδή οι δυναμικές ιστοσελίδες οι οποίες δημιουργούνται ως αποτέλεσμα της εκτέλεσης κάποιας ερώτησης η προσπελαύνονται μόνο μέσω κάποιας φόρμας.

- Το μη συνδεδεμένο περιεχόμενο δηλαδή εκείνες ιστοσελίδες οι οποίες δεν περιέχουν συνδέσμους από άλλες ιστοσελίδες, το Ιδιωτικό Web εκείνοι δηλαδή οι ιστότοποι που απαιτούν εγγραφή (registration) και κωδικό πρόσβασης, ακόμη περιλαμβάνονται οι ιστότοποι με περιεχόμενο περιορισμένης πρόσβασης όπως ιστότοποι που περιορίζουν την πρόσβαση στις σελίδες τους με τεχνικό τρόπο και απαγορεύουν στις μηχανές αναζήτησης να πλοηγούνται στις ιστοσελίδες τους . Θα πρέπει να σημειώσω ότι περιεχόμενο που δεν είναι σε μορφή HTML όπως για παράδειγμα κείμενα που συμπεριλαμβάνονται σε multimedia αρχεία (εικόνες ή video) ή που έχουν συγκεκριμένη μορφή την οποία δεν μπορούν να χειριστούν οι μηχανές αναζήτησης.

- Κείμενα που χρησιμοποιούν το παλαιότερο πρωτόκολλο Gopher και αρχεία που βρίσκονται σε διακομιστές FTP και τα οποία δεν μπορούν να εντοπιστούν από τις περισσότερες μηχανές αναζήτησης. Οι μηχανές αναζήτησης όπως η Google δεν ευρετηριάζουν ιστοσελίδες που βρίσκονται έξω από το πρωτόκολλο HTTP.

- Συνοψίζοντας και με πολύ απλά λόγια, το deep Web, δεν είναι τίποτα περισσότερο και τίποτα λιγότερο από τις πληροφορίες που πολύ απλά εμείς δεν μπορούμε να δούμε και να αντλήσουμε και να προσπελάσουμε για τους πολύ απλούς λόγους που αναφέραμε.



Δεν υπάρχουν σχόλια:
Write σχόλια