L'ingresso in quest'area
è riservato agli Editori ODP
in possesso di password INGRESSO REGISTRAZIONE
Vengono illustrati in questa pagina i diversi modi in cui i dati di Open Directory sono
utilizzati dai molti motori di ricerca e directory, analizzando brevemente i possibili
risultati delle richieste di inserimento effettuate sia sul database centrale che
attraverso tali utilizzatori.
ODP è un progetto Open Content (non Open Source, per essere
precisi). Questo significa essenzialmente che chiunque può utilizzare e pubblicare i dati
della Directory, in tutto o in parte, gratuitamente, purchè venga incluso nelle
elaborazioni risultanti un riconoscimento standard (dichiarazione di attribuzione), che
comprende il collegamento alle pagine con le indicazioni su come diventare un editore. E'
possibile leggere il testo originale (in inglese) della Licenza Ufficiale, e la sua traduzione italiana.
Vi sono però molti modi per utilizzare i dati ODP. Alcuni
servizi di ricerca scaricano il Dump RDF ODP e gestiscono sui propri server il database realizzando
opere derivate anche con l'integrazione di dati propri o provenienti da altre fonti Tali
servizi di ricerca utilizzano algoritmi proprietari per analizzare i dati ODP ed hanno
interfacce per la presentazione dei risultati tra le più disparate. Alcuni di essi
utilizzano i dati stessi come base informativa per i propri crawler, che vengono lanciati
sui server dove risiedono i siti presenti in ODP per ricavare ulteriori informazioni ed
analizzare tutte le pagine dei singoli siti. Altri ancora si avvalgono di speciali
software che consentono di presentare i dati ODP con un interfaccia personalizzata, senza
gestire direttamente il database ma collegandosi ai server ODP o Netscape in tempo reale
ad ogni ricerca effettuata dagli utenti. Senza contare infine i moltissimi gateway, siti
che ospitano in una o più pagine una interfaccia con collegamenti diretti alle pagine di
categoria ed alla form di ricerca residenti sui server ODP (ad esempio, come fa questo
stesso sito nella pagina di ODP Gateway
e nel menu di navigazione). E' quindi possibile trovare in giro per il Web una
infinità di versioni diverse basate sul database originario Open Directory. Per i
webmaster interessati abbiamo previsto una pagina che tratta in particolare di come utilizzare i dati ODP.
I servizi di ricerca siti che utilizzano i dati ODP e che lo
hanno comunicato o che sono stati individuati come tali sono centinaia.
Alcuni di essi sono delle directory ricercabili, ovvero offrono la possibilità di
ottenere risultati di ricerca sia seguendo lo sviluppo logico dell'albero delle categorie
(così come è impostato in ODP, modificandolo, o utilizzandone solo una parte) sia
attraverso un software che esplora la base dati dei siti presenti in seguito alle query
impostate. Altri sono dei motori di ricerca, che utilizzano la base dati dei siti come
punto di partenza per i propri crawler, che una volta lanciati sui singoli siti ne
rilevano tutte le pagine interne e le includono in un database più ampio da cui vengono
estrapolati i risultati delle ricerche degli utenti.
Un elenco aggiornato degli utilizzatori dei propri dati che
presentano una interfaccia in lingua inglese viene mantenuto dalla stessa Open Directory,
in una apposita categoria dedicata ai motori di ricerca e directory che utilizzano i dati ODP. Esiste
ovviamente una categoria corrispondente in lingua italiana che contiene l'elenco dei motori
e directory in lingua italiana che utilizzano i dati ODP. Il contenuto di queste
categoria è però da considerarsi solo parzialmente completo: poichè - fatta salva
l'apposizione della dichiarazione di attribuzione - chi utilizza i dati non ha l'obbligo
di comunicarlo ufficialmente, in realtà sono ancora molti i siti che non sono compresi
nell'elenco, e d'altra parte molti ne nascono ogni giorno.
Pur essendovi in giro decine di mirror o gateway del sito
Dmoz.org, tutti perfettamente legali purchè venga apposta la dichiarazione di
attribuzione prevista dalla Licenza
Netscape, esistono alcuni Mirror Ufficiali ODP, che
risiedono su domini di terzo livello dmoz.org. I dati presenti su questi siti vengono
aggiornati quotidianamente con un feed dedicato da parte del server centrale ODP, e sono
stati realizzati per "distribuire" il carico del server principale su server
residenti in altre parti del mondo. Attualmente, sono attivi i seguenti Mirror Ufficiali: http://ch.dmoz.org/ http://de.dmoz.org/
La base dati Open Directory viene continuamente aggiornata dagli
editori in tempo reale attraverso una interfaccia apposita, il cui accesso è riservato ai
soli editori ODP. Poichè gli editori lavorano su un server dedicato ed indipendente,
possono passare da alcuni minuti ad alcune ore prima che le modifiche appaiano sulla
interfaccia riservata al pubblico, che risiede sul server accessibile all'indirizzo http://dmoz.org/. Oltre ad essere presentati
con una interfaccia di directory ricercabile nelle pagine del sito http://dmoz.org/, i dati ODP sono messi a disposizione di chi
desidera utilizzarli per il proprio servizio di ricerca sottoforma di un pacchetto di file
in formato RDF (il Dump RDF
ODP) che viene aggiornato con cadenza settimanale. Open directory non ha però
nessun controllo sulla frequenza con cui i dati messi a disposizione vengono
effettivamente rilevati, utilizzati ed aggiornati dai singoli servizi di ricerca che ne
fanno uso. Mentre alcuni di essi possono offrire al pubblico versioni estremamente
aggiornate di ODP, o come detto persino versioni in tempo reale agendo come interfaccia
tra l'utente e i server dmoz.org o Netscape, altri possono anche lasciar passare diverse
settimane prima di provvedere ad un nuovo aggiornamento.
In pratica, cosa capita ad un sito che viene effettivamente
inserito da un editore di Open directory in una categoria? Quando e a chi sarà visibile?
Ecco le risposte:
- è visibile dopo poco tempo (da pochi secondi a poche ore) nelle pagine visibili al
pubblico della categoria ODP in cui è stato inserito;
- è di conseguenza visibile con gli stessi tempi nei motori di ricerca e directory che
utilizzano i dati ODP "live", collegandosi ai server dmoz.org;
- è visibile dopo pochi giorni in modalità ricerca sulle pagine di ODP, in quanto
l'indice di ricerca viene aggiornato ogni 10-15 giorni;
- è di conseguenza visibile con gli stessi tempi nei motori di ricerca e directory che
utilizzano i dati ODP "live" collegandosi ai server dmoz.org;
- è visibile nei motori di ricerca e directory che gestiscono il database scaricato con
l'RDF dump in tempi variabili, a seconda della frequenza con cui questi motori e directory
scaricano l'RDF dump ed aggiornano il proprio database interno;
- viene visitato periodicamente dai crawler dei motori di ricerca che utilizzano i dati
ODP per costruire il proprio database di pagine e siti Web e gestirlo indipendentemente;
- è visibile in tutti i servizi di ricerca che utilizzano i dati ODP, ma in modi diversi
e con rilevanze diverse a seconda dell'algoritmo di ranking utilizzato da tali servizi di
ricerca.
Inserire il proprio sito in Open Directory è oggigiorno uno dei
sistemi più rapidi ed efficaci per ritrovarlo nei tanti motori di ricerca e directory che
utilizzano i dati di questo progetto. Molti di essi offrono agli utenti finali la
possibilità di "inserire il proprio sito nel database". Dove vanno a finire
tali richieste? Possiamo dire con certezza che tutti i servizi di ricerca che utilizzano i
dati ODP "live" collegandosi ai server dnoz.org girano direttamente ad ODP le
richieste di inserimento dei siti, che vanno quindi a finire nella speciale area riservata
ai siti in attesa di recensione nelle varie categorie della directory principale. In
alcuni casi, i collegamenti per inserire un sito rimandano alla form di inserimento stessa
di ODP. Anche alcuni dei motori e directory che mantengono un database residente e lo
aggiornano scaricando periodicamente l'RDF Dump continuano però ad avvalersi degli
editori ODP per la valutazione, recensione ed inserimento dei siti nel database che poi
viene utilizzato, pur presentando all'utente interfacce di inserimento personalizzate.
Altri ancora utilizzano tali inserimenti per costruire database indipendenti, sul quale
lanciare eventualmente il proprio crawler per rilevare le singole pagine del sito.
E' quindi facile capire come, molto spesso, richieste di
inserimento del proprio sito effettuate separatamente su più motori e directory vadano
materialmente a confluire su Open Directory, dove un editore le valuterà cancellando gli
eventuali doppioni. Da qui, in tempi e modi diversi, il sito finalmente inserito nel
database centrale si trova ad essere utilizzato dai servizi di ricerca che lo avevano
"inviato" per recensione.
Quando si è certi che un servizio di ricerca utilizza in modo
esclusivo i dati ODP è quindi più comodo proporre l'inserimento del proprio sito
direttamente dalle pagine delle categorie ODP, che comunque costituisce una "porta di
accesso" privilegiata anche ai database dei molti motori che integrano tali dati con
quelli proprietari. L'opera di valutazione e recensione effettuata dagli editori è
infatti considerata un "valore aggiunto" anche dai principali e più noti motori
di ricerca, che assegnano mediamente una rilevanza nettamente superiore al sito se questo
è rilevato dal database ODP piuttosto che segnalato solamente attraverso le rispettive
form di inserimento presenti sui singoli motori.