&uot andreagaschi.org

Semantic P2P - Executive summary

Posto l'executive summary di un progetto realizzato insieme al mio collega Alessio Gambi per il corso di Argomenti avanzati di sistemi informativi.


Nei nostri giorni la maggior parte delle informazioni (non solo file HTML!) viene generata in maniera elettronica e la mole di questi dati cresce esponenzialmente nel tempo. Contemporaneamente i sistemi P2P stanno ottenendo una popolarità sempre maggiore grazie alla loro scalabilità, resistenza ai guasti e contenuti self-organazing e sembrano essere la soluzione ideale per la costruzione di sistemi di Information Retrieval su larga scala e a basso costo. Tuttavia le tecniche di ricerca proposte in passato per le reti P2P sono in larga basate sul semplice confronto di parole chiave; questo implica che ricerche con parole chiave comuni danno come risultato un insieme estremamente ampio ma superfluo di risultati, che il richiedente non è in grado di gestire completamente. Inoltre nei sistemi P2P i documenti sono disposti sulla rete in maniera csuale rispetto alla loro semantica. Il sistema quindi deve controllare un gran numero di nodi per raggiungere quei documenti che potrebbero essere rilevanti per l'utente.

La soluzione proposta è quella di definire il concetto di semantic overlay, una rete logica costruita su quella fisica, dove i contenuti sono organizzati in base alla loro semantica piuttosto che in base alla loro distanza, con il risultato che due documenti debolmente collegati o totalmente scollegati appaiono rispettivamente lontani nella rete.

Le risorse informative nelle reti P2P non sono organizzate in strutture simili a quelle degli ipertesti, non possono quindi essere navigate. Tuttavia possono essere memorizzate sui nodi che rimangono in attesa delle richieste. Le richieste sui peer richiedendo la presenza dei metadati che li descrivono e, anche se in casi particolari questo non implica nessuna difficoltà, in generale non è banale.
Concentrandosi su formati per specifici domini, le implementazioni correnti dei sistemi P2P appaiono frammentati e distaccati piuttosto che fornire un meccanismo unificante per le future implementazioni.

Negli ambienti P2P i metadati sono una risorsa molto più importante e cruciale rispetto ai tradizionali ambienti Web in quanto servono a descrivere le risorse possedute da un nodo. Fino ad oggi le reti di questo tipo hanno sfruttato meccanismi particolari e specifici del dominio applicativo a cui fanno riferimento.

Il lavoro si articola partendo da una introduzione alle tecnologie che stanno alla base del P2P e della semantica applicata al Web, e successivamente si concentra sull’analisi delle principali soluzioni attualmente disponibili. Verranno descritte, in dettaglio, quelle soluzioni in cui sono coniugati i punti di forza delle architetture P2P con quelli dovuti all’introduzione delle ontologie nelle applicazioni distribuite.
Le soluzioni su cui ci si è concentrati sono:
  • SWAP, progetto coordinato dall’AIFB Institute dell’Università di Karlsruhe;
  • Edutella
  • EDAMOK, realizzato in collaborazione tra Itc-Irst e l’Università di Trento;
  • PSearch
  • H3
Per ciascuna di esse è stata analizzata l’architettura dei nodi che compongono il sistema, sia dal punto di vista concettuale, sia dal punto di vista dei moduli software che effettivamente compongono l’implementazione. Oltre all’architettura ci si è concentrati sulle metodologie che sono state applicate, con particolare attenzione ai modelli utilizzati per la rappresentazione della conoscenza, alle tecniche per il processamento delle query, e alla loro propagazione. Inoltre sono stati evidenziati alcuni contributi originali e caratteristici delle varie soluzioni.

Nel terzo capitolo viene effettuato un confronto tra le applicazioni prese in esame per mettere a fuoco quali proprietà condividono e quali invece le rendono diverse. L'analisi prende in considerazione in maniera dettagliata le tre parti che si considerano fondamentali per questo tipo di sistemi: l'architettura del peer che partecipa alla rete, il modo di gestire le richieste e le risposte e i meccanismi per effettuare il joining al sistema.

Il quarto capitolo è dedicato alla presentazione di alcuni esempi di implementazione di questo tipo di reti. In particolare:
  • Bibster, un sistema basato sulle tecnologie di SWAP che assiste i ricercatori nella gestione, nella ricerca e nella condivisione di dati bibliografici in una rete P2P;
  • PADLR, che realizza una struttura web per il supporto all'apprendimento universitario attraverso la condivisione di conoscenza e di materiali didattici;
  • Distribuited Knowledge Management in B2B, una proposta alternativa rispetto alle tradizionali applicazioni, che utilizza le tecniche del Semantic Web e del P2P nella gestione di marketplace.
 

Comments: Post a Comment

<< Home