&uot andreagaschi.org

Distribuited Knowledge Management in B2B

Tralasciamo le tradizionali applicazioni che coniugano Semantic Web e P2P, come il Knowledge Management, perché vorrei parlarvi di una proposta innovativa trattata nel corso del progetto di cui ho parlato in Semantic P2P - Executive Summary. L’idea consiste nell’applicare le tecnologia sopra citate al B2B, in particolare ai marketplace.

Cos’è un marketpkace: è un luogo “concettuale” in cui si incontrano diversi soggetti per scambiare beni e servizi. L’obiettivo primario è aumentare l’efficienza delle transazioni, favorendo la trasparenza delle alternative e eliminando asimmetrie informative, e l’aggregazione delle esigenze per massimizzare il potere negoziale (in particolare nell’eProcurement).

I marketplace sono caratterizzati da due esigenze contrapposte:

  • Autonomia: perché sono composti da soggetti collettivi (buyer, seller) ma anche individuali (i singoli acquirenti) che fanno le cose in modo diverso perché hanno obiettivi diversi
  • Coordinamento: i partecipanti hanno l’esigenza di scambiare informazioni reciprocamente comprensibili.

Le esigenze di autonomia e coordinamento si esprimono a livelli diversi:

  • Connettività: ogni soggetto organizza le proprie informazioni in tecnologie fisicamente o sintatticamente inaccessibili agli altri.
  • Comunicazione: ogni soggetto chiama le cose in modo diverso o da significati diversi alle stesse cose.
  • Processi: ogni soggetto svolge le proprie attività in modo diverso (procedure negoziali, di certificazione, di aggregazione, di esecuzione della transazione).

Il primo problema viene risolto da Internet, le piattaforme di marketplace si propongono di risolvere gli altri due. In particolare i problemi di comunicazione vengono affrontati attraverso la standardizzazione dei cataloghi. I gestori dei marketplace forniscono un catalogo comune su cui si mappano gli utilizzatori; nel caso eProcurement, sul catalogo del sistema devono essere mappati i cataloghi fisici dei fornitori e i cataloghi “mentali” dei compratori. Tuttavia i cataloghi sono difficili da standardizzare a causa della soggettività delle persone e del fatto che i cataloghi hanno spesso obiettivi diversi.

Anche per quanto riguarda i processi il mondo B2B sta proponendo standard per la codifica dei processi secondo un unico modello (WSDL, DAML-S, …). In generale la standardizzazione pone dei limiti seri in termini di usabilità, manutenibilità, interoperabilità, dinamicità.

L’approccio distribuito invece non assume l’esistenza di un qualche ente centrale che standardizzi il significato e il modo di eseguire una transazione, ma solo la presenza di un ente che favorisca il coordinamento diretto tra i soggetti coinvolti. In particolare ogni soggetto gestisce il proprio catalogo secondo la sua soggettività ed i suoi obiettivi; mentre il sistema favorisce la traduzione automatica da un catalogo all’altro (gestione distribuita dei cataloghi) e l’aggregazione virtuale di gruppi di acquisto o vendita.

Il sistema funziona senza la presenza necessaria di una tecnologia (server/portale) e di un gestore centralizzati, ma ogni partecipante, come nel web, fornisce un “pezzo” di tecnologia e di gestione al sistema complessivo.

 

Semantic P2P - Executive summary

Posto l'executive summary di un progetto realizzato insieme al mio collega Alessio Gambi per il corso di Argomenti avanzati di sistemi informativi.


Nei nostri giorni la maggior parte delle informazioni (non solo file HTML!) viene generata in maniera elettronica e la mole di questi dati cresce esponenzialmente nel tempo. Contemporaneamente i sistemi P2P stanno ottenendo una popolarità sempre maggiore grazie alla loro scalabilità, resistenza ai guasti e contenuti self-organazing e sembrano essere la soluzione ideale per la costruzione di sistemi di Information Retrieval su larga scala e a basso costo. Tuttavia le tecniche di ricerca proposte in passato per le reti P2P sono in larga basate sul semplice confronto di parole chiave; questo implica che ricerche con parole chiave comuni danno come risultato un insieme estremamente ampio ma superfluo di risultati, che il richiedente non è in grado di gestire completamente. Inoltre nei sistemi P2P i documenti sono disposti sulla rete in maniera csuale rispetto alla loro semantica. Il sistema quindi deve controllare un gran numero di nodi per raggiungere quei documenti che potrebbero essere rilevanti per l'utente.

La soluzione proposta è quella di definire il concetto di semantic overlay, una rete logica costruita su quella fisica, dove i contenuti sono organizzati in base alla loro semantica piuttosto che in base alla loro distanza, con il risultato che due documenti debolmente collegati o totalmente scollegati appaiono rispettivamente lontani nella rete.

Le risorse informative nelle reti P2P non sono organizzate in strutture simili a quelle degli ipertesti, non possono quindi essere navigate. Tuttavia possono essere memorizzate sui nodi che rimangono in attesa delle richieste. Le richieste sui peer richiedendo la presenza dei metadati che li descrivono e, anche se in casi particolari questo non implica nessuna difficoltà, in generale non è banale.
Concentrandosi su formati per specifici domini, le implementazioni correnti dei sistemi P2P appaiono frammentati e distaccati piuttosto che fornire un meccanismo unificante per le future implementazioni.

Negli ambienti P2P i metadati sono una risorsa molto più importante e cruciale rispetto ai tradizionali ambienti Web in quanto servono a descrivere le risorse possedute da un nodo. Fino ad oggi le reti di questo tipo hanno sfruttato meccanismi particolari e specifici del dominio applicativo a cui fanno riferimento.

Il lavoro si articola partendo da una introduzione alle tecnologie che stanno alla base del P2P e della semantica applicata al Web, e successivamente si concentra sull’analisi delle principali soluzioni attualmente disponibili. Verranno descritte, in dettaglio, quelle soluzioni in cui sono coniugati i punti di forza delle architetture P2P con quelli dovuti all’introduzione delle ontologie nelle applicazioni distribuite.
Le soluzioni su cui ci si è concentrati sono:
  • SWAP, progetto coordinato dall’AIFB Institute dell’Università di Karlsruhe;
  • Edutella
  • EDAMOK, realizzato in collaborazione tra Itc-Irst e l’Università di Trento;
  • PSearch
  • H3
Per ciascuna di esse è stata analizzata l’architettura dei nodi che compongono il sistema, sia dal punto di vista concettuale, sia dal punto di vista dei moduli software che effettivamente compongono l’implementazione. Oltre all’architettura ci si è concentrati sulle metodologie che sono state applicate, con particolare attenzione ai modelli utilizzati per la rappresentazione della conoscenza, alle tecniche per il processamento delle query, e alla loro propagazione. Inoltre sono stati evidenziati alcuni contributi originali e caratteristici delle varie soluzioni.

Nel terzo capitolo viene effettuato un confronto tra le applicazioni prese in esame per mettere a fuoco quali proprietà condividono e quali invece le rendono diverse. L'analisi prende in considerazione in maniera dettagliata le tre parti che si considerano fondamentali per questo tipo di sistemi: l'architettura del peer che partecipa alla rete, il modo di gestire le richieste e le risposte e i meccanismi per effettuare il joining al sistema.

Il quarto capitolo è dedicato alla presentazione di alcuni esempi di implementazione di questo tipo di reti. In particolare:
  • Bibster, un sistema basato sulle tecnologie di SWAP che assiste i ricercatori nella gestione, nella ricerca e nella condivisione di dati bibliografici in una rete P2P;
  • PADLR, che realizza una struttura web per il supporto all'apprendimento universitario attraverso la condivisione di conoscenza e di materiali didattici;
  • Distribuited Knowledge Management in B2B, una proposta alternativa rispetto alle tradizionali applicazioni, che utilizza le tecniche del Semantic Web e del P2P nella gestione di marketplace.