torna all'home page | mass media | internetinformatica

Web semantico 

 

 

Tim Berners-Lee
 
Linguaggio di analisi dei documenti su Web a 3 livelli:
descrizione della semantica (definizione degli strumenti di supporto per l'interpretazione automatica dei documenti, cioè del rapporto tra marcatori xml e realtà del documento)  Ontology Interchange Language (OIL)
descrizione dello schema classi-sottoclassi Resource Description Framework (RDF)-schema
descrizione del modello dei dati e dei metadati (Soggetto-Predicato-Oggetto) Resource Description Framework (RDF)
L'XML nasce dalla necessità di superare la semplice descrizione interna al documento html (metatag), definendo (con appositi marcatori)  i linguaggi con cui il documento potrà successivamente essere letto dai vari MR. Per ottenere questo "linguaggio" si isola - attraverso una Document Type Definition (DTD) - l'aspetto strutturale del documento, dalla formattazione del documento stesso e soprattutto dal significato dei marcatori (aspetto semantico, cioè rapporto tra linguaggio-marcatori e "mondo esterno" ovvero contenuto concreto del documento). Il linguaggio costituito dai marcatori XML è  puramente formale, autoesplicantesi, costituito cioè da elementi che si definiscono reciprocamente nei loro rapporti ( = con piena funzionalità per l'aspetto sintattico). Il linguaggio xml può assomigliare  - direbbe ECO 1984 - ad una sorta di "DIZIONARIO completo". 

Questo tipo di struttura è stato delineato per la prima volta da Porfirio, che per definire tutto l'universo dei possibili universali (le categorie aristoteliche) ha creato la struttura ad albero, ove dal generale onnicomprendente si passava ai sottoinsiemi fino ad esaurire sia il genere che la specie con l'indicazione del singolo individuo: 

sostanza-> animale->uomo->Socrate.

 Quest'ultimo, proprio perché è una realtà individua, è già fuori dal campo della specie, è il "mondo esterno", è gia fuori dall'albero.  

Ora la definizione dell'essenza degli oggetti di un MONDO si chiama ONTOLOGIA [che, se si vuol riprendere l'esempio di ECO, rappresenta l 'ENCILOPEDIA (mentre la struttura-sintassi-albero rappresentava il DIZIONARIO1)]. Anche in informatica si rende necessaria un' ontologia, cioè la descrizione degli oggetti del "mondo reale" ai quali si dovrà rapportare l'xml (l'albero sintattico). Come quella  filosofica (cfr. definizione in ABBAGNANO 1968), essa è costituita da una determinazione dei predicati costitutivi (=che ne sono cioè l'essenza) di un soggetto, dei predicati possibili di un soggetto, e degli oggetti che necessariamente esistono nel mondo descritto. Essa è l'unificazione della conoscenza: "Ponendosi per la prima volta ... nel ruolo di PRINCIPIO [Dio, l'Uno o altro...], l'uomo definisce quale sia la sostanza in quanto tale nel mondo che vuole unificare e interrogare, costruendo quella descrizione semantica, interrogando la quale si potranno al tempo stesso interrogare tutte le fonti da essa descritte." (PARODI-FERRARA 2002, 45). Ora il mondo è l'ontologia (che fa necessario riferimento al mondo reale, all'esperienza, come l'Enciclopedia) o è l'albero (che fa riferimento ai rapporti formali)? Ma l'albero come può articolarsi fino alla più dettagliata nota predicativa dell'individuo se non fa riferimento all'individuo concreto, e quindi all'esperienza? Ma allora l'albero-XML è "MODELLO" di rappresentazione della realtà o IMITAZIONE della realtà (cioè dell'insieme dei documenti del mondo-web)?

Di fatto il sistema xml non associa al documento alcuna regola di interpretazione: essa rimane un'attività lasciata al fruitore del documento. Per questo i ricercatori tendono a lasciare all'albero xml solo il valore di modello sintattico (cioè autoesplicante, senza riferimento alla realtà documentale), e ipotizzano linguaggi e modelli di rappresentazione basati su logiche diverse dall'xml. 

Il modello gerarchico dellALBERO individua genericamente delle inclusioni, ma p.e. non sa distinguere tra sottoinsiemi e parti, né si interessa a relazioni trasversali, p. es. al rapporto attivo di mangiare (chi mangia che cosa). 

-------------

Il

 La ripetizione di nodi, che non è ammessa dall''Albero ( mirante a garantire l'esclusività delle differenze specifiche), è invece accettata dall' xml

Per ovviare ai limiti semantici dell'xml e della struttura ad albero, oggi i tecnici cercano di ricorrere ad un altro metodo: quello  predicativo e logico, che dovrebbe costituire la base di un "ragionamento" cioè della costruzione - sulla base di quella specifica rappresentazione della conoscenza - di un insieme di possibili deduzioni (il tutto ovviamente da affidare agli automatismi del MR). Un procedimento del genere era stato sistematicamente adottato da Roberto Grossatesta che aveva chiamato resolutio  la parte che oggi noi chiameremo predicativa-induttiva (o di analisi logica) e compositio la parte deduttiva (o di sintesi logica).

Il web semantico, al  livello finale, quello ontologico,  si avvale appunto di tali strumenti di predicazione: creazione di descrittori semantici - cioè classificazione delle somiglianze-differenze fino agli elementi costitutivi di un fenomeno, e successivamente ordinamento delle proposizioni in modo che quelle più particolari risultino derivate necessariamente dalle generali. Questi formalismi che consentono la deduzione sono inseriti nell'Ontology Interchange Language (OIL): questo linguaggio consente quindi di mantenere una struttura gerarchica (come l'albero) e in più di predicare relazioni tra classi e sottoinsiemi, sempre con una relazione associata ad un'univoca interpretazione.

Il linguaggio OIL consiste nella definizione di:

  •  
  •  
  • Ecco la descrizione in OIL delle relazioni e delle gerarchie della figura qui accanto:

    class-def animale
    class-def pianta
             subclass-of   NOT animale
    class-def ramo
              slot-constraint parte-di
                          has-value pianta
    class-def foglia
             slot-constraint parte-di
                         has-value ramo
    class-def carnivori
              subclass-of animale
              slot-constraint mangia
                        value-type animale
    class-def erbivori
              subclass-of animale, NOT carnivori
              slot-constraint mangia
                      value-type pianta
                     OR
                     (slot-constraint parte-di
                     has-value pianta)

    modello Ontology Interchange Language

     

    --------------

    1) Alla fine per Eco la divisione dizionario-enciclopedia non esiste in quanto viene hegelianamente superata nella totalità dal mondo reale, che è la vera enciclopedia :  "Il dizionario ... si dissolve in una galassia illimitata e disordinata di elementi di conoscenza del mondo. Quindi diventa un'enciclopedia, e lo diventa perché di fatto era un'enciclopedia che s'ignorava ovvero un artificio escogitato per mascherare l'inevitabilità dell'enciclopedia" (ECO 1984)

    FONTI

    ABBAGNANO 1968 Nicola Abbagnano, Dizionario di Filosofia, TO:Utet, 1968 

    ECO 1984  Umberto Eco, L'albero di Porfirio, in Semiotica e filosofia del linguaggio, TO:Einaudi 1984 (cit in PARODI-FERRARA 2002)

    PARODI-FERRARA 2002  Massimo Parodi - Alfio Ferrara, XML, Semantic Web e rappresentazione della conoscenza, in "Mondo Digitale" (mondodigitale@cpi.polimi.it), 2002 , n. 3 (sett.), 42-51

    torna all'home page | mass media | internet | motori di ricerca e portaliinformatica

     

    1