Mappatura modello strutturato/relazionale

La struttura dati rappresentabile per mezzo di un formato XML pu� essere particolarmente complessa ed articolata con ripetizioni e nidificazioni la cui normalizzazione in un modello relazionale non sarebbero sempre realizzabili in modo efficace ed efficiente.

Per poter consentire, quindi, di fruire dei dati di un sistema come eXtraWay per mezzo di un approccio relazionale � necessario accettare alcune limitazioni, accettare che i dati possano essere rappresentati nel modo pi� somigliante a quanto richiesto dal modello relazionale senza snaturare il modello strutturato in XML.
Va da se che la complessit� della struttura XML adottata dipende strettamente dall'uso che di tali dati si intende fare: la dove si progetti una base dati tesa ad un prevalente utilizzo per mezzo del linguaggio SQL, la base dati stessa pu� essere concepita con una struttura semplificata per sposare al meglio tale esigenza. Per poter fruire del linguaggio SQL in ogni occasione, per�, alcune restrizioni dovranno essere ammesse. Vediamo di cosa si tratta.

Una forma intuitiva per identificare il modello relazionale di rappresentazione dei dati consiste nella distribuzione dei dati in tabelle composte da colonne. La colonna rappresenta quindi l'unit� minima di rappresentazione del singolo dato e la combinazione di pi� colonne in una tabella produce un singolo record rappresentativo.
Nel modello strutturato implementato in eXtraWay, l'oggetto che maggiormente si accomuna al record � l'unit� informativa. Essa � rappresentata da un elemento XML e da tutti gli elementi in esso contenuti (salvo nidificazione di unit� informative).
La scelta di quale insieme di elementi ed attributi, identificabili appunto dall'elemento che li delimita, � argomento della progettazione della base dati eXtraWay. Come accennato in precedenza, essa pu� essere pi� o meno complessa ed articolata. Qualora l'applicazione (e quindi il data base) sia stata progettata per essere principalmente utilizzato via SQL, la sua struttura sar� presumibilmente semplice e, conseguentemente, la mappatura tra tale rappresentazione ed il modello relazionale sar� diretta.
Le componenti di un'unit� informativa sono elementi ed attributi. Ad ognuno di essi viene associato un canale di ricerca che corrisponde, per sommi capi, ad una colonna nel modello relazionale. Ad ognuno di essi corrisponde, per altro, un percorso che identifica il canale di ricerca. In tale percorso gli elementi vengono rappresentati col loro nome mentre gli attributi vengono rappresentati con il nome preceduto dal carattere @.

Come sempre, un buon esempio vale pi� di mille parole. Partendo da un modello molto semplice procederemo per passi ad identificare modelli pi� complessi e quindi pi� vicini alla realt� di un'applicazione XML articolata.

Immaginiamo di creare un Data Base con una semplice tabella rubrica ed inserire in essa le colonne nome, cognome, indirizzo, cap, mansione e n_tel.

Senza che questo venga codificato per mezzo di search_alias (Vds. documentazione specifica sulla configurazione delle basi dati eXtraWay), la forma pi� semplice e diretta di rappresentazione di questo modello in XML sarebbe la seguente:

<rubrica>
   <nome>...</nome>
   <cognome>...</cognome>
   <indirizzo>...</indirizzo>
   <cap>...</cap>
   <mansione>...</mansione>
   <n_tel>...</n_tel>
</rubrica>

Se pure il nostro file nomearchivio.conf.xml non risultasse configurato per nessun canale di ricerca dell'unit� informativa nota come rubrica, dall'unit� informativa riconosciuta verrebbero comunque identificati percorsi di ricerca quali:

XML,/rubrica/nome
XML,/rubrica/cognome
XML,/rubrica/indirizzo
XML,/rubrica/cap
XML,/rubrica/mansione
XML,/rubrica/n_tel

Quindi, data la denominazione dell'unit� informativa rubrica, la mappatura con il nome della tabella corrispondente avviene direttamente. Altrettanto dicasi per i nomi dei canali che da essa derivano la cui mappatura con il nome delle colonne avviene altrettanto direttamente.
In questo panorama, esprimendo nell'espressione SQL una richiesta come la seguente...

select nome, cognome from rubrica where mansione='direttore'

...si intende estrarre dalle unit� informative rilevate da una ricerca, che altro non sono se non frammenti XML, le componenti /rubrica/nome e /rubrica/cognome dopo aver risolto la frase di ricerca in linguaggio nativo eXtraWay...

[XML,/rubrica/mansione]="direttore"

Provvediamo ora a complicare un po' le carte in tavola. Immaginiamo ora che il modello XML preveda che il nome ed il cognome non siano degli elementi contenuti in rubrica ma degli attributi dell'elemento rubrica stesso. Il formato XML cambia come segue...

<rubrica nome="..." cognome="...">
   <indirizzo>...</indirizzo>
   <cap>...</cap>
   <mansione>...</mansione>
   <n_tel>...</n_tel>
</rubrica>

...e per analogia i percorsi dei canali di ricerca subiscono la trasformazione seguente...

XML,/rubrica/@nome
XML,/rubrica/@cognome
XML,/rubrica/indirizzo
XML,/rubrica/cap
XML,/rubrica/mansione
XML,/rubrica/n_tel

A questo punto il legame tra il canale XML,/rubrica/ e la colonna nome non � pi� diretto come in precedenza e altrettanto dicasi per la colonna cognome. Perch� la mappatura abbia successo � necessario creare un opportuno alias di ricerca che consenta di ricollegare i due estremi: quello esprimibile con sintassi SQL e quello espresso dalla configurazione della Base Dati eXtraWay.

La configurazione degli alias di ricerca, nel file nomearchivio.conf.xml, ha il seguente aspetto...

<hw_fields>
   <search_alias search_name="rubrica.nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="rubrica.cognome" search_key="XML,/rubrica/@cognome/"/>
</hw_fields>

...ad indicare che il percorso che conduce ai due attributi viene riconosciuto al pari della dichiarazione relazionale per la colonna nome o cognome nella tabella rubrica. La stessa combinazione di alias di ricerca poteva essere espressa come...

<hw_fields>
   <search_alias search_name="nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="cognome" search_key="XML,/rubrica/@cognome/"/>
</hw_fields>

...senza l'indicazione dell'appartenenza alla tabella rubrica. Questa forma � valida se e solo se le colonne nome e cognome non sono presenti in alcun altra tabella

In sostanza, quindi, assumendo che nel modello relazionale ogni oggetto sia identificato dall'accoppiata tabella.colonna, la mappatura rispetta la seguente logica:

In presenza di un alias di ricerca che corrisponda esattamente a tabella.colonna esso rappresenta univocamente il legame di mappatura.
In assenza dell'alias esatto ma in presenza dell'alias che rappresenta la sola colonna esso rappresenta univocamente il legame di mappatura. In questo caso si pu� considerare intrinsecamente mappata la tabella con l'unit� informativa cui appartiene il canale mappato. Nel percorso del canale di ricerca l'unit� informativa � rappresentata sempre dal primo elemento espresso.
In assenza di un alias di ricerca conformato in uno dei due metodi precedenti si assume che si compia una mappatura diretta tra il nome della tabella ed il nome dell'unit� informativa cos� come tra il nome della colonna ed il nome dell'elemento presente nell'unit� informativa come nodo direttamente discendente dell'elemento radice della stessa.

Mentre alcune dichiarazioni possono quindi risultare omissibili, il fatto stesso che una struttura XML risulti articolata in diversi livelli di elementi (e non in una elencazione piatta di elementi nell'ambito dell'elemento radice) comporta l'obbligo di compilare doverosamente l'elenco degli alias di ricerca.
Mentre eXtraWay Server tollera, per il proprio linguaggio di ricerca la presenza di separatori, punti, spazi e caratteri speciali di varia natura nel nome dato all'alias di ricerca, quelli che vengono espressamente creati per la mappatura con il modello relazionale devono seguire semplici regole:

Non devono essere presenti spazi o altri caratteri di interpunzione. Non sono indicati neppure i caratteri speciali quali dollaro, chiocciola, lettere accentate ecc. ecc.
Non dev'essere presente il punto a meno che esso rappresenti espressamente la separazione, nel nome dell'alias di ricerca, tra il nome della tabella ed il nome della colonna. Se presente per tale scopo non pu� apparire pi� di una volta.
Non devono essere presenti caratteri che non siano lettere e cifre o, al pi� il carattere '_' (underscore). I nomi assegnati alle tabelle e delle colonne devono inziare con una lettera, maiuscola o minuscola.

Nulla impedisce che, per le esigenze delle applicazioni native eXtraWay siano presenti altri alias di ricerca non sfruttati in SQL, purch� non ambigui.

Qualora la stessa colonna appaia in tabelle diverse e si debba far ricorso agli alias di ricerca � opportuno creare un alias per ogni colonna dandole indicazione completa della tabella. E' ammissibile che uno (ed uno soltanto) degli alias non presenti la tabella (a patto che tutti gli altri la indichino) per evitare condizioni di indeterminazione.
In altri termini, se esistesse anche una tabella anagrafica ove sia presente il nome, il cognome e la matricola, con un modello XML pi� complesso, la dichiarazione degli alias potrebbe essere la seguente...

<hw_fields>
   <search_alias search_name="rubrica.nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="rubrica.cognome" search_key="XML,/rubrica/@cognome/"/>
   <search_alias search_name="anagrafica.nome"    search_key="XML,/anagrafica/dati_personali/@nome/"/>
   <search_alias search_name="anagrafica.cognome" search_key="XML,/anagrafica/dati_personali/@cognome/"/>
</hw_fields>

...cos� come potrebbe essere...

<hw_fields>
   <search_alias search_name="rubrica.nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="rubrica.cognome" search_key="XML,/rubrica/@cognome/"/>
   <search_alias search_name="nome"    search_key="XML,/anagrafica/dati_personali/@nome/"/>
   <search_alias search_name="cognome" search_key="XML,/anagrafica/dati_personali/@cognome/"/>
</hw_fields>

..o anche...

<hw_fields>
   <search_alias search_name="nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="cognome" search_key="XML,/rubrica/@cognome/"/>
   <search_alias search_name="anagrafica.nome"    search_key="XML,/anagrafica/dati_personali/@nome/"/>
   <search_alias search_name="anagrafica.cognome" search_key="XML,/anagrafica/dati_personali/@cognome/"/>
</hw_fields>

...ma non potrebbe assolutamente essere...

<hw_fields>
   <search_alias search_name="nome"    search_key="XML,/rubrica/@nome/"/>
   <search_alias search_name="cognome" search_key="XML,/rubrica/@cognome/"/>
   <search_alias search_name="nome"    search_key="XML,/anagrafica/dati_personali/@nome/"/>
   <search_alias search_name="cognome" search_key="XML,/anagrafica/dati_personali/@cognome/"/>
</hw_fields>

...in quanto la cosa sarebbe ambigua (e per altro non accettabile da eXtraWay).

Attenzione:: Si ricorda che � inopportuno che si indichino degli alias di ricerca che prevedano il solo nome della colonna specie se questi possono risultare ambigui con un nome di tabella.; Si ricorda che gli alias di ricerca, non essendo considerati normalmente in eXtraWay con distinzione del case, sono considerati case insensitive. Non possono quindi essere dichiarati due alias aventi lo stesso contenuto testuale e differente case ritenendoli canali distinti.

Una volta che, con o senza l'ausilio degli alias di ricerca, si � completata la mappatura tra tabelle e colonne e le corrispondenti unit� informative ed i canali di ricerca in esse identificati, si � pronti a compiere operazioni di varia natura.
Quanto detto sino ad ora non impedisce che si voglia concepire nel modello relazionale una colonna che non esiste, o per lo meno non esiste ancora, presso il modello strutturato in XML. Ovviamente, il tentativo di compiere ricerche avvalendosi di tale colonna � destinato al fallimento non rilevando presso la struttura del Data Base eXtraWay un corrispondente canale di ricerca. Per contro, le operazioni di inserimento, ad esempio, possono essere effettuate anche alimentando queste colonne. Esse verranno costituite come elementi (nodi figli) dell'elemento radice dell'unit� informativa. Una volta create presso la prima unit� informativa, il Server eXtraWay crea automaticamente un canale di ricerca anche per esse rendendo possibile compiere le selezioni.
Questo ci mostra come la mappatura sia assolutamente dinamica e dia un ampio grado di libert� a discapito di minori limitazioni. Sar� compito di chi progetta le applicazioni, basate sull'interfaccia nativa o su quella SQL, stabilire se e quali operazioni siano lecite e quindi quali interventi sulla struttura dei dati XML sia accettabile. Attualmente il server eXtraWay non � stato realizzato per imporre simili limitazioni ma non si esclude che ci� possa avvenire in seguito.

Parimenti, per l'uso corretto di un applicazione su entrambe i fronti, ovvero sia via SQL che per mezzo di un'applicazione eXtraWay � quanto mai importante che tutti gli estremi di configurazione vengano esplicitati in quanto sottintendere chiavi ed alias di ricerca pu� risolversi in un problema anche serio. Consulare, per maggior chiarezza, gli esempi di inserimento ed in particolare di modifica. (Vds. Esecuzione di operazioni di inserimento, modifica e cancellazione)

Ulteriori restrizioni

Una volta descritto come si compia la mappatura tra le unit� informative delle basi dati eXtraWay e le tabelle di un DB relazionale ed, in esse, tra canali di ricerca e corrispondenti colonne si devono prendere in esame alcune altre limitazioni.

In particolare un'unit� informativa non pu� essere denominata per mezzo di un elemento XML il cui nome inizi per una cifra. Questo � infatti contrario alle specifiche del'XML. Per convenzione, neppure le tabelle della mappatura SQL di una Base Dati eXtraWay possono essere identificate per mezzo di un nome che inizi per una cifra. Ne deriva che altrettanto deve potersi dire per i search alias adottati per rappresentare tabelle e colonne del Data Base.
A quanto detto va aggiunto che la sintassi SQL non prevede che il nome di una tabella possa contenere caratteri diversi da lettere, cifre ed il carattere '_' (underscore). La presenza di qualsiasi altro carattere comporta la necessit� di usare negli statement SQL un meccanismo di aliasing.

Dal momento che nelle espressioni SQL dovr� essere possibile indicare degli identificatori di selezioni precedenti per operare, in sostanza, dei raffinamenti di su esse, si avr� la necessit� di indicare il nome del file di selezione, la sola componente necessaria senza percorso o estensione. Essa, come avviene sin dall'origine dei programmi di 3D Informatica, � prefissata dalla cifra 3 e da 2 ulteriori caratteri che indicano la natura del file temporaneo e del suo contenuto. Ad esempio, i files aventi prefisso 3se sono comuni selezioni mentre il prefisso 3so identifica le selezioni sottoposte ad ordinamento.
Dal momento che, come detto, non � ammesso che una tabella sia denominata con un nome che inizia con una cifra, l'identificatore del file di selezione non pu� essere usato direttamente ma va racchiuso tra doppi apici.
Per analogia, una tabella che in eXtraWay fosse identificata da un nome che contenga un carattere non riconosciuto dal parser SQL dovrebbe a sua volta essere indicata tra doppi apici ed i canali ad essa associati dovrebbero essere identificabili tramite aliasing. In proposito su suggerisce di consultare la documentazione Sintassi SQL accettata da eXtraWay in materia di SELECT e nel dettaglio il paragrafo La Clausola FROM.

Di seguito, per convenzione, il server considerer� un file di selezione ogni tabella che viene identificata con un nome che inizia col carattere 3.

Date: 2007/03/01 09:13:17

Torna a Introduzione all'uso di SQL in eXtraWay