Linee guida per l'esecuzione dei backup.

Autore:
Tirabassi Roberto

Introduzione

L'esecuzione di un backup valido e fruibile è uno degli aspetti cardine della salvaguardia dei dati di qualsiasi applicazione. eXtraWay, ovviamente, non fa eccezzione in tal senso.

Le applicazioni eXtraWay vanno viste sotto due aspetti:

Questa documentazione si prefigge di descrivere solo i primi due punti esposti, indicando come sia opportuno operare per grantirsi di compiere backup corretti e completi.

Prima di scendere nel dettaglio di come vada compiuto il backup di un archivio vale la pena ricordare come vengono normalmente distribuiti i files delle installazioni eXtraWay.

Esiste una directory principale che è quella dove vengono posizionati gli eseguibili. Essa è l'unica per la quale non è indicato un nome obbligatorio ma solitamente assume il nome bin o prg.
Parallelamente ad essa appaiono una serie di altre directory che sono (in grasetto quelle sempre presenti):

Nota:
Per essere certi che il backup che viene fatto è pienamente affidabile, oltre a definirne i contenuti sulla base dei restanti capitoli, è necessario che il modulo eXtraWay Server sia inattivo in modo da garantirsi che non ci siano disallineamenti tra i files salvati.
Esiste una modalità di Backup a caldo che non viene attualmente trattata in questo documento.

Il Backup dell'archivio e dell'ambiente server.

Per Backup dell'archivio possiamo intendere quindi la salvaguardia di tutto quello che serve per poter fruire dell'archivio integralmente ma anche quanto necessario per fare operazioni di ripristino o recupero del pregresso.

Abbiamo quindi delle informazioni specifiche del singolo archivio ed altre che si applicano, invece, a tutti gli archivi gestiti da questa particolare installazione del server.

Le informazioni indipendenti dall'archivo

Le informazioni legate all'archivio ma da esso, in qualche modo, indipendenti possono essere viste secondo il seguente schema:

  1. Tutti i files presenti nella directory collect se l'archivio del quale si intende fare un backup prevede l'uso di raccolte. Questo perché è indisinguibile, dal solo nome della raccolta, a quale archivio essa faccia riferimento. Solo accedendo al contenuto di tali files è possibile conoscere se essi sono pertineti, o meno, l'archivio che ci si accinge a salvaguardare.
  2. Il file xw.ini dalla directory conf. Tale file va salvaguardato perché in esso, sino a variazione che è in corso di sviluppo, sono indicate informazioni sui separatori utilizzati in indicizzazione che valgono per tutti gli archivi ma al variare delle quali gli indici realizzati per un determinato archivio potrebbero risultare non corretti.
    Anche i files con estensione .stp vanno salvaguardati in quanto usati dalle applicazioni come Stop List in fase di ricerca. Dal momento che non hanno un reale impatto sui contenuti degli archivi e che possono cambiare nel tempo senza modificare il comportamento del server (sono meri correttori del comportamento in ricerca) il loro salvataggio non è indispensabile, solo suggerito.
    In generale, comunque, è buona norma tenere traccia di tutti i files di questa directory perché è grazie ad essi viene regolata la vita e l'utilizzo di tutte le componenti che concorrono alle attività che possono interessare l'archivio. Ad esempio il file xwwd.conf.xml indica, per ogni archivio, se le procedure di acuisizione documenti debbano prevedere la modalità update o meno, il file xwgl.conf.xml regola l'avviamento e lo spegnimento di servizi a corredo del server come il File Conversion Agent che consente, unitamente ad un altro servizio, l'indicizzazione dei contenuti testuali degli allegati congiuntamente al documento.
  3. Il contenuto della directory context in quanto descrivono lo stato della struttura organizzativa che gestisce i dati degli archivi.
  4. I files xreg<annomese>.log dalla directory logs. Questi files contengono la storia dettagliata di tutte le operazioni compiute su ogni archivio e consentono, nel tempo, di ricostruire lo stato di qualsiasi documento in ogni sua precedente forma, sino a risalire alla sua forma originaria.
    L'iportanza della tutela di questi files è evidente al di là della decisione di compiere backup di un singolo archivio.

I files dell'archivio

Come annunciato precedentemente, la directory db è quella candidata solitamente a contenere i singoli archivi o insiemi organizzati di archivi.
In realtà nulla vieta che gli archivi vengano dislocati altrove quindi, per sapere esattamente in quale punto l'archivio debba essere cercato, è buona norma consultare il file xw.ini, dalla directory conf, nella sua sezione [Archivi]. In essa può essere presente una voce corrispondente al nome logico assegnato all'archivio di nostro interesse e ad essa sarà associato il percorso del file .stat.xml dell'archivio in esame così da poter identificare dove esso si trovi.
In assenza di questa dichiarazione, il percorso dato all'archivio, partendo dal suo nome logico è:

<Directory di insallazione programmi>/db/<nome logico archivio>/<nome logico archivio>.stat.xml 

Una volta indentificato dove si trova l'archivio ci si deve predisporre a compiere un backup di tutta la directory che lo contiene seguendo le regole ed accorgimenti seguenti.

  1. Esistono archivi che vivono nell'ambito di realtà applicative più ampie e complesse e per i quali un backup ha senso se esso viene svolto comprendendo tutti gli archivi coinvolti. In tal caso quanto detto in questo documento va necessariamente preso in considerazione per ogni archivio ed il backup è completo e significativo se compiuto come unico salvataggio di tutti gli archivi identificati.
  2. Esistono esclusioni ed inclusioni all'elenco di files che può essere salvato partendo dalla directory. Prima di predisporre un elenco vale la pena di verificare questi aspetti.

Files che possono essere ignorati

La realizzazione di un backup d'archivio può prevedere le seguenti esclusioni:

  1. In presenza di una directory <nomearchivio>.chk il suo contenuto può essere ignorato. Questi files sono registrazioni temporanee che il server utilizza per sapere quali documenti siano stati impegnati dai vari utenti.
    Questi files possono essere integralmente ignorati.
  2. Gli archivi che prevedono degli allegati possiedono, normalmente, una directory <nomearchivio>.file. Essa contiene dei files ed altre directory.
    I files presenti direttamente in tale directory sono considerati in parcheggio, quindi in attesa di essere assegnati ad un documento ma non ancora riportati in alcuno di essi. Questi files possono essere ignorati ed anzi possono essere rimossi specie se vetusti. Può essere buona norma mantenere in essere quelli più recenti perché potenzialmente in attesa di essere assegnati a qualche documento ancora in fase di salvataggio.
    Ogni altro file contenuto nelle directory presenti in quella indicata devono appartenere al backup.

Files che devono essere aggiunti

La ricerca dei files che possono, anzi devono essere aggiunti al backup è un po' più delicata, particolare, ma è presto detta.

  1. Un archivio può avvalersi di uno o più Thesaurus di termini in relazione tra loro. Solitamente questo file viene denominato <nomearchivio>.ths o <nomearchivio>.thv ma non è infrequente che il file venga condiviso con altre applicazioni e quindi trovi posto in una posizione diversa. Il file <nomearchivio>.conf.xml ci mostra dove si trovi tale file.
    L'esempio che segue mostra un file .ths collocato nella directory a monte di quella che contiene l'archivio. Anche questo file dovrà far parte del backup.
       <thesaurus>
          <th_file th_filename="../common.ths" th_type="ths">
          ...
       </thesaurus>
    
  2. Un archivio può aver bisogno di un'estensione rappresentata da una libreria dinamica alla quale richiedere l'esecuzione di speciali operazioni in alcuni momenti della vita utile dell'archivio. Se è vero che solitamente questa libreria si trova assieme all'archivio, in alcune altre occasioni, specie se usata da più archivi, essa trova posto in altra directory.
    L'esempio che segue mostra un file di configurazione che indica una libreria dinamica dislocata in una directory parallela a quella dell'archivio.
       <addon_so path="../bin/nif32"
              cat_init="nifAllocEK"
              cat_add="nifAddEK"
              cat_get="nifGetEK"
              cat_end="nifFreeEK"
              load_doc_filter="nifLoadDoc"
              search_translator="nifSearchTranslator"/>
    
    Nota:
    In questi casi gli eventuali files a corredo della libreria dinamica (files di configurazione e simili) si trovano tutti nella stessa directory della libreria. Essi vanno quindi inclusi nel backup ma in casi simili può essere buona norma richiedere a 3D indicazioni di dettaglio per quella specifica libreria dinamica.
  3. Un archivio può essere progettato per avere tutti gli XML che compongono i suoi dati in una unica directory (solitamente quella che si trova nella directory che contiene l'archivio e che ne porta lo stesso nome). In tal caso si è ragionevolmente certi che il backup della directory dell'archivio, ed ovviamente di tutte le subdirectories, comprende automaticamente tutti i dati.
    Se però l'archivio in esame non ha questa caratteristica perché è stato creato componendo il catalogo con files dispersi sul disco in altre posizioni oppure si ha un qualche regionevole dubbio che almeno un file non sia nella posizione canonica, è opportuno fare una verifica per mezzo del Viewer. Essa può essere eseguita accedendo alla ricerca sull'archivio e consultando il vocabolario del canale di ricerca noto come
    UD,/xw/FileId/@FileName 
    . Questo vocabolario, solitamente, contiene dei percorsi di files che sono relativi alla directory descritta precedentemente, quindi tutti percorsi che devono iniziare senza uno dei caratteri '/' o '\' anche se preceduti da uno o più punti. In altre parole, valutando il contenuto di questo vocabolario di dovrebbe comprendere se ci sono files che non rispettano la distribuzione standard ed includere le directory così identificate nel backup.
  4. Quando detto per il files XML che componogo l'archivio può, puà sovente, applicarsi agli allegati. Essi si trovano nelle directory dell'archivio secondo una distribuzione articolata che varia al variare della versione del server ma possono trovarsi anche altrove. Identificare tutte le possibilità richiede due verifiche.
    La prima verifica va fatta sul contenuto del vocabolario del canale
    XML,//<nome_primary_node>//xw:file/@name 
    che dev'essere alimentato con semplici id di allegato o con percorsi relativi o assoluti. La radice dei percorsi relativi è la directory <nomearchivio>.file contenuta in quella che contiene gli archivi quindi, se i percorsi relativi sono espressi con prefisso './' essi possono essere ignorati. Vanno quindi identificate tutte le directory non comprese in quelle dell'archivio prendendo in esame i percorsi relativi ed ancor più i percorsi assoluti.
    La seconda verifica consiste nel nel verificare se esistono directory alternative ove cercare gli allegati. Esse vanno ricercate nel file di configurazione. La questione è di una certa complessità ed ha subito modifiche nel corso del tempo per cui si suggerisce di prendere visione del documento Trattamento degli Allegati che descrive nel dettaglio come possono essere distribuiti gli allegati di un archivio e come identificare di conseguenza le directory che può essere necessario comprendere nell'elenco dei files di cui fare backup.
Date
2007/01/30 12:13:07

Back to Indice delle voci


HighWay/eXtraWay Project - Frequently Asked Questions (Doxygen 1.6.1)