La redazione di questa documetazione non può avvenire, innanzitutto per ragioni di tempo, in modo globale e completo. Essa verrà inegrata con note inerenti le singole voci di configurazione man mano che esse vengono attivate nel server e man mano che si incontra la necessità di documentarle.
Questa documentazione è quindi in costante evoluzione.
il file .conf.xml contiene una serie di sezioni.
Per sezioni intendiamo diverse tipologie di informazioni raggruppate o meno ma tutte riconducibili allo stesso elemento identificativo.
Chi ha già dimestichezza con questo tipo di file saprà che il primo degli elementi in esso presenti è l'elemento primary_node che serve a indicare come riconosere un unità informativa, come distribuire sul file systeml i suoi files, come riconoscerne l'univocità ed ovviametne dettare le regole di composizione e le caratteristiche dei canali chiave che per questa unità informativa verranno realizzate.
Esistono poi altre sezioni inrenti l'uso dei thesaurus, degli alias di ricerca ed in fine una serie di configurazioni che hanno valore per l'intero archivio, quali ad esempio le regole di composizione dei titoli e così via.
Il presente documento ha l'intenzione di descrivere ciascuna parte e ciascuna voce di configurazione.
Si ricorda che parte dei valori espressi va espresso in modo booleano. Tale valore può quindi considerarsi positivo o negativo.
I valori positivi ammessi sono i seguenti:
on, On, ON, y, Y, yes, Yes, YES, true, True, TRUE, si, Si, SI, 1, ok, Ok, OK
I valori negativi ammessi sono i seguenti:
off, Off, OFF, n, N, no, No, NO, false, False, FALSE, 0, nok, Nok, NOK
Elenco delle Sezioni del file nomarchivio. .xml
La dichiarazione di una Primary Node consiste nella dichiarazione di un elemento il cui contenuto possa e debba essere riconosciuto come unità informativa, il cui contenuti sia un insieme omogeneo ed articolato di informazioni che descrivono tutte un singolo oggetto.
Il nodo primario (primary node o unità informativa) è a sua volta caratterizzato da una serie di specifiche dichiarazioni. Man mano che esse verranno trattate troveranno posto in questo capitolo.
La configurazione dell'intero archivio è affidata ad una serie di elementi profile aventi due attributi: type e value. Mentre il primo indica il tipo di configurazione che si intende impostare, il secondo ne indica il valore.
Di seguito l'elenco dei valori ammessi, il loro significato ed il valore di default assegnato.
Abilitazione alla creazione di documenti i cui documenti e/o allegati sono espressi con percorsi assoluti.
Indica la dimensione da adottare per i nodi dei BTree. La misura è in Kb quindi 0 corrisponde alla misura di default ovvero il nodo standard di 512 bytes.
Richiede che nelle chiavi di servizio venga creata una coppia di chiavi concatenati una corrispondente alla combinazione della data ed ora di inserimento ed una con la data ed ora di modifica del documento.
Indica il numero di volte in cui ignorare il flush dei dati (per compiere flush una volta ogni tanto). In sostanza indicando con n un valore diverso da 1, vengono compiute 'n-1' scritture senza svolgere il flush del file che viene svolto in corrispondenza dell'ennesima.
Indica il numero di volte in cui ignorare il flush dei indici (per compiere flush una volta ogni tanto). In sostanza indicando con n un valore diverso da 1, vengono compiute 'n-1' scritture senza svolgere il flush del file che viene svolto in corrispondenza dell'ennesima.
Indica se si desidera che il file UDD venga realizzato come file Buddy (valore di configurazione positivo) o come file a blocchi (valore di configurazione negativo). Il primo comporta uno spreco del 25% circa dello spazio realmente utile ma una crescita durante la vita utile dell'archivio contenuta al necessario mentre il secondo comporta una crescita costante nel tempo ma il consumo esatto dello spazio richiesto.
Il primo tipo di file si presta per archivi dinamici, il secondo per archivi statici o di sola consultazione.
Indica che si desidera compiere un'indicizzazione di tutti gli attributi di un elemento assegnando loro la stessa iword di partenza, ovvero l'iword raggiunta prima di entrare nella lavorazione dell'elemento che contiene gli attributi. In questo modo l'ordine in cui vengono elencati gli attributi in un archivio sarebbe ininfluente, com'è presumibile che sia, riducendo l'impatto in modifica del documento. Perde qualcosa in quanto a funzionalità di hilight dei documenti, per altro scarsamente utilizzata, ma guadagna in performance.
Indica quale repository alternativo utilizzare al posto del File System e dei files XML.
La sintassi del valore è una sorta di URN (Introduzione ai Repository Drivers) che indica a quale Data Base collegarsi e come si chiama il DB e la tabella richiesta.
Per alcuni archivi può essere non indispensabile la registrazione capillare degli eventi, specie se l'archivio non ha una netta accezione documentale.
In tal caso, e solo per un singolo archivio alla volta, è possibile disabilitare la stesura delle registrazioni del registro (tutte) e per farlo si può impostare il corretto valore di questa voce di profilo derivandono dal programma xwpasswd.
Al pari della precedente voce di configurazione, questa invece prevede l'elenco delle estensioni che il server può considerare alla stregua di files di tipo TXT
. Di questi files, quindi, il server può tentare di compiere indicizzazione del contenuto.
Directory nella quale vengono dislocati i nuovi allegati e nella quale cercare, per definizione, qualsiasi allegato.
Numero massimo di allegati per directory. Si applicava in particolare per versioni del server precedenti la 18.0.0.* che distribuisce ora gli allegati in una diversa logica di directories. Applicato comunque per modificare il valore di default in applicazioni precedenti o che usino comunque allegati provenienti dal pregresso.
Estensioni da ignorare e non sottoporre al tentativo di indicizzazione. Si contrappone al precedente elenco per consentire di inibire i tentativi di conversione ed indicizzazione di alcune estensioni.
Estensioni per le quali è concessa la sostituzione del file.
Una volta associato un file ad un codice di allegato esso dovrebbe rimanere invariato nel tempo. Per le sole estensioni indicate in questo elenco è invece ammessa la sosituzione ovvero il cambio del contenuto del file. L'elenco deve presentare le estensioni separate da uno spazio. Il punto in testa all'estensione è facoltativo.
Indica, se TRUE, che si richiede che il thread che compie la cancellazione automatica degli allegati proceda con la cancellazione per quest'archivio.
Indica, ad uso e consumo del File Conversion Agent, che si richiede di impostare o meno l'impronta degli allegati nel documento che viene ritoccato.
Indica, ad uso e consumo del File Conversion Agent, che si richiede di impostare o meno la marcatura temporale dell'intervento compiuto dall'Agent in corrispondenza della conversione di file effettuata.
Directory nella quale vengono cercati tutti gli allegati che non fosse stato possibile identificare nella home di default.
Aquisizione e riconoscimento dei soli nodi primari definiti.
Indicazione della code page alternativa a quella di default. Rappresentata da una sequenza di numeri decimali separati da virgola indica, se il valore è diverso da 0, quale sia il carattere o la sequenza di caratteri da sostituire al carattere standard. Per sequenze di caratteri i numeri decimali devono essere espressi separti tra loro da uno slash. La prima cifra della stringa corrisponde allo spazio (0x20) e così via fino al massimo alla mappatura del carattere 0xff.
Indicazione che la modifica sul posto del documento non dev'essere effettuata se non c'è lo spazio necessario.
Percentuale massima (rapportata alla dimensione del documento) della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.
Dimensione massima della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.
Dimensione minima della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.
Limite oltre il quale non compiere estensioni delle chaivi in modo parallelo.
Modalità di firma dei documenti
Indica quanta parcentuale del peso complessivo dato ad un unità informativa debba essere valutata sulla base del numero di termini selezionati e non sul peso ponderato della chiave coinvolta.
Indica la percentuale di somiglianza minima, al di sotto della quale non tornare documenti.
Indica il numero minimo di unità informative da tornare.
Indica il numero massimo di unità informative da tornare.
Nella ricerca per documenti simili la scelta dei termini da utilizzare per la ricerca si basa su un determinato grado di selettività. Sopra tale soglia, ovvero se il termine è troppo poco selettivo, la parola viene scartata. Per evitare che siano scartate parole anche significative su un archivio ove i termini hanno particolare distribuzione, si può intervenire su questa voce di configurazione. Le parole accettate sono quelle che selezionano 1/<numero> documenti in archivio.
Indicazione di quale percorso XML identifica la componente univoca dei nodi primari così da poter compiere esportazione ed importazione di relazioni in forma logica.
La selezione può essere effettuata indicando la somiglianza tra termini ovvero selezionando termini che somiglino a quello impostato perché hanno caratteri in più, in meno o semplicemente diversi.L'abuso di questa modalità può condurre a selezioni eccessivamente complesse, solitamente frutto di un uso errato del sistema e quindi non realmente utili o significative.
Per tutelarsi dagli abusi o dall'uso inproprio delle somglianzein ricerca si può impostare questo valore che indica di quanti caratteri debba essere la radice, ovvero la parte iniziale comune a tutte le chiavi che non viene sottoposta al controllo di similitudine in modo da restringere sensibilmente il campo d'azione.
Nel compiere le selezioni si richiede di produrre, per default, catene di riferimenti inerenti i documenti selezionati in cui le iwords vengono ignorate. Causa l'inversione del default usato solitamente dal server per velocizzare le selezioni.
La selezione può essere effettuata con l'uso di Wild Cards. L'abuso di questa modalità può condurre a selezioni eccessivamente complesse, solitamente frutto di un uso errato del sistema e quindi non realmente utili o significative.
Per tutelarsi dagli abusi o dall'uso inproprio delle Wild Cards in ricerca si può impostare questo valore che indica di quanti caratteri debba essere la radice priva di Wild Cards di una chiave perché la stessa possa considerarsi valida in questo tipo di ricerche.
Separatori supplementari di default. Il valore previsto è una sequenza di numeri, separati da spazi che indicano il valore decimale del carattere da usare come separatore nel range tra 1 e 255. Per indicare intervalli di valori si può usare la forma
<numero iniziale>-<numero finale>
e tutti i caratteri indicati, estremi compresi, saranno considerati separatori da aggiungere all'elenco di default.
I separatori di default, hardcoded nella libreria libxw, sono i seguenti
1-47 58-63 91-96 123-191 247 255
Caratteri da non considerare separatori. Il valore previsto è una sequenza di numeri, separati da spazi che indicano il valore decimale del carattere da non usare come separatore nel range tra 1 e 255. Per indicare intervalli di valori si può usare la forma
<numero iniziale>-<numero finale>
e tutti i caratteri indicati, estremi compresi, saranno considerati separatori da escludere dall'elenco di default più quelli aggiuntivi.
Limite oltre il quale non effettuare l'ordinamento richiesto
Regola di ordinamento predefinita per l'archivio in corso
Regola di spellchecking delle unità documentarie.
Regola di composizione del titolo del nodo primario.
Regola di composizione titoli alterntivi per le operazioni che interessano le relazioni tra nodi primari
Separatore tra le istanze espresse in sequenza nei titoli
Indicazione di quale sia il nome del file, assoluto o relativo alla directory degli archivi, per mezzo del quale convertire il documento Xml in un nuovo frammento Xml da usarsi per cache del documento, indici ordianmenti ed affini.