Il file di profilo nomearchivio.conf.xml

Autore:
Tirabassi Roberto

La redazione di questa documetazione non può avvenire, innanzitutto per ragioni di tempo, in modo globale e completo. Essa verrà inegrata con note inerenti le singole voci di configurazione man mano che esse vengono attivate nel server e man mano che si incontra la necessità di documentarle.
Questa documentazione è quindi in costante evoluzione.

under.GIF

Introduzione

il file .conf.xml contiene una serie di sezioni.
Per sezioni intendiamo diverse tipologie di informazioni raggruppate o meno ma tutte riconducibili allo stesso elemento identificativo.
Chi ha già dimestichezza con questo tipo di file saprà che il primo degli elementi in esso presenti è l'elemento primary_node che serve a indicare come riconosere un unità informativa, come distribuire sul file systeml i suoi files, come riconoscerne l'univocità ed ovviametne dettare le regole di composizione e le caratteristiche dei canali chiave che per questa unità informativa verranno realizzate.

Esistono poi altre sezioni inrenti l'uso dei thesaurus, degli alias di ricerca ed in fine una serie di configurazioni che hanno valore per l'intero archivio, quali ad esempio le regole di composizione dei titoli e così via.

Il presente documento ha l'intenzione di descrivere ciascuna parte e ciascuna voce di configurazione.

I valori booleani

Si ricorda che parte dei valori espressi va espresso in modo booleano. Tale valore può quindi considerarsi positivo o negativo.
I valori positivi ammessi sono i seguenti:

on, On, ON, y, Y, yes, Yes, YES, true, True, TRUE, si, Si, SI, 1, ok, Ok, OK

I valori negativi ammessi sono i seguenti:

off, Off, OFF, n, N, no, No, NO, false, False, FALSE, 0, nok, Nok, NOK

Elenco delle Sezioni del file nomarchivio. .xml

  1. Le voci di "primary_node"
  2. Le voci "profile"

Le voci di "primary_node"

La dichiarazione di una Primary Node consiste nella dichiarazione di un elemento il cui contenuto possa e debba essere riconosciuto come unità informativa, il cui contenuti sia un insieme omogeneo ed articolato di informazioni che descrivono tutte un singolo oggetto.
Il nodo primario (primary node o unità informativa) è a sua volta caratterizzato da una serie di specifiche dichiarazioni. Man mano che esse verranno trattate troveranno posto in questo capitolo.

  1. La regola di univocità: "unique_rule"

Le voci "profile"

La configurazione dell'intero archivio è affidata ad una serie di elementi profile aventi due attributi: type e value. Mentre il primo indica il tipo di configurazione che si intende impostare, il secondo ne indica il valore.

Di seguito l'elenco dei valori ammessi, il loro significato ed il valore di default assegnato.

  1. Configurazione d'Archivio
    1. codepage
    2. arc.allownonportable
    3. arc.datetimekeys
    4. arc.bestbtnodesize
    5. arc.flushdatasteps
    6. arc.flushidxsteps
    7. arc.buddyudd
    8. arc.attribfreeorder
    9. arc.repository
    10. arc.exclude_xreg_strong
  2. Titoli
    1. title
    2. title.hier
    3. title.separ
    4. cache.xslt
  3. Allegati
    1. attach.maxperdir
    2. attach.substext
    3. attach.skipext
    4. attach.aliasext
    5. attach.idhome
    6. attach.varhome
    7. attach.remove
  4. File Conversion Agent
    1. fca.updatePrint
    2. fca.updateChkin
  5. Separatori
    1. separs.default
    2. separs.erase
  6. Spell Checking
    1. spellchk.rule
  7. Costituzione Catalogo
    1. catalog.strict
  8. Interventi sulla selezione
    1. Estensioni
      1. extension.top
    2. Ordinamenti
      1. sort.defaultrule
      2. sort.defaultlimit
    3. Selezioni Probabilistiche
      1. probab.hitweight
      2. probab.ranksize
      3. probab.minranksize
      4. probab.minrank
      5. probab.similartuning
    4. Performance in selezione
      1. search.skipiw
      2. search.wildcardprefix
      3. search.similarprefix
  9. Registrazione dei Record
    1. Dimensionamento dello sfrido
      1. doctail.maxsize
      2. doctail.minsize
      3. doctail.maxperc
      4. doctail.growonsite
    2. Siglatura del documento
      1. fixity.signmode
  10. Relazioni
    1. rel.logicalid

arc.allownonportable

Abilitazione alla creazione di documenti i cui documenti e/o allegati sono espressi con percorsi assoluti.

arc.bestbtnodesize

Indica la dimensione da adottare per i nodi dei BTree. La misura è in Kb quindi 0 corrisponde alla misura di default ovvero il nodo standard di 512 bytes.

arc.datetimekeys

Richiede che nelle chiavi di servizio venga creata una coppia di chiavi concatenati una corrispondente alla combinazione della data ed ora di inserimento ed una con la data ed ora di modifica del documento.

arc.flushdatasteps

Indica il numero di volte in cui ignorare il flush dei dati (per compiere flush una volta ogni tanto). In sostanza indicando con n un valore diverso da 1, vengono compiute 'n-1' scritture senza svolgere il flush del file che viene svolto in corrispondenza dell'ennesima.

Default Value:
1

arc.flushidxsteps

Indica il numero di volte in cui ignorare il flush dei indici (per compiere flush una volta ogni tanto). In sostanza indicando con n un valore diverso da 1, vengono compiute 'n-1' scritture senza svolgere il flush del file che viene svolto in corrispondenza dell'ennesima.

Default Value:
1

arc.buddyudd

Indica se si desidera che il file UDD venga realizzato come file Buddy (valore di configurazione positivo) o come file a blocchi (valore di configurazione negativo). Il primo comporta uno spreco del 25% circa dello spazio realmente utile ma una crescita durante la vita utile dell'archivio contenuta al necessario mentre il secondo comporta una crescita costante nel tempo ma il consumo esatto dello spazio richiesto.
Il primo tipo di file si presta per archivi dinamici, il secondo per archivi statici o di sola consultazione.

Default Value:
valore positivo (Vds. I valori booleani).

arc.attribfreeorder

Indica che si desidera compiere un'indicizzazione di tutti gli attributi di un elemento assegnando loro la stessa iword di partenza, ovvero l'iword raggiunta prima di entrare nella lavorazione dell'elemento che contiene gli attributi. In questo modo l'ordine in cui vengono elencati gli attributi in un archivio sarebbe ininfluente, com'è presumibile che sia, riducendo l'impatto in modifica del documento. Perde qualcosa in quanto a funzionalità di hilight dei documenti, per altro scarsamente utilizzata, ma guadagna in performance.

Default Value:
valore negativo (Vds I valori booleani)
Nota:
In presenza di questo parametro il server ha un comportamento molto particolare in materia di adiacenza nei valori degli attributi multi valore. Per meglio comprendere tali comportamenti consultare Ricerca in adiacenza sugli attributi. Modalità di ricerca e comportamento del server eXtraWay

arc.repository

Indica quale repository alternativo utilizzare al posto del File System e dei files XML.
La sintassi del valore è una sorta di URN (Introduzione ai Repository Drivers) che indica a quale Data Base collegarsi e come si chiama il DB e la tabella richiesta.

Default Value:
Nessun valore ad indicare che si usa il repository XML standard.

arc.exclude_xreg_strong

Per alcuni archivi può essere non indispensabile la registrazione capillare degli eventi, specie se l'archivio non ha una netta accezione documentale.
In tal caso, e solo per un singolo archivio alla volta, è possibile disabilitare la stesura delle registrazioni del registro (tutte) e per farlo si può impostare il corretto valore di questa voce di profilo derivandono dal programma xwpasswd.

Attenzione:
La chiave di disabilitazione vale solo per la postazione per la quale essa è stata calcolata in quanto dipende dalla chiave di abilitazione della postazione stessa.

attach.aliasext

Al pari della precedente voce di configurazione, questa invece prevede l'elenco delle estensioni che il server può considerare alla stregua di files di tipo TXT. Di questi files, quindi, il server può tentare di compiere indicizzazione del contenuto.

attach.idhome

Directory nella quale vengono dislocati i nuovi allegati e nella quale cercare, per definizione, qualsiasi allegato.

attach.maxperdir

Numero massimo di allegati per directory. Si applicava in particolare per versioni del server precedenti la 18.0.0.* che distribuisce ora gli allegati in una diversa logica di directories. Applicato comunque per modificare il valore di default in applicazioni precedenti o che usino comunque allegati provenienti dal pregresso.

Default Value:
100

attach.skipext

Estensioni da ignorare e non sottoporre al tentativo di indicizzazione. Si contrappone al precedente elenco per consentire di inibire i tentativi di conversione ed indicizzazione di alcune estensioni.

attach.substext

Estensioni per le quali è concessa la sostituzione del file.
Una volta associato un file ad un codice di allegato esso dovrebbe rimanere invariato nel tempo. Per le sole estensioni indicate in questo elenco è invece ammessa la sosituzione ovvero il cambio del contenuto del file. L'elenco deve presentare le estensioni separate da uno spazio. Il punto in testa all'estensione è facoltativo.

attach.remove

Indica, se TRUE, che si richiede che il thread che compie la cancellazione automatica degli allegati proceda con la cancellazione per quest'archivio.

fca.updatePrint

Indica, ad uso e consumo del File Conversion Agent, che si richiede di impostare o meno l'impronta degli allegati nel documento che viene ritoccato.

Default Value:
true

fca.updateChkin

Indica, ad uso e consumo del File Conversion Agent, che si richiede di impostare o meno la marcatura temporale dell'intervento compiuto dall'Agent in corrispondenza della conversione di file effettuata.

Default Value:
true

attach.varhome

Directory nella quale vengono cercati tutti gli allegati che non fosse stato possibile identificare nella home di default.

catalog.strict

Aquisizione e riconoscimento dei soli nodi primari definiti.

codepage

Indicazione della code page alternativa a quella di default. Rappresentata da una sequenza di numeri decimali separati da virgola indica, se il valore è diverso da 0, quale sia il carattere o la sequenza di caratteri da sostituire al carattere standard. Per sequenze di caratteri i numeri decimali devono essere espressi separti tra loro da uno slash. La prima cifra della stringa corrisponde allo spazio (0x20) e così via fino al massimo alla mappatura del carattere 0xff.

doctail.growonsite

Indicazione che la modifica sul posto del documento non dev'essere effettuata se non c'è lo spazio necessario.

doctail.maxperc

Percentuale massima (rapportata alla dimensione del documento) della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.

doctail.maxsize

Dimensione massima della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.

doctail.minsize

Dimensione minima della coda "bianca" da aggiungere in salvataggio ai documenti per ridurre il rischio di spostamento in successive modifiche.

extension.top

Limite oltre il quale non compiere estensioni delle chaivi in modo parallelo.

fixity.signmode

Modalità di firma dei documenti

probab.hitweight

Indica quanta parcentuale del peso complessivo dato ad un unità informativa debba essere valutata sulla base del numero di termini selezionati e non sul peso ponderato della chiave coinvolta.

probab.minrank

Indica la percentuale di somiglianza minima, al di sotto della quale non tornare documenti.

probab.minranksize

Indica il numero minimo di unità informative da tornare.

probab.ranksize

Indica il numero massimo di unità informative da tornare.

probab.similartuning

Nella ricerca per documenti simili la scelta dei termini da utilizzare per la ricerca si basa su un determinato grado di selettività. Sopra tale soglia, ovvero se il termine è troppo poco selettivo, la parola viene scartata. Per evitare che siano scartate parole anche significative su un archivio ove i termini hanno particolare distribuzione, si può intervenire su questa voce di configurazione. Le parole accettate sono quelle che selezionano 1/<numero> documenti in archivio.

Default Value:
Default 100.

rel.logicalid

Indicazione di quale percorso XML identifica la componente univoca dei nodi primari così da poter compiere esportazione ed importazione di relazioni in forma logica.

search.similarprefix

La selezione può essere effettuata indicando la somiglianza tra termini ovvero selezionando termini che somiglino a quello impostato perché hanno caratteri in più, in meno o semplicemente diversi.L'abuso di questa modalità può condurre a selezioni eccessivamente complesse, solitamente frutto di un uso errato del sistema e quindi non realmente utili o significative.
Per tutelarsi dagli abusi o dall'uso inproprio delle somglianzein ricerca si può impostare questo valore che indica di quanti caratteri debba essere la radice, ovvero la parte iniziale comune a tutte le chiavi che non viene sottoposta al controllo di similitudine in modo da restringere sensibilmente il campo d'azione.

search.skipiw

Nel compiere le selezioni si richiede di produrre, per default, catene di riferimenti inerenti i documenti selezionati in cui le iwords vengono ignorate. Causa l'inversione del default usato solitamente dal server per velocizzare le selezioni.

search.wildcardprefix

La selezione può essere effettuata con l'uso di Wild Cards. L'abuso di questa modalità può condurre a selezioni eccessivamente complesse, solitamente frutto di un uso errato del sistema e quindi non realmente utili o significative.
Per tutelarsi dagli abusi o dall'uso inproprio delle Wild Cards in ricerca si può impostare questo valore che indica di quanti caratteri debba essere la radice priva di Wild Cards di una chiave perché la stessa possa considerarsi valida in questo tipo di ricerche.

separs.default

Separatori supplementari di default. Il valore previsto è una sequenza di numeri, separati da spazi che indicano il valore decimale del carattere da usare come separatore nel range tra 1 e 255. Per indicare intervalli di valori si può usare la forma

<numero iniziale>-<numero finale> 

e tutti i caratteri indicati, estremi compresi, saranno considerati separatori da aggiungere all'elenco di default.
I separatori di default, hardcoded nella libreria libxw, sono i seguenti

1-47 58-63 91-96 123-191 247 255 
A partire da:
23.0.0.*. Oltre ad aver introdotto nella libreria questi valori sono stati aggiunti i separatori 161 e 162 precedentemente considerati al pari dei caratteri.

separs.erase

Caratteri da non considerare separatori. Il valore previsto è una sequenza di numeri, separati da spazi che indicano il valore decimale del carattere da non usare come separatore nel range tra 1 e 255. Per indicare intervalli di valori si può usare la forma

<numero iniziale>-<numero finale> 

e tutti i caratteri indicati, estremi compresi, saranno considerati separatori da escludere dall'elenco di default più quelli aggiuntivi.

sort.defaultlimit

Limite oltre il quale non effettuare l'ordinamento richiesto

sort.defaultrule

Regola di ordinamento predefinita per l'archivio in corso

spellchk.rule

Regola di spellchecking delle unità documentarie.

title

Regola di composizione del titolo del nodo primario.

title.hier

Regola di composizione titoli alterntivi per le operazioni che interessano le relazioni tra nodi primari

title.separ

Separatore tra le istanze espresse in sequenza nei titoli

cache.xslt

Indicazione di quale sia il nome del file, assoluto o relativo alla directory degli archivi, per mezzo del quale convertire il documento Xml in un nuovo frammento Xml da usarsi per cache del documento, indici ordianmenti ed affini.

A partire da:
23.0.2.*
Date
2008/02/05 11:45:59

Back to Documentazione sulle voci dei files di profilo dell'ambiente eXtraWay Server e parametri su command line.


HighWay/eXtraWay Project - Frequently Asked Questions (Doxygen 1.6.1)