Sommario


Il file Excel input-forms.xls

Il file Excel input-forms.xls viene utilizzato per produrre file di configurazione XML per il software IRIS tramite strumenti automatici.

La descrizione del set di pagine mediante le quali i ricercatori inseriscono i metadati relativi al prodotto della ricerca è chiamata “form” (benché di fatto sia un insieme di form, nel significato HTML del termine). Un form è identificato da un unico nome simbolico (ad esempio, nel nostro caso, Articolo in rivista, Contributo in volume, e così via), ma nella struttura XML esso si divide in una serie di “pagine”, ciascuna della quali rappresenta una precisa pagina web per la raccolta dei metadati. A sua volta, l’elemento pagina contiene una sequenza di elementi “campo”, ciascuno dei quali definisce una finestra dialogo interattivo (un’area di testo, una data, una tendina di valori fissi, eccetera) con cui il ricercatore inserisce ogni metadato di tipo Dublin Core.

Per customizzare le pagine di inserimento dati, l’istituzione che installa IRIS deve esplicitare tutte le proprie scelte mediante un file avente struttura predeterminata, appunto il file input-forms.xls.

IRIS può contenere più di una versione di input-form e ogni versione può essere attiva o inattiva. Lo stato della singola input form è gestibile dalla funzionalità di Attivazione input form che si può trovare seguendo questo percorso nei menu:

Configurazione > Prodotti > Attivazione input-form

Le nuove submission utilizzano sempre la versione attiva più recente di una submission (NB: se una submission viene interrotta e ripresa successivamente, potrebbe accadere che nel tempo intercorso sia stata caricata una nuova versione dell'input form).

Se la versione dell' input form con cui è stato creato il prodotto è ancora attiva, si continuerà a far riferimento a quella versione per la descrizione del prodotto, ma se invece quella versione è stata disattivata allora il sistema aggiornerà il prodotto alla nuova versione segnalando gli eventuali metadati non più utilizzabili e dando la possibilità di cambiare tipologia di prodotto prima della conversione (utile nei casi in cui una nuova versione di input form sia stata introdotta dopo aver "spezzato" una input form preesistente in più sotto-tipologie).

Le tre opzioni presenti al caricamento (dal menu a sinistra: Configurazione > Prodotti > Caricamento input form):

  1. attiva la nuova versione caricata e disattiva le precedenti
  2. non attivare la nuova versione

consentono quindi di gestire i possibili scenari complessivamente per tutte le input form che si caricano via Excel senza dover poi utilizzare singolarmente la funzionalità di attivazione/disattivazione.

L'opzione 3 di non attivare la input form è prevista principalmente per futuri sviluppi: si vuole infatti rendere possibile in una futura versione il test delle nuove input form agli amministratori prima della loro attivazione. Al momento potrebbe essere utilizzata per caricare nel sistema una nuova input form e condividerla con i colleghi tramite la piattaforma, oppure valutare tramite le funzionalità di check (Prodotti > Tools di manutenzione > Check ...) l'impatto che avrebbe sul pregresso.

Guida alla compilazione del file Excel

Al fine della corretta generazione dei file di configurazione, e per ridurre i tempi di messa in servizio di richieste di modifiche a queste configurazioni, devono essere seguite le seguenti indicazioni:

Il form-definition descrive i template di submission/validazione disponibili per il sistema. Ciascun template definisce i metadati per una specifica tipologia di documento (es. articolo su rivista, intervento a convegno, contributo in libro, monografia, ecc.).

Le uniche celle da utilizzare rientrano nelle colonne A:K.

Tutte le informazioni devono essere inserite sequenzialmente nell’ordine corretto, NON devono essere presenti righe vuote. Ogni template va configurato interamente prima di passare alla definizione di un nuovo template. I metadati vanno inseriti nell’ordine in cui si desidera che siano presentati all’utente nelle pagine di inserimento/validazione, rispettando l’ordine di paginazione.

La colonna A (form_name) contiene il nome del template. Deve essere mantenuto costante per tutta la definizione del template. Le richieste di utilizzo di un determinato template per una specifica collezione devono far riferimento a tale nome.

La colonna B (page) contiene il numero di pagina in cui il metadato sarà richiesto. I numeri di pagina devono essere inseriti sequenzialmente senza salti a partire dal valore 1.

La colonna C (element) contiene l’element Dublin Core del metadato. Si richiede l’utilizzo di metadati in accordo a quanto definito dallo standard: http://dublincore.org. Una guida in lingua italiana è disponibile all'indirizzo: http://www.aepic.it/dublincore.php. NON è possibile utilizzare i caratteri _ (underscore) e . (punto).

La colonna D (qualifier) contiene il qualifier Dublin Core del metadato, se necessario. Oltre a qualifier "standard" possono essere definiti qualifier "custom" (personalizzati). Si consiglia di mantenere il più possibile quelli proposti per non incorrere in costi di personalizzazione delle procedure che vi fanno riferimento (ad es. la generazione automatica di citazioni). NON è possibile utilizzare i caratteri _ (underscore) e . (punto).

La colonna E (input-type) definisce la modalità di immissione per il metadato. I valori ammessi sono:

La colonna F (list name) deve essere valorizzata solo se come modalità di immissione (colonna E) si è scelta una delle seguenti: dropdown, list, qualdrop_value o qualdrop_text, nei quali casi occorre inserire il nome assegnato al set di valori ammessi nel foglio form-value-pairs.

La colonna G (repeatable) contiene un valore True/False ad indicare la ripetibilità o meno del metadato.

La colonna H (scope) contiene l’ambito di utilizzo del metadato. I possibili valori sono:

La colonna I (label) contiene la label mostrata all’utente nei form di submission/validazione dei metadati. Se il metadato è definito obbligatorio il sistema inserirà automaticamente un * prima della label specificata. Se il metadato è definito in colonna E come default_value, il contenuto di questa colonna verrà utilizzato per la valorizzazione del metadato. Inserendo il testo fra due segnaposto @@ si potrà indicare la generazione tramite uno degli algoritmi disponibili (ad esempio, per il metadato dc.identifier.citation, si deve compilare la label come ‘@@citation@@’).

Il valore di questo campo non viene utilizzato come label nella scheda breve di presentazione dell’item. Per la definizione di tale label occorre agire sulle configurazioni e utilizzare la funzionalità di gestione dell’i18n.

La colonna J (required) contiene il messaggio di errore da mostrare in caso di mancata valorizzazione del metadato. La cella vuota implica la non obbligatorietà del campo.

La colonna K (hint) contiene una mini guida per la compilazione del metadato che sarà mostrata all’utente subito sopra la box di immissione del metadato stesso. Può contenere tag HTML.

 

Attenzione nel caso l'ambito di utilizzo venga limitato non è possibile definire il campo come obbligatorio

 


Il foglio Form-value-pairs

Nel foglio Form-value-pairs vengono descritti i set di valori disponibili per i metadati con modalità di immissione dropdown, list, qualdrop_value o controlled_name (si veda Colonna E). Le colonne devono essere valorizzate da sinistra verso destra senza lasciare colonne vuote.

Ogni set di valori occupa due colonne adiacenti: nella prima cella della prima colonna (ad esempio A:1) viene definito il nome del set di dati (si veda Colonna F), nella prima cella della seconda colonna (ad esempio B:1) andrebbe  riportato il qualifier del primo metadato che utilizza tale set.

A partire dalla seconda riga vengono quindi inseriti i valori ammissibili inserendo nella prima colonna (ad esempio A:2) il valore visualizzato dall’utente e nella seconda colonna (ad esempio B:2) il valore che sarà effettivamente salvato nel database  in caso di selezione di tale opzione.

L’assenza di valore in una data riga per entrambe le colonne che definiscono il set determinano la fine dei valori ammissibili per quel dato set. Non vanno quindi lasciate “righe vuote” all’interno della definizione di un set.

Tutti i valori utilizzati per il salvataggio sul database (seconda colonna) devono essere univoci nella relativa lista. Inserire voci duplicate anche se in posizioni differenti nella stessa colonna NON è consentito.


Definizione delle tipologie di file

Nel foglio value-pairs è anche possibile definire la la lista delle tipologie di file accettabili (dataset, preprint, versione editore, etc.) a tal fine è necessario definire una lista denominata

type_file (applicata come default a tutti i template)

con la possibilità di specificare una lista differente per un dato template definendo una lista denominata

type_file_<alias template> (ad esempio type_file_Articolo su rivista / type_file_thesis).

In caso di assenza di una configurazione specifica per il template in uso e della configurazione relativa alla lista di default il metadato "type" relativo al singolo file non sarà richiesto in fase di upload.

Altre configurazioni: scheda breve e scheda completa

Per la definizione di quali metadati mostrare nella scheda breve e scheda completa dell’item occorre accedere alla UI di configurazione tramite il menu di sinistra:

Configurazione > Prodotti > Layout schede

e definire, per ogni tipologia di scheda prodotto, gli attributi della scheda breve (o completa).

N.B.: è possibile modificare l’ordinamento dei campi scelti (quelli per cui è stata selezionata la checkbox “Mostra”) tramite drag&drop, come nella figura qui sotto.



Le etichette mostrate in visualizzazione della scheda dell'item sono modificabili utilizzando la funzionalità di gestione dell'internazionalizzazione/etichette . In particolare le chiavi avranno la forma

metadata.<schema>,<element>[.<qualifier>]

ad esempio quindi metadata.dc.title per il Titolo.

È anche possibile personalizzare una label quando relativa ad una specifica input form utilizzando la chiave

metadata.<style>.<schema>,<element>[.<qualifier>]

dove style segue la seguente sintassi simple|full.<ID della tipologia di inputform>.

Funzionamento "edit batch" dei metadati DSpace (operazioni massive)

La funzione Operazioni Massive fa parte del pacchetto di DSpace ed è uno strumento batch di modifica dei metadati. E’ accessibile in visione completa, andando in Prodotti, Tool di manutenzione.

Utilizzo

L’utilizzo di questo tool avviene in 3 fasi

-       Scarico metadati in formato CSV

-       Modifica dei metadati

-       Caricamento file CSV

ATTENZIONE


Scarico metadati in formato CSV

Il tool operazioni Massive funziona utilizzando file CSV. I file CSV (comma-separated values) sono file di testo in formato tabellare. In essi ogni linea di testo rappresenta una riga della tabella. I valori presenti in ciascuna riga sono divisi dal separatore (solitamente la virgola , ).

In IRIS i dati possono essere esportati in CSV utilizzando la funzione “Esporta metadati” presente tra gli Strumenti di amministrazione di ciascuna collezione.

Modifica Metadati

Ottenuto il file, è possibile modificarlo utilizzando Calc di OpenOffice. Per farlo selezionare il file e col tasto destro del mouse cliccare su Apri con, quindi LibreOffice Calc. Se non si dispone di OpenOffice è possibile scaricarlo da qui. In alternativa si può utilizzare Microsoft Excel consultando la seguente guida

Al momento dell'apertura del file compare una form in cui viene chiesto di indicare i caratteri di tabulazione del file. Scegliere le voci mostrate nell’immagine sottostante

A questo punto si ottiene un file excel sul quale è possibile apportare tutte le modifiche previste dalle operazioni di excel.

Quando le modifiche sono state completate occorre salvare il file mantenendo lo stesso formato. Cliccare su File > Salva come e quindi selezionare la voce Testo CSV (.csv) (*.csv) dal menu a tendina Salva come

Quindi cliccare su Usa il formato Testo CSV

A questo punto occorre ripristinare sintassi del formato CSV. Aprire il file con un editor di testo.

La prima riga rappresenta l’intestazione dei metadati. In questa riga, a parte i due valori iniziali id e collection, gli altri devono essere espressi nel formato “dc.element.qualifier”, come compaiono nell’input-form (ad es dc.date.issue o dc.identifier.doi). In questa riga occorre sostituire il carattere di separazione tab con una virgola ,

Le linee successive rappresentano i valori dei metadati per ciascun item. In queste linee occorre sostituire il carattere di separazione tab con doppio apice virgola doppio apice “,”

Al termine di queste operazioni si deve avere un file come il seguente

Casi particolari:

id,dc.relation.numberofpages

"14124",

in questo modo si elimina il metadato dc.relation.numberofpages per l'item 14124

 

Caricamento file CSV

A questo punto è possibile caricare il file ottenuto. Andare in Prodotti, Tool di manutenzione e cliccare su Operazioni Massive.

Attraverso la form successiva selezionare il file desiderato e cliccare su “Carica file

In questa pagina potete vedere quali modifiche sono state apportate all'interno del file CSV. A questo punto è possibile accettare le modifiche e fare clic su "Applica" o no cliccando su "Cancella".

Ulteriori dettagli sono disponibili alla giuda https://wiki.duraspace.org/display/DSDOC4x/Batch+Metadata+Editing