Webesse3 mette a disposizione la validazione PDF/A per i documenti, in particolare per i documenti PDF relativi alla tesi.

Cosa significa PDF/A

PDF/A è uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l'archiviazione nel lungo periodo di documenti elettronici.
Il suo scopo è dunque garantire che il documento sia visualizzabile sempre, indipendentemente dal software utilizzato per visualizzarlo e dalla disponibilità di eventuali risorse cercate esternamente per visualizzarlo; il documento dev'essere cioè autocontenuto.

I documenti PDF/A (Portable Document Format/Archive) sono dunque documenti pdf a tutti gli effetti, che rispettano una conformità definita dalla PDF Association.

Ad oggi sono disponibili varie versioni della specifica PDF/A:

  • PDF/A-1A
  • PDF/A-1B
  • PDF/A-2A
  • PDF/A-2B
  • PDF/A-2U
  • PDF/A-3A
  • PDF/A-3B
  • PDF/A-3U

Le varie versioni hanno specifiche diverse, ma non entriamo nel dettaglio.
Webesse3 non discrimina tra le specifiche, ma è bene sapere che appunto esistono diverse versioni della specifica.

Struttura di un documento PDF/A

PDF/A contiene le sole informazioni necessarie per visualizzare il documento come nel momento in cui è stato formato.
Tutto il contenuto visibile del documento deve essere incluso, come il testo, le immagini, vettori grafici, fonts, colori e altro. Un documento PDF/A non può contenere macro-istruzioni o riferimenti ad elementi od informazioni (come i font) non contenuti nel file stesso.

Riconoscimento di un PDF/A

Ogni documento PDF/A contiene dei metadati dove viene autodichiarata la specifica che il documento stesso rispetta.
Questo può non essere vero! Un documento può contenere i metadati, ma non rispettare le specifiche, ad esempio non contenere al suo interno i font referenziati; questo lo rende un PDF/A non valido.
La conseguenza di questo disallineamento è che il documento viene segnalato come PDF/A, ad esempio aprendolo con Adobe Reader, quindi è apparentemente un documento PDF/A, ma non segue realmente le specifiche.
Per questo motivo sono starte introdotte due diverse modalità di validazione, descritte in seguito.

Come generare file PDF/A

E' possibile crearli sia tramite software commerciali (es. Adobe Acrobat, Microsoft Word) che gratuiti (es. OpenOffice, LibreOffice, PDFCreator o convertitori software oppure online).

Abilitazione validazione PDF/A su Webesse3

Attualmente questa validazione è possibile abilitarla solamente per gli allegati di tesi.
Per rendere validi come allegati di tesi solamente i documenti PDF/A occorre impostare a 1 il valore numerico dei parametri di configurazione ALL_TESI_DEF_PDF_A (per gli allegati definitivi di tesi) e ALL_TESI_NO_DEF_PDF_A (per gli allegati non definitivi di tesi).

Modalità di validazione PDF/A su Webesse3

Mediante il parametro di configurazione PDF_A_VALIDATOR, invece è possibile scegliere la modalità di validazione:

  • 1 (obsoleta a partire da v. 21.01.00) - validazione completa PDF/A eseguita con libreria PDFBox - obsoleta, gestiva solamente il formato PDF/A-1B
  • 2 - validazione completa PDF/A eseguita con libreria VeraPDF
  • 3 (default) - validazione autodichiarativa PDF/A eseguita con libreria VeraPDF

Si consiglia fortemente di mantenere il par_conf con la modalità di validazione autodichiarativa (valore 3), in quanto la validazione completa è molto onerosa e può compromettere la stabilità del sistema.

Nota: il parametro di configurazione PDF_A_VALIDATOR era stato reso obsoleto a partire dalla versione 21.04.01, per poi esser stato ripristinato in versione 21.07.03 a seguito dei problemi di performance.

Modalità di validazione completa con libreria VeraPDF Validator

Viene analizzato tutto il documento, affinché rispetti le specifiche PDF/A rispetto al profilo di validazione indicato.

Vantaggi: vengono inseriti solamente i documenti completamente conformi alla specifica PDF/A
Svantaggi: è possibile riscontrare problemi bloccanti nel processo di conseguimento titolo, per cui uno studente non riesce a generare un PDF/A valido ed è costretto a contattare la segreteria per procedere con l'inserimento da client della sua tesi. Abilitando questa modalità è dunque necessario accettare che talvolta gli strumenti di generazione PDF/A non generino dei documenti realmente conformi alla specifica, e si incappi in questo problema.

Troubleshooting

Se qualche file non superasse la validazione, è possibile effettuare una verifica ulteriore tramite Adobe Acrobat, oppure un validatore online, ad esempio:

Qualora anche questi indichino la non conformità alla specifica PDF/A dichiarata dal documento (oppure non contenga neppure i metadati relativi al PDF/A), si ha un'ulteriore prova della non conformità del documento.
Si può quindi provare a generare il PDF/A con un altro strumento/software e ritentare il caricamento.

Qualora invece ci fosse un disallineamento rispetto alla validazione con webesse3, è possibile inserire un ticket sulla coda SDCS ed inviarci il documento (zippato per rimanere entro i 10MB supportati da Customer Portal) per effettuare una verifica.
E' possibile che sia un errore del VeraPDF Validator, per cui è possibile segnalarlo agli sviluppatori e/o aggiornare la libreria qualora il problema sia stato risolto.

Ad ogni modo, in caso non si riesca a generare un file PDF/A valido, è possibile inserire da client Esse3 il documento di tesi, in quanto il client bypassa la validazione PDF/A.

  • No labels