Webesse3 mette a disposizione la validazione PDF/A per i documenti, in particolare per i documenti PDF relativi alla tesi.
Cosa significa PDF/A
PDF/A è uno standard internazionale (ISO19005), sottoinsieme dello standard PDF, appositamente pensato per l'archiviazione nel lungo periodo di documenti elettronici.
Il suo scopo è dunque garantire che il documento sia visualizzabile sempre, indipendentemente dal software utilizzato per visualizzarlo e dalla disponibilità di eventuali risorse cercate esternamente per visualizzarlo; il documento dev'essere cioè autocontenuto.
I documenti PDF/A (Portable Document Format/Archive) sono dunque documenti pdf a tutti gli effetti, che rispettano una conformità definita dalla PDF Association.
Ad oggi sono disponibili varie versioni della specifica PDF/A:
- PDF/A-1A
- PDF/A-1B
- PDF/A-2A
- PDF/A-2B
- PDF/A-2U
- PDF/A-3A
- PDF/A-3B
- PDF/A-3U
Le varie versioni hanno specifiche diverse, ma non entriamo nel dettaglio.
Webesse3 non discrimina tra le specifiche, ma è bene sapere che appunto esistono diverse versioni della specifica.
Struttura di un documento PDF/A
PDF/A contiene le sole informazioni necessarie per visualizzare il documento come nel momento in cui è stato formato.
Tutto il contenuto visibile del documento deve essere incluso, come il testo, le immagini, vettori grafici, fonts, colori e altro. Un documento PDF/A non può contenere macro-istruzioni o riferimenti ad elementi od informazioni (come i font) non contenuti nel file stesso.
Riconoscimento di un PDF/A
Ogni documento PDF/A contiene dei metadati dove viene autodichiarata la specifica che il documento stesso rispetta.
Questo può non essere vero! Un documento può contenere i metadati, ma non rispettare le specifiche, ad esempio non contenere al suo interno i font referenziati; questo lo rende un PDF/A non valido.
La conseguenza di questo disallineamento è che il documento viene segnalato come PDF/A, ad esempio aprendolo con Adobe Reader, quindi è apparentemente un documento PDF/A, ma non segue realmente le specifiche.
Per questo motivo sono starte introdotte due diverse modalità di validazione, descritte in seguito.
Come generare file PDF/A
E' possibile crearli sia tramite software commerciali (es. Adobe Acrobat, Microsoft Word) che gratuiti (es. OpenOffice, LibreOffice, PDFCreator o convertitori software oppure online).
Abilitazione validazione PDF/A su Webesse3
Attualmente questa validazione è possibile abilitarla solamente per gli allegati di tesi.
Per rendere validi come allegati di tesi solamente i documenti PDF/A occorre impostare a 1 il valore numerico dei parametri di configurazione ALL_TESI_DEF_PDF_A (per gli allegati definitivi di tesi) e ALL_TESI_NO_DEF_PDF_A (per gli allegati non definitivi di tesi).
Modalità di validazione PDF/A su Webesse3
Mediante il parametro di configurazione PDF_A_VALIDATOR, invece è possibile scegliere la modalità di validazione:
1 (obsoleta a partire da v. 21.01.00) - validazione completa PDF/A eseguita con libreria PDFBox - obsoleta, gestiva solamente il formato PDF/A-1B- 2 - validazione completa PDF/A eseguita con libreria VeraPDF
- 3 (default) - validazione autodichiarativa PDF/A eseguita con libreria VeraPDF
Si consiglia fortemente di mantenere il par_conf con la modalità di validazione autodichiarativa (valore 3), in quanto la validazione completa è molto onerosa e può compromettere la stabilità del sistema.
Nota: il parametro di configurazione PDF_A_VALIDATOR era stato reso obsoleto a partire dalla versione 21.04.01, per poi esser stato ripristinato in versione 21.07.03 a seguito dei problemi di performance.
Modalità di validazione completa con libreria VeraPDF Validator
Viene analizzato tutto il documento, affinché rispetti le specifiche PDF/A rispetto al profilo di validazione indicato.
Vantaggi: vengono inseriti solamente i documenti completamente conformi alla specifica PDF/A
Svantaggi: è possibile riscontrare problemi bloccanti nel processo di conseguimento titolo, per cui uno studente non riesce a generare un PDF/A valido ed è costretto a contattare la segreteria per procedere con l'inserimento da client della sua tesi. Abilitando questa modalità è dunque necessario accettare che talvolta gli strumenti di generazione PDF/A non generino dei documenti realmente conformi alla specifica, e si incappi in questo problema.
Troubleshooting
Se qualche file non superasse la validazione, è possibile effettuare una verifica ulteriore tramite Adobe Acrobat, oppure un validatore online, ad esempio:
- http://demo.verapdf.org (stesso validatore utilizzato da webesse3, è possibile che utilizzi una versione più aggiornata)
- https://www.pdf-online.com/osa/validate.aspx
Qualora anche questi indichino la non conformità alla specifica PDF/A dichiarata dal documento (oppure non contenga neppure i metadati relativi al PDF/A), si ha un'ulteriore prova della non conformità del documento.
Si può quindi provare a generare il PDF/A con un altro strumento/software e ritentare il caricamento.
Qualora invece ci fosse un disallineamento rispetto alla validazione con webesse3, è possibile inserire un ticket sulla coda SDCS ed inviarci il documento (zippato per rimanere entro i 10MB supportati da Customer Portal) per effettuare una verifica.
E' possibile che sia un errore del VeraPDF Validator, per cui è possibile segnalarlo agli sviluppatori e/o aggiornare la libreria qualora il problema sia stato risolto.
Ad ogni modo, in caso non si riesca a generare un file PDF/A valido, è possibile inserire da client Esse3 il documento di tesi, in quanto il client bypassa la validazione PDF/A.