Introduzione

A ogni prodotto presente in archivio è possibile associare uno più codici identificativi univoci messi a disposizione da alcune banche dati (ad esempio alcuni editori che offrono questo servizio sono Elsevier con la banca dati Scopus e Clarivate Analytics con la banca dati WOS). Le pubblicazioni presenti in archivio potrebbero essere prive di tali identificativi o averne di errati. 

La funzionalità descritta di seguito ha come obiettivo quello di migliorare la qualità dei dati delle pubblicazioni censite in archivio: il sistema recupera gli identificativi esterni dalle banche dati WOS (Clarivate) Scopus (Elsevier ) e OpenAlex (OurResearch) per le pubblicazioni che ne sono sprovviste; per le pubblicazioni che hanno un identificativo Wos e/o Scopus il sistema verifica che questi siano coerenti con quelli recuperati dalle rispettive banche dati.  L'utente che accede a questo tool ha la possibilità di accettare o rifiutare l'associazione proposta dal sistema a seguito dell'interrogazione dei database esterni degli editori.


Per quanto riguarda i dati Scoups e WOS l'interfaccia è disponibile solo per coloro che hanno effettuato la sottoscrizione di un account premium con Elsevier o con Clarivate Analytics.

Interpretazione ed elaborazione dei dati recuperati dalle banche WOS, Scopus e OpenAlex

Il recupero degli identificativi avviene in modo differente come spiegato nel seguito.

Recupero identificativi da Scopus 

Il recupero degli identificativi dalle banche dati avviene attraverso l'invocazione di un webservice al quale viene fornito il seguente insieme di metadati:

tipo di metadatometadato
dc.identifier.scopuseid
dc.identifier.pmidpmid
dc.identifier.doidoi
IssnIssn rivista/serie
dc.relation.volumevolume
dc.relation.firstpagefirstpage Pagina iniziale
dc.titletitle Titolo
dc.date.issuedyear Anno
first named authorauthor Autore
dc.relation.articlearticle number

Scopus elabora le informazioni ricevute ed esegue una ricerca sulla propria banca dati. Il processo di ricerca attivato da Scopus può essere definito  a "cascata": viene avviata una prima ricerca per "eid", se l'esito della ricerca è negativo viene attivata la ricerca per "pmid", se anche in questo caso la ricerca non fornisce risultati viene avviata una nuova ricerca per identificativo Doi, e così via. La ricerca si interrompe al primo risultato positivo. L'ordine in cui vengono utilizzate le diverse chiavi di ricerca è quello indicato di seguito, in alcuni casi l'algoritmo di ricerca prende in considerazione un set di metadati:

  1.   cerca l'identificativo "eid";
  2.   cerca l'identificativo pmid;
  3.   cerca l'identificativo DOI;
  4.  cerca per set di metadati costituito da issn, volume, pagina iniziale;
  5.  cerca per set di metadati costituito da autore, anno, pagina iniziale;
  6.  cerca per set di metadati costituito da titolo, anno.


Nella tabella sottostante sono riportati in modo sintetico i vari scenari che possono scaturire dal confronto dei dati rilevati da Scopus e quelli presenti nel Catalogo, tenedo presente la seguente logica per definire come “certo” l’identificativo recuperato dalle banche dati esterne:

  • un id Scopus si ritiene “certo” quando, oltre all'id Scopus, almeno uno tra Pubmed id e DOI di una pubblicazione è uguale a quello recuperato dalla banca dati esterna


Esito della ricerca su banca dati ScopusGestione esito della ricerca sul portale IRIS 
L'identificativo esterno è identico all'identificativo in archivio
  • caso A - in IRIS la pubblicazione contiene Scopus ID, riconosciuto come corretto dal sistema, Pubmed id e DOI. Se oltre allo Scopus ID almeno un altro identificativo coincide o tutti e tre coincidono con quelli recuperati dalla banca dati, allora:

         Risultato: l’id recuperato è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Id esterno e recuperato coincidenti”

  • caso B - in IRIS la pubblicazione contiene Scopus ID, riconosciuto come corretto dal sistema, ed è presente solo uno tra Pubmed id e DOI.  Se i due identificativi presenti coincidono con quelli recuperati dalla banca dati, allora:

        Risultato: l’id recuperato è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Id esterno e recuperato coincidenti”

  • caso C - in IRIS la pubblicazione contiene Scopus ID, riconosciuto come corretto dal sistema, ed è presente solo uno tra Pubmed id e DOI.  Se solo lo Scopus ID risulta coincidente, allora:

        Risultato: l’id recuperato NON è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Potenziali associazioni”


La pubblicazione viene trovata ma l'identificativo è diverso da quello presente in archivio (o assente)

Se l’id recuperato non coincide con quello presente in IRIS il record verrà posizionato nel gruppo “Recuperato identificativo differente”

Sono state individuate più pubblicazioni: il servizio di Scopus segnala l'errore e quante pubblicazioni sono state individuate.Viene segnalato l'errore come corrispondenza multipla
Pubblicazione non individuata: il servizio di Scopus segnala l'errore fornendo i dettagli sull'errore riscontrato

Possibili errori:

  • Nessuna corrispondenza trovata per il documento
  • Nessuna corrispondenza trovata per il documento e nessuno degli ISSN forniti è stato trovato nell'elenco degli ISSN di Scopus
  • L'anno fornito non rientra nell'intervallo di anni di pubblicazione specificato
  • I dati non sono sufficienti per avviare la ricerca
  • Problemi nella chiamata, occorre ritentare la chiamata al servizio
  • Autenticazione non valida (la chiave fornita per l'autenticazione non è valida).
  • Errore generico


Recupero identificativi da WoS

Il recupero degli identificativi Wos avviene in modo diverso da quanto accade per Scopus: viene fatta un'invocazione per ogni singolo identificativo (o gruppo di metadati) partendo da quello definito più "certo" per poi procedere con quello successivo. L'ordine in cui vengono utilizzate le diverse chiavi di ricerca è quello indicato di seguito,

  1. cerca per dc.identifier.isi;
  2. cerca per dc.identifier.doi;
  3. cerca per dc.identifier.pmid;
  4. cerca per la combinazione titolo, anno;


Nella tabella sottostante sono riportati in modo sintetico i vari scenari che possono scaturire dal confronto dei dati rilevati da WOS e quelli presenti nel Catalogo, tenedo presente la seguente logica per definire come “certo” l’identificativo recuperato dalle banche dati esterne:

  • un id WOS si ritiene “certo” quando, oltre all'id WOS,  almeno uno tra pubmed id, doi di una pubblicazione  è uguale a quello recuperato dalla banca dati esterna


Esito della ricerca su banca dati WOSGestione esito della ricerca sul portale IRIS 
L'identificativo esterno è identico all'identificativo in archivio
  • caso A - in IRIS la pubblicazione contiene WOS ID, riconosciuto come corretto dal sistema, Pubmed id e DOI. Se oltre al WOS ID almeno un altro identificativo coincide o tutti e tre coincidono con quelli recuperati dalla banca dati, allora:

         Risultato: l’id recuperato è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Id esterno e recuperato coincidenti”

  • caso B - in IRIS la pubblicazione contiene WOS ID, riconosciuto come corretto dal sistema, ed è presente solo uno tra Pubmed id e DOI.  Se i due identificativi presenti coincidono con quelli recuperati dalla banca dati, allora:

        Risultato: l’id recuperato è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Id esterno e recuperato coincidenti”

  • caso C - in IRIS la pubblicazione contiene WOS ID, riconosciuto come corretto dal sistema, ed è presente solo uno tra Pubmed id e DOI.  Se solo il WOS ID risulta coincidente, allora:

        Risultato: l’id recuperato NON è da considerarsi “certo”, quindi il record verrà posizionato nel gruppo “Potenziali associazioni”

La pubblicazione viene trovata ma l'identificativo è diverso da quello presente in archivio (o assente)Se l’id recuperato non coincide con quello presente in IRIS il record verrà posizionato nel gruppo “Recuperato identificativo differente”
Sono state individuate più pubblicazioni: il servizio di WOS segnala l'errore e quante pubblicazioni sono state individuate. Viene segnalato l'errore come corrispondenza multipla
Pubblicazione non individuata: il servizio di WOS segnala l'errore fornendo i dettagli sull'errore riscontrato

Nessuna corrispondenza trovata per il documento

Configurazioni

Attraverso un'apposita configurazione è possibile fare in modo che il sistema approvi in modo automatico l'identificativo recuperato nel caso in cui il prefisso risulti essere differente da quello presente in Archivio. I prefissi gestiti dalla configurazione sono:

  • Scopus = 2-s2.0-
  • Wos= ISI, WOS, WOS:ISI:

La richiesta di attivazione della configurazione deve essere inviata all'Help Desk di IRIS attraverso il sistema di ticketing Customer Portal.

Configurazioni

Se richiesto dall'Ateneo, è possibile escludere dal tool alcune tipologie di prodotti. La richiesta deve essere inoltrata all'Help Desk di IRIS attraverso il Customer Portal.

Recupero identificativi da OpenAlex

Il recupero degli identificativi OpenAlex avviene in modo simile a quanto accade per WOS: viene fatta un'invocazione per ogni singolo identificativo (o gruppo di metadati) partendo da quello definito più "certo" per poi procedere con quello successivo. L'ordine in cui vengono utilizzate le diverse chiavi di ricerca è quello indicato di seguito,

  1. cerca per dc.identifier.openalex;
  2. cerca per dc.identifier.doi;
  3. cerca per dc.identifier.pmid;
  4. cerca per la combinazione titolo, anno;

Gli scenari che possono scaturire dal confronto dei dati rilevati da OpenAlex e quelli presenti nel Catalogo sono gestiti in modo analogo agli scenari descritti per il serivizio WOS.

Quando avviene il recupero dei dati

L'invocazione dei servizi Scopus e Wos, per il recupero dei dati, avviene ogni notte ad eccezione del lunedì. Solo per Atenei grandi sono previsti due aggiornamenti aggiuntivi nelle ore diurne (uno al mattino e uno al pomeriggio), in quanto il numero elevato di pubblicazioni non permette l'aggiornamento di tutti i prodotti durante le ore notturne. 

L'interrogazione delle banche dati riguarda tutti i prodotti che:

  • non sono in stato "cancellato";
  • sono stati oggetto di modifica dopo l'ultima interrogazione della baca dati dell'editore;
  • non hanno l'identificativo, o risulta sprovvisto del prefisso "WOS:" (per WoS) o "2-s2.0-" (per Scopus)

Utilizzo dell'interfaccia

Il percorso per accedere alla funzionalità è il seguente: "Prodotti">"Qualità dell'archivio"> "Identificativi". La funzionalità in esame fa parte del set di tool utilizzati per migliorare la qualità dei dati presenti in archivio.

Gli utenti abilitati alla funzionalità sono:

  • Amministratori dell'archivio - in visione completa e senza limiti di visibilità (possono visualizzare le associazioni proposte per tutti i prodotti dell'archivio);
  • Utenti standard (docenti/ricercatori) - in visione personale visualizzano le possibili associazioni per prodotti di cui sono responsabili o coautori.

Configurazioni

L'utente coautore delle pubblicazioni ha sempre accesso alle proprie pubblicazioni, ma i permessi per agire su di esse per accettare o rifiutare l'associazione degli identificativi proposti sono gestiti da apposita configurazione. Per attivare questa configurazione è necessario inoltrare una richiesta al servizio di Customer Portal.


  • Responsabili di dipartimento - in visione dipartimentale visualizzano le possibili associazioni per prodotti che afferiscono al proprio dipartimento.

Quando un utente accede in visione personale al proprio desktop prodotti, se presenti potenziali associazioni per le proprie pubblicazioni, il sistema mostra una finestrella di notifica in cui è presente il numero di potenziali match trovati e il link alla pagina della qualità dell'archivio.

La pagina visualizzata è strutturata in due sezioni,  in alto la sezione che accoglie i campi di filtro e subito dopo la sezione con l'elenco dei prodotti.

Sezione Filtri di ricerca

Nella sezione filtri di ricerca sono presenti i seguenti campi

  • campo "Handle": è possibile cercare per un solo handle;
  • campo "Pubblicazione":  è possibile indicare il  titolo o parte del titolo di un prodotto da cercare;
  • campo "Responsabile del dato": permette il filtraggio dei dati considerando il nome del responsabile del dato indicato nel campo;
  • campo "Autore": il sistema filtra le pubblicazioni per autore indicato nel campo. Si tratta di un campo con autocompletamento: mentre si digita il nome o una parte di esso il sistema inizia a cercare all'interno dell'anagrafica di IRIS e a proporre eventuali corrispondenze;
  • campo "Anno di pubblicazione": si possono indicare più anni, tra i quali anche l'anno successivo all'anno corrente;
  • campo "Status": corrisponde all'esito della ricerca fatta dal sistema sulle banche dati Scopus, WOS e OpenAlex.

Possibili valori:

    • "Potenziali associazioni" (valore di default). Per questi prodotti il sistema segnala la presenza di una possibile corrispondenza con gli identificativi recuperati da Scopus, WOS e OpenAlex. 
    • "Recuperato identificativo differente" (valore di default). Sono i prodotti per cui l'identificativo recuperato dalle banche dati non coincide con quello presente nel prodotto.
    • "Id esterno e recuperato coincidenti". Si tratta di prodotti per i quali l'identificativo recuperato dalle banche dati coincide con quello presente nel prodotto ed è ritenuto "certo", applicando le logiche descritte sopra.
    • "Associazione respinta". Fanno parte di questo raggruppamento i prodotti per i quali è stata respinta una possibile associazione proposta dal sistema.
    • "Errori nel recupero" (identificativo non trovato, errori del servizio di recupero, in attesa di effettuare il recupero). Per i prodotti che fanno parte di questo raggruppamento il sistema ha rilevato un errore durante l'interrogazione delle banche dati esterne per il recupero degli identificativi.

  • campo "Modalità di riconoscimento": Il sistema, oltre a cercare sulle banche dati esterne la presenza della pubblicazione attraverso gli identificativi univoci se presenti nella pubblicazione archiviata, esegue anche la ricerca e comparazione di altri metadati quali titolo, anno di pubblicazione, autori, ecc. A queste due differenti modalità di riconoscimento è associato un differente grado di attendibilità: la ricerca e comparazione per identificativo univoco è considerata "sicura", la  ricerca e comparazione basata su altri metadati è considerata come "non sicura". E' possibile filtrare per visualizzare i soli risulti "sicuri" oppure per visualizzare solo i risultati "non sicuri". Le scelte possibili sono:
      • "Match sicuri" - vengono proposti solo i potenziali match trovati attraverso identificativi esterni quali doi, pmid, isi, scopusid. 
      • "Match non sicuri"- vengono proposti solo i potenziali match trovati attraverso il confronto di altri metadati come titolo, anno di pubblicazione, stringa autori, ecc. I record mostrati utilizzando questa modalità sono soggetti a errori, pertanto è consigliata una verifica attenta dei dati prima di confermare l'associazione. In risalto con sfondo rosso le pubblicazioni con titolo o anno diverso rispetto a quello presente in archivio (vedi immagine sottostante).



  • campo "Status di validazione": è possibile filtrare per stato del workflow del prodotto. Le possibili scelte sono: "provvisorio", "riaperto", "in validazione", "rimosso", ""definitivo" e "validato". E' possibile, tramite configurazione, nascondere alcune scelte del menu a tendina.
  • campo "Dipartimento": è presente un menu a tendina con la lista dei dipartimenti di ateneo. È possibile effettuare una sola scelta. Il campo di filtro non è presente per utenti che operano in visione personale.
  • campo "Tipologia": è presente un menu a tendina con la lista delle tipologie di documento adottate dall'Ateneo. Si tratta di un campo multiplo, pertanto è possibile scegliere più di un valore.
  • campo "DOI": digitando il DOI di un prodotto o una parte di esso è possibile effettuare una ricerca mirata o ridurre il numero dei risultati a pochi elementi in modo da facilitare l'individuazione della pubblicazione di interesse.
  • campo "Tipologia db bibliografico": sono elencate le tipologie di documento utilizzate dagli editori per catalogare i documenti nei database bibliografici. Si tratta di un campo multiplo, pertanto è possibile scegliere più di un valore.

    Nella tendina di questo filtro di ricerca non sono presenti le tipologie "Correction, Addition (WoS)" e "Erratum (Scopus)"  in quanto non di interesse e non mappabili sulle tipologie in uso degli Atenei. 

Tabella dei risultati

I risultati sono presentati in forma tabellare, come mostrato nell'immagine sottostante.

Di seguito i dettagli sulle colonne che compongono la tabella dei risultati e il loro contenuto

  • colonna "Pubblicazione" -  viene proposta la citazione della pubblicazione e la tipologia di documento a cui appartiene. Cliccando sulla citazione si accede al dettaglio del prodotto;
  • colonna "Responsabile del dato" - in questa colonna è esposto il nominativo del responsabile della pubblicazione;
  • colonna "Dipartimento" - è esposto il dipartimento(i) a cui afferisce l'autore interno (o autori interni); 
  • colonna "Identificativo attuale" -  è esposto l'identificativo presente nella pubblicazione censita in Archivio;
  • colonna "Identificativo recuperato" - è esposto l'identificativo recuperato dalle banche dati esterne e proposto come potenziale associazione;
  • colonna "Servizio" -  In questa colonna è indicata la banca dati esterna su cui risulta censita la pubblicazione (WOS,Scopus,OpenAlex). Se per la medesima pubblicazione c'è corrispondenza su tutte le banche dati nella colonna saranno presenti tutte e tre (come mostrato nell'immagine a seguire)

Inoltre è esposto il titolo della pubblicazione presente nella banca dati esterna: cliccando sull'icona della banca dati o sul titolo esposto si accede alla pagina di dettaglio del prodotto registrato sulla banca banca dati esterna. La colonna si presenta sprovvista di tali informazioni se la ricerca sulle banche dati non ha rilevato alcuna corrispondenza.


  • colonna "identificativo recuperato già esistente" - vengono elencati gli handle, con link alle pubblicazioni, nel caso in cui gli identificativi proposti siano già associati ad altri prodotti presenti in catalogo.

Queste informazioni vengono naturalmente esposte in base al servizio dell'identificativo recuperato: potremmo quindi avere (come nell'immagine sottostante) uno o più link per entrambi i servizi oppure per uno soltanto.


  • colonna "Modalità di riconoscimento"- nella colonna sono indicati i tipi di metadati che hanno portato alla individuazione della corrispondenza, ad esempio DOI, titolo, anno della pubblicazione, ecc. Le associazioni che presentano lo sfondo rosso fanno riferimento a pubblicazioni con titolo e anno diverso rispetto a quello presente in archivio.  
  • colonna "Info"- sono indicate informazioni aggiuntive riguardanti eventuali errori rilevati durante l'interrogazione delle banche dati, oppure viene segnalato che non è stata rilevata nessuna corrispondenza sulle banche dati esterne. All'interno di questa colonna viene visualizzata l'icona con tooltip informativo:
    •  viene esposto il seguente messaggio  “Il prodotto è stato modificato dopo l’operazione di verifica “Accetta associazione/Rifiuta Associazione”. Si invita a controllare la correttezza dei dati” quuando una pubblicazione è stata oggetto di modifica successivamente ad un intervento di gestione (accetta/respingi) degli indentificativi tramite il tool.
    • viene esposto il messaggio  “Prodotto verificato con “Accetta associazione/Rifiuta Associazione” quando una pubblicazione è stata gestita tramite il tool identificativi attraverso le azioni di “associa/rifiuto”. 
  • colonna "Operazioni" - attraverso i bottoni contenuti in questa colonna è possibile gestire i match proposti:

Accetta associazione - cliccando il pulsante si approva l'associazione proposta, l'identificativo recuperato dalla banca dati esterna viene inserito all'interno dell'item l'operazione di integrazione del dato viene registrata nel tab "storico" della pubblicazione.

Respingi Associazione - al click sul pulsante si respinge l'associazione proposta. Nella colonna "Operazioni" restano attivi i pulsanti di accettazione e ritenta associazione; di conseguenza la pubblicazione non verrà più proposta tra le potenziali associazioni, ma sarà visibile all'interno del gruppo di prodotti con "status= Associazioni rifiutate". Per questi prodotti l'interrogazione delle banche dati avverrà solo se questi item subiranno successivamente delle modifiche nella scheda prodotto. 

Ritenta identificazione - al click sul pulsante viene ritentato il recupero degli identificativi esterni. L'azione è sempre disponibile indipendentemente dallo "status"; tuttavia l'azione dovrebbe interessare le pubblicazioni che presentano errori a seguito di una precedente interrogazione delle banche dati esterne. Il pulsante è disponibile al solo utente amministratore dell'archivio che opera in visione completa.


Attenzione

Qualora l'istituto abbia scelto di non permettere ai coautori di intervenire sulle pubblicazioni per l'accettazione/rifiuto degli identificativi proposti, la colonna delle operazioni si presenterà vuota.

Si ricorda che attraverso apposita configurazione è possibile accordare al coautore  i permessi di accettazione/rifiuto .


Nella tabella sottostante sono riepilogate in modo sintetico le azioni permesse agli utenti loggati prima e dopo la gestione della pubblicazione. L'utente in visione personale non potrà intervenire attraverso il tool con azioni associa/respingi su item già gestiti in passato, mentre all'amministratore dell'archivio è sempre possibile un nuovo intervento (accetta/respingi/aggiorna) su  item già processati da tool.


  Azioni possibili
UtentiItem non gestito

Item gestito con "Accetta associazione" 

Item gestito con "Rifiuta associazione"

Utente standard (visione personale)

 - Accetta associazione

 - Rifiuta associazione

Nessuna azione disponibile

 Nessuna azione disponibile

Superuser (visione dipartimentale)

 - Accetta associazione

 - Rifiuta associazione

Nessuna azione disponibile

 - Accetta associazione

Amministratore archivio (visione completa)

 - Accetta associazione

 - Rifiuta associazione

 - Ritenta identificazione

 - Ritenta identificazione

 - Accetta associazione

 - Ritenta identificazione

L'utente che opera in visione personale vedrà nell'elenco le possibili associazioni che riguardano solo le seguenti tipologie: 

  • Articolo in rivista (262)
  • Contributo in volume (Capitolo o Saggio) (268);
  • Monografia o trattato scientifico (276); 
  • Contributo in Atti di convegno (273)

E' possibile che a fronte di un determinato ID il sistema presenti un diverso ID recuperato. In questo caso vuol dire che l'ID memorizzato in IRIS è stato deprecato (probabilmente perché si riferiva alla pubblicazione pre-print). Valutare quindi l'associazione del nuovo ID.





  • No labels