Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Nella presente guida vengono illustrate le caratteristiche della funzionalità di deduplicazione che ha come scopo quello di garantire una maggiore qualità dell'Archivio. Il controllo di potenziali pubblicazioni doppie, oltre a riguardare la fase di censimento dei prodotti da parte dei docenti/ricercatori (come descritto nella pagina Controllo duplicati in submission (DA FARE), può essere svolto anche attraverso un tool messo a disposizione degli utenti amministratori dell'Archivio (o gruppo di utenti designati a tale incarico); a questo tool è dedicata la corrente sezione del manuale.

Quali dati vengono controllati

Per individuare potenziali duplicati, il sistema mette a confronto un set di metadati: Titolo, DOI, ISBN, PubMedID, Wos, Scopus. L’algoritmo di confronto si basa sull’uguaglianza del contenuto di questi campi, pertanto allo stesso Titolo, o allo stesso codice DOI, o ISBN, o PubMedID, o Wos, o Scopus possono corrispondere più pubblicazioni.

Submission

In fase di censimento di un nuovo prodotto, quando vengono compilati i dati presi in considerazione per la deduplicazione (come titolo, DOI, ISBN e PubMedID), il sistema effettua un controllo dei dati presenti in Archivio e se trova delle corrispondenze segnala che si sta inserendo un potenziale duplicato.

...


Il significato delle azioni possibili è spiegato nel seguito.

Crea duplicato

Il sistema ha correttamente individuato un prodotto in Archivio simile a quello che si sta inserendo (con lo stesso titolo, oppure DOI, ISBN, PubMedID).

...

A questo punto la form di segnalazione di potenziali duplicati scompare e il processo di submission continua normalmente.

Non è un duplicato

L'utente si accorge che il sistema sta segnalando un falso positivo, ovvero il prodotto che si sta censendo non è lo stesso trovato dal sistema in Archivio.

...

Warning
titleNOTA
 Quando si sceglie l'opzione Crea un duplicato o Non è un duplicato il sistema tiene traccia dell'azione compiuta per la gestione del tool di deduplicazione degli Amministratori descritto in seguito.

Autoriconoscimento

Se si ritiene di essere un autore non ancora riconosciuto del prodotto che il sistema propone come duplicato rispetto a quello che si sta censendo, si può effettuare direttamente l'autoriconoscimento come autore interno del prodotto cliccando sul pulsante Autoriconoscimento. Viene mostrato un alert in cui vengono fornite delle informazioni sull'azione che si sta compiendo.

...

In entrambi i casi si accede al dettaglio del prodotto. Comparirà l'alert di operatività limitata per ricordare sul prodotto che presenti richieste di autoriconoscimento. Queste richieste dovranno essere gestite dal responsabile del dato o dall'amministratore dell'Archivio come descritto in Nuova modalità di autoriconoscimento#Validazioneautoriconoscimento.

Cancella

Cliccando sul tasto Cancel si esce dalla submission del prodotto.

Warning
titleNOTA
È possibile fare in modo che quando si clicca sul tasto Cancel si possa proseguire la submission. In questo caso fino a quando il prodotto si trova nello stato Provvisorio/Bozza alla riapertura dello stesso viene mostrato nuovamente il popoup di deduplicazione. Per attivare questa configurazione è necessario effettuare una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing Customerportal.


Tool di deduplicazione

Questo tool è a disposizione degli amministratori dell'Archivio che operano in visione completa. Il tool è accessibile dal menu principale cliccando su Prodotti, Tool di manutenzione, Deduplicazione

...

Se ad esempio si vuole lavorare sui prodotti duplicati per titolo e non si vuole considerare i prodotti che si trovano nello stato di bozza, occorre clicare sul valore della colonna "Bozze escluse" per la riga "Numero totale delle pubblicazioni duplicate per Titolo".


Form di ricerca

Dopo aver deciso su che raggruppamento di dati lavorare, si accede al tool vero e proprio che si presenta come una form di ricerca e una tabella che mostra i risultati. Al caricamento della pagina vengono mostrati tutti i possibili elementi duplicati presenti in Archivio per il raggruppamento scelto.

La form di ricerca è composta da due tab. Il primo è intitolato Tutti, perché prende in considerazione tutti i possibili duplicati presenti in Archivio. Il secondo si intitola Cerca per ID e permette di cercare specifici item per effettuarne il confronto.

Tab Cerca per ID

Cliccando su questo tab si accede alla form di ricerca diretta per identificativo. In questo modo è possibile confrontare dei prodotti che non sono considerati potenziali duplicati dal sistema.

...


Per utilizzare questa form occorre inserire gli identificativi di due o più prodotti all'interno della form separati da una virgola (,) e quindi cliccare su Confronta. In questo modo si accede alla form di confronto di prodotti.

Tab Tutti



Warning
titleNOTA
 Ulteriori dettagli sull'utilizzo di questi valori sono forniti nei capitoli successivi, per cui si consiglia una lettura completa della presente guida.

...

Warning
titleNOTA
Il filtro Escludi dal titolo parole comuni di default è configurato per escludere le parole Introduzione o Prefazione. È possibile modificare la lista di parole da escludere a seconda delle proprie esigenze. Per farlo occorre far pervenire una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal in cui sono indicate le parole da utilizzare.


Tabella dei risultati

Quando si accede ad un raggruppamento del tool di deduplicazione, o dopo aver effettuato una ricerca attraverso la form, vengono visualizzati i gruppi di potenziali prodotti duplicati presenti in archivio. Ciascun gruppo può essere composto da due o più item. Per facilitare gli utenti nell'attività di deduplicazione è stata introdotta una preview rispetto agli identificati esterni dei prodotti. Per identificativi esterni si intendono gli identificativi bibliografici dei prodotti. All'interno di questo tool sono considerati i seguenti identificativi bibliografici:

...

Note

Nella tabella di confronto item sono presenti anche le informazioni relative allo stato di invio a LoginMIUR,

utili ai fini della scelta del miglior prodotto in fase di fusione. 

Le informazioni nel dettaglio sono: 

  • Item id: id pubblicazione 
  • Codice: codice della risposta della sincronizzazione verso sitodocente 
  • Stato: stato della risposta della sincronizzazione verso sitodocente 
  • Messaggio: messaggio della risposta della sincronizzazione verso sitodocente 
  • Sync: stato della pubblicazione sulla sincronizzazione verso sitodocente 
  • Data: data della sincronizzazione 
  • Autori con invio disabilitato: elenco degli autori che hanno deciso di non inviare la pubblicazione 
  • Fulltext: stato dell'invio dei fulltext 
  • Tipologia: tipologia miur



Significato dei risultati mostrati

I risultati ottenuti dalla ricerca di potenziali duplicati sono raggruppati secondo il metadato su cui è stata individuata la duplicazione.

Intestazione

Per ciascun gruppo questa informazione è visualizzata nell'intestazione che indica il valore del metadato per cui il gruppo di item risultano duplicati (titolo, DOI, ISBN e PubMedID) e il numero di item che appartengono al gruppo.

Dettaglio prodotto

Per ciascun item appartenente al gruppo di duplicati sono visualizzate le informazioni principali. Cliccando sull'identificativo interno del prodotto (Item ID) si accede al dettaglio del prodotto.



Azioni

Infine, è presente un pannello di azioni composto dai seguenti bottoni:

...

Deseleziona tutti: In presenza di un gruppo di duplicati maggiore di due item, permette di deselezionare tutti gli item proposti;

Gruppi di 3 o più prodotti – scelta del target

Nel caso il sistema abbia rilevato una possibile duplicazione su un gruppo di tre o più prodotti, la scelta del target viene vincolata ai prodotti che si decide di confrontare.

...


Cliccando su Annulla Target, si può annullare la selezione corrente e procedere con una nuova.


Visione Dipartimentale

Premessa: Le afferenze dei prodotti rispecchiano le afferenze degli autori interni riconosciuti. Se un prodotto ha due autori interni e il primo autore afferisce al Dipartimento di Chimica e il secondo al Dipartimento di Fisica, allora il prodotto appartiene a entrambi i Dipartimenti.

...

Francesca Neri non potrà gestire questo gruppo di prodotti per che il Prodotto 2 ha come autore interno Gianni Verdi che non afferisce al Dipartimento di Fisica.

Confronto di prodotti

Dopo aver selezionato due o più potenziali duplicati, cliccando sul tasto Confronta si accede alla form di deuplicazione vera e propria. Come esempio prenderemo in considerazione due prodotti duplicati sul titolo. Il prodotto 67890 verrà scelto come target.

...


La form è composta da una parte iniziale in cui sono presentati i dati principali dei prodotti che si sta confrontando, una pulsantiera per eseguire le varie azioni e una form che permette di confrontare ciascun metadato dei prodotti che si sta confrontando, al fine di valutare le differenze e decidere quale tenere o quale scartare.

Riepilogo prodotti da confrontare

La form di confronto dei prodotti ha una parte iniziale in cui vengono mostrati i dati principali dei prodotti su cui si sta lavorando.
Il primo prodotto è quello scelto come target. È contraddistinto dall'identificativo colorato di azzurro.
Gli altri prodotti (nel nostro caso solo uno) sono quelli che verranno eliminati al termine del confronto e sono contraddistinti dall'identificativo di colore grigio.


Prodotti riaperti

Un caso particolare è rappresentato dal confronto di prodotti di cui almeno uno è in stato Riaperto.

...

Quando si confrontano due prodotti e viene scelto come target il prodotto che NON si trova in stato riaperto, al termine della fusione verrà cancellata solo la snapshot del prodotto riaperto. Il prodotto riaperto rimarrà in archivio, ma verrà automaticamente eliminata la snapshot ponendo il prodotto nello stato in validazione (se soggetto a worckflow di validazione) o nello stato definitivo (se non soggetto a workflow di validazione).


Pulsanti

Sotto al riepilogo dei prodotti su cui si sta lavorando, compare la pulsantiera.

...

  • Torna alla lista: permette di tornare alla form precedente, mantenendo i parametri di ricerca impostati;
  • Non sono duplicati: marca i prodotti che si sta confrontando come non duplicati;
  • Mostra/Nascondi valori: vengono mostrati nascosti i valori dei metadati dei prodotti che si sta confrontando;
  • Mostra/Nascondi oggetto finale: vengono mostrati o nascosti i metadati del prodotto target. Se si sceglie di non visualizzare i metadati del prodotto target, i metadati scartati non vengono mostrati
  • Anteprima: visualizza l'anteprima del prodotto target in base alle scelte che sono state fatte sui vari metadati. In fondo a questa form compare il pulsante Fondi per effettuare la fusione dei prodotti e il pulsante Annulla per tornare alla form di confronto;
  • Fondi: si procede alla fusione dei prodotti. Il prodotto target viene integrato con i metadati scelti dal confronto. Il prodotto non selezionato come target viene eliminato
  • Fondi e vai alla scheda: si procede alla fusione dei prodotti e si accede al dettaglio del prodotto target.

Confronto metadati

In questa sezione i metadati di ciascun prodotto sono raggruppati e messi a confronto. Per ciascun metadato viene riportato il valore, quale prodotto lo possiede e le eventuali differenze.

...

  • Mostra differenze: Viene aperta una form in cui sono evidenziate le differenze del valore del metadato che si sta confrontando. È una form particolarmente utile nel caso di stringhe lunghe, come ad esempio per gli abstract o per il titolo.
  • Elimina: permette di eliminare il metadato. In questo caso il prodotto finale non conterrà il metadato eliminato.

Mostra differenze

Cliccando sul pulsante mostra differenze, viene visualizzata una form che dettaglia le differenze presenti nel valore del metadato.

...

Infine viene mostrato il valore evidenziando la differenza tra i due prodotti.

Scelta del metadato

Se ci si trova di fronte a un metadato con valori differenti, come nel caso precedente, il sistema propone come valore di default (cioè che sarà applicato al prodotto finale) quello del prodotto target. È comunque possibile scegliere l'altro valore. Per farlo basta cliccare sul valore desiderato che verrà scambiato con quello di default.



Metadato con lo stesso valore in entrambi i prodotti

Quando un metadato ha lo stesso valore viene mostrato il valore con gli identificativi di entrambi i prodotti posti sulla stessa riga. Nel nostro caso il metadato dc.date.issued ha per entrambi i prodotti il valore 2018. In questo caso il pulsante Mostra differenze non compare ed è presente solo il pulsante Elimina.



Fusione

Quando si fondono due prodotti viene mantenuto il prodotto scelto come target. Gli altri prodotti vengono eliminati. Si accede a un prodotto eliminato viene mostrata una pagina che indica la rimozione del prodotto e presenta il link per accedere al dettaglio del prodotto mantenuto a seguito della fusione.


Messaggistica

Il funzionamento di default del tool di deduplicazione prevede l'invio di mail di notifica in base alle azioni che sono state eseguite, sia in fase di submission che attraverso l'interfaccia amministrativa.

Submission

Quando si sceglie l'opzione Crea duplicato dalla form che compare durante il censimento di un prodotto, viene inviata la seguente mail:

Messaggistica di sistema#MAIL.TEMPLATE.DEDUP_CREATE_DUPLICATE

Interfaccia Amministrativa

Quando viene effettuato il merge attraverso il tool di deduplicazione a disposizione degli amministratori, viene inviata la seguente mail:

Messaggistica di sistema#MAIL.TEMPLATE.DEDUP_MERGED_ITEM

Configurazioni possibili

La configurazione di default del tool di deduplicazione prevede che l'invio delle notifiche sia attivo per la creazione duplicato in fase di submission (MAIL.TEMPLATE.DEDUP_CREATE_DUPLICATE) e per l'avvenuta fusione attraverso l'interfaccia amministrativa (MAIL.TEMPLATE.DEDUP_MERGED_ITEM). Entrambe le mail sono spedite sia al responsabile del dato che agli autori interni del prodotto risultato dalla fusione.

...

Warning
titleNOTA

Ogni modifica deve essere fatta facendo pervenire una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal.



Mail personalizzata a tutti gli autori interni riconosciuti

È possible attivare una configurazione che permette di visualizzare un ulteriore bottone all'interno del gruppo di azioni per consentire l'invio di mail personalizzate a tutti gli autori interni riconosciuti dei prodotti.

...