Page tree

Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

 

È possibile accedere alla funzionalità di deduplicazione dal menu a sinistra Prodotti -> Tool di manutenzione -> Deduplicazione, cerchiato in rosso nella figura sotto.

La pagina presenta due tab: "Tutti" e "Escludi verificati". Nel secondo tab "Escludi verificati" vengono elencati solo i duplicati non ancora confrontati, da ricercarsi con la funzione di Confronta ItemId, che serve a mostrare i duplicati che non sono stati trovati automaticamente dal sistema, ma che è l'utente a chiedere di confrontare, selezionandoli con l'ID.

Dalla versione di IRIS 15.10.01.00, è stata introdotta una maschera di ricerca nella pagina principale, che permette di filtrare i risultati in base a Titolo, Id prodotto, DOI, Data di pubblicazione, Data di inserimento, Handle, Dipartimento, Autore interno.

...

 

La prima voce, il menu a tendina "Tra quali prodotti cercare", consente di scegliere se effettuare la ricerca tra tutti i potenziali duplicati dell'archivio, oppure restringere il campo di ricerca ai soli prodotti che non sono stati segnalati segnalati come duplicati da un operatore in fase di submission. Per farlo occorre scegliere la voce "Escludi verificati".  In fase di submission di un item esistono alcuni casi di sospetto duplicato. Al verificarsi di questi casi il sistema mostra un popup nel quale richiede all'utente di indicare per ognuno degli item "simili" se sia un duplicato oppure no. Quando si sceglie no gli item vengono segnalati come non duplicati (vedi Inserimento nuovo prodotto#Autoriconoscimentoautori).

La seconda voce, ossia la tendina "Ricerca per", permette di scegliere il metadato in base al quale due prodotti vengono considerati l'uno il duplicato dell'altro (Titolo, DOI, ISBN, PubmedID). Se ad esempio si sceglie il Confronto per Titolo, vengono mostrati gli item i cui titoli devono essere esattamente uguali (viene confrontato l'MD5 dei titoli).

Image Removed

Attraverso gli altri filtri a disposizione è possibile raffinare la ricerca che si sta effettuando. Se ad esempio si aggiunge come data di inserimento il range   - , verranno cercati i potenziali prodotti che hanno lo stesso titolo, inseriti tra il   e il . Cliccando poi sul tarsto Cerca il sistema esegue la ricerca desiderata.

Image Removed

I risulati della ricerca vengono proposti come raggruppamenti di prodotti sul criterio scelto (in questo caso il titolo). Tra questi prodotti almeno uno soddisfa i criteri di ricerca scelti. Nell'esempio sottostante infatti viene mostrata una coppia di prodotti con lo stesso titolo, di cui il secondo appartiene al range di inserimento   - 

Image Removed

Il secondo tab "Check per item ID" consente di eseguire una ricerca mirata di due record di cui si vuole verificare se sono o meno duplicati. L'item ID è l'identificativo generato da IRIS per indirizzare univocamente l'item al suo interno. Per individuare gli item ID il modo più veloce è prenderlo dall'url della scheda prodotto accedendoci dal desktop prodotti nell'area riservata (se si accede alla scheda prodotto dall'area pubblica c'è l'handle la posto dell'item ID).

Image Removed

Gli id devono essereinseriti separati da virgola ",". Possono essere inseriti due o più identificativi. Cliccando sul tasto confronta viene mostrato il raggruppamento dei prodotti selezionati.

Image Removed

Una volta che si hanno a disposizione i risultati della ricerca, per ciascun ragguppamento di possibili duplicati viene data la possibilità di scegliere l'item target in fase di deduplicazione. Questo sarà l'item che verrà preso come riferimento per una possibile integrazione di metadati con i possibili duplicati, come spiegato successivamente. 

Il default è calcolato secondo l'algoritmo utilizzato finora, quindi l'item validato è prioritario sugli altri e a parità di stato viene scelto il meno recente (quello con itemId inferiore).

 

Image Removed

Leggermente differente è il funzionamento per i gruppi composti da un numero di item superiori a 2, per i quali l'utente deve esplicitamente scegliere quali item deduplicare spuntando la checkbox presente sulla sinistra. Ad esempio è possibile focalizzare l'analisi sui soli prodotti definitivi, escludendo quelli in stato di bozza.

In questo caso, i radio button per la scelta del target sono inizialmente disattivati e vengono abilitati contestualmente alla spunta della checkbox. Non potendo sapere preventivamente su quali item scegliere il target, in questo caso non viene eseguita una scelta preventiva dell'item target. Qualora poi l'utente decidesse di procedere senza aver effettuato nessuna scelta, allora apparirà un messaggio di attenzione che segnalerà la necessità di indicare un item target.

Image Removed

 

Se tra i risultati mostrati viene individuato un gruppo di prodotti che non sono duplicati, Cliccando sul tasto "Non sono duplicati" questi vengono esclusi definitivamente dal tool di deduplicazione. Viene quindi riproposta la form di ricerca iniziale.

Image Removed

 

 

...

NB: Viene mantenuto l'handle dell'item scelto come target.

È possibile confrontare anche più di due item insieme, oppure, se il sistema ha trovato più di due potenziali duplicati, scegliere i due che dovranno essere confrontati.

Cliccando su Confronta, si accede alla schermata di elenco dei metadati, come mostrato in figura sotto.

...

Nel riquadro rosso in figura si mette in evidenza un metadato per cui esistono due versioni differenti: quello con il segno di spunta in verde è il valore scelto, mentre quello con sfondo rosso e il simbolo del divieto è quello scartato. Ma l'utente cliccando sulla riga può invertire la scelta.

Il bottone "mostra differenze" evidenzia in una modal box le differenze puntuali:

...

 

Il tasto "Elimina" serve per eliminare completamente il metadato

Il bottone al centro in alto “Mostra/Nascondi valori” permette di vedere tutti i campi valorizzati (cliccandolo una seconda volta si torna alla visualizzazione completa), mentre quello accanto “Mostra/Nascondi oggetto finale” fa vedere solo l’elenco dei valori scelti, cioè quelli col segno di spunta verde. Il bottone “Fondi” unifica i due prodotti in uno solo, avente i metadati dell’oggetto finale, e riporta l’utente alla schermata iniziale.

Image Removed

Se un campo può avere più di un valore (come ad esempio il campo Autori), si seleziona singolarmente ogni riga e si decide se mantenerla o no.

Nella figura sotto entrambi gli autori sono mantenuti:

Image Removed

In quest’altro caso invece vengono entrambi scartati:

Image Removed

 

Nel caso di campo ripetuto non è più presente il bottone “Mostra differenze”. Esso sparisce anche se si stanno confrontando più di due item.

 

Sincronizzazione con Sito Docente

...

Table of Contents

Introduzione

Nella presente guida vengono illustrate le caratteristiche della funzionalità di deduplicazione.

Questo è un tool che costituisce una delle risorse principali di IRIS, perché garantisce una maggiore qualità dei dati raccolti nell'Archivio.

Il tool di deduplicazione individua prodotti simili all'interno dell'Archivio e attraverso operazioni mirate di merge consente di elevare la qualità dei dati. La deduplicazione agisce su due livelli: il primo livello riguarda il censimento dei prodotti fatto dagli utenti docenti e ricercatori, mentre il secondo più corposo è a disposizione degli amministratori dell'Archivio (o a un gruppo di persone preposte all'attività di deduplicazione) ed è il tool descritto in seguito.

Quali dati vengono controllati

Il tool di deduplicazione permette eliminare prodotti ridondanti in Archivio, individuandoli tra i prodotti già censiti o prevenendo l'inserimento di prodotti uguali. I metadati che vengono presi in considerazione al fine di determinare l'uguaglianza tra prodotti sono i seguenti:

  • Titolo
  • DOI
  • ISBN
  • PubMedID

Submission

In fase di censimento di un nuovo prodotto, quando vengono compilati i dati presi in considerazione per la deduplicazione (come titolo, DOI, ISBN e PubMedID), il sistema effettua un controllo dei dati presenti in Archivio e se trova delle corrispondenze segnala che si sta inserendo un potenziale duplicato.


Image Added


Attraverso il menu della colonna Azioni, l'utente che sta facendo la submission può decidere come operare. Le azioni possibili sono le seguenti

  • Crea duplicato
  • Non è un duplicato
  • Autoriconoscimento

Image Added


Il significato delle azioni possibili è spiegato nel seguito.

Crea duplicato

Il sistema ha correttamente individuato un prodotto in Archivio simile a quello che si sta inserendo (con lo stesso titolo, oppure DOI, ISBN, PubMedID).

L'utente che sta effettuando la submission vuole comunque creare un duplicato, quindi segnala al sistema la propria volontà cliccando sulla voce Crea duplicato.

A questo punto la form di segnalazione di potenziali duplicati scompare e il processo di submission continua normalmente.

Non è un duplicato

L'utente si accorge che il sistema sta segnalando un falso positivo, ovvero il prodotto che si sta censendo non è lo stesso trovato dal sistema in Archivio.

È possibile controllare il dettaglio del prodotto presente in Archivio (proposto come potenziale duplicato dal sistema) cliccando sulla citazione che compare nella form.


Image Added


Se si ritiene che il prodotto che si sta inserendo non è un duplicato di quello proposto dal sistema, allora occorre cliccare sul tasto Non è un duplicato. A questo punto la form di segnalazione di potenziali duplicati scompare e il processo di submission continua normalmente.


Warning
titleNOTA
 Quando si sceglie l'opzione Crea un duplicato o Non è un duplicato il sistema tiene traccia dell'azione compiuta per la gestione del tool di deduplicazione degli Amministratori descritto in seguito.

Autoriconoscimento

Se si ritiene di essere un autore non ancora riconosciuto del prodotto che il sistema propone come duplicato rispetto a quello che si sta censendo, si può effettuare direttamente l'autoriconoscimento come autore interno del prodotto cliccando sul pulsante Autoriconoscimento. Viene mostrato un alert in cui vengono fornite delle informazioni sull'azione che si sta compiendo.

Image Added


Cliccando su Conferma si accede alla form di autoriconoscimento.

Se tra i nominativi proposti a partire da quelli presenti nella stringa autori compare il proprio (e non è già associato a un autore interno) lo si può selezionare e quindi cliccando sul pulsante Conferma si procede all'inoltro della richiesta di autoriconoscimento sul prodotto.


Image Added


Se invece il proprio nominativo non campare tra la stringa autori, si può richiedere che venga aggiunto per poter procedere con l'autoriconoscimento. In questo caso occorre selezionare la voce "Non sono presente nella lista. Chiedo di essere aggiunto alla stringa autori".


Image Added

In questo modo il proprio nominativo sarà aggiunto alla stringa autori e la richiesta di autoriconoscimento sul prodotto sarà inoltrata.

In entrambi i casi si accede al dettaglio del prodotto. Comparirà l'alert di operatività limitata per ricordare sul prodotto che presenti richieste di autoriconoscimento. Queste richieste dovranno essere gestite dal responsabile del dato o dall'amministratore dell'Archivio come descritto in Nuova modalità di autoriconoscimento#Validazioneautoriconoscimento.

Cancella

Cliccando sul tasto Cancel si esce dalla submission del prodotto.

Warning
titleNOTA
È possibile fare in modo che quando si clicca sul tasto Cancel si possa proseguire la submission. In questo caso fino a quando il prodotto si trova nello stato Provvisorio/Bozza alla riapertura dello stesso viene mostrato nuovamente il popoup di deduplicazione. Per attivare questa configurazione è necessario effettuare una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing Customerportal.


Tool di deduplicazione

Questo tool è a disposizione degli amministratori dell'Archivio che operano in visione completa. Il tool è accessibile dal menu principale cliccando su Prodotti, Tool di manutenzione, Deduplicazione

Warning
titleNOTA

E' possibile fare in modo che il tool di deduplicazione sia a disposizione di utenti che operano a livello Dipartimentale. In questo modo un utente che accede in visione Dipartimentale vede gli item in cui almeno un prodotto afferisce al proprio Dipartimento. Ulteriori dettagli nel capitolo VisioneDipartimentale.

Per attivare questa configurazione è necessario effettuare una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal.


Accedendo al tool si visualizza una form iniziale in cui vengono presentati tutti i prodotti in Archivio che il sistema ha individuato come potenziali duplicati suddivisi secondo il metadato su cui è stata trovata la duplicazione e sullo stato dei prodotti. In questo modo è possibile "scartare" a prescindere alcuni prodotti che non si vuole prendere in considerazione.Il significato delle varie colonne è il seguente:

  • Tutti gli stati: vengono presi in considerazione tutti i prodotti duplicati si un determinato metadato, indipendentemente dallo stato in cui si trovano;
  • Solo definitivi/validati: vengono presi in considerazione i prodotti duplicati si un determinato metadato che si trovano in stato definitivo (prodotti che hanno concluso il proprio ciclo vita senza workflow di validazione) o in stato validato (prodotti che hanno concluso il proprio ciclo vita con workflow di validazione). In questi conteggi non sono considerati i prodotti che si trovano in stato riaperto;
  • Bozze escluse: vengono presi in considerazione i prodotti duplicati si un determinato metadato che NON si trovano in stato bozza;

Se ad esempio si vuole lavorare sui prodotti duplicati per titolo e non si vuole considerare i prodotti che si trovano nello stato di bozza, occorre clicare sul valore della colonna "Bozze escluse" per la riga "Numero totale delle pubblicazioni duplicate per Titolo".


Image Added

Form di ricerca

Dopo aver deciso su che raggruppamento di dati lavorare, si accede al tool vero e proprio che si presenta come una form di ricerca e una tabella che mostra i risultati. Al caricamento della pagina vengono mostrati tutti i possibili elementi duplicati presenti in Archivio per il raggruppamento scelto.

La form di ricerca è composta da due tab. Il primo è intitolato Tutti, perché prende in considerazione tutti i possibili duplicati presenti in Archivio. Il secondo si intitola Cerca per ID e permette di cercare specifici item per effettuarne il confronto.

Tab Cerca per ID

Cliccando su questo tab si accede alla form di ricerca diretta per identificativo. In questo modo è possibile confrontare dei prodotti che non sono considerati potenziali duplicati dal sistema.


Image Added


Per utilizzare questa form occorre inserire gli identificativi di due o più prodotti all'interno della form separati da una virgola (,) e quindi cliccare su Confronta. In questo modo si accede alla form di confronto di prodotti.

Tab Tutti


Image Added


Warning
titleNOTA
 Ulteriori dettagli sull'utilizzo di questi valori sono forniti nei capitoli successivi, per cui si consiglia una lettura completa della presente guida.


I campi di ricerca della scheda Tutti hanno il seguente significato:

  • Tra quali prodotti cercare: indica quali prodotti cercare in base alle scelte che sono state effettuate sia in fase di submission che attraverso questo tool. I possibili valori sono i seguenti:
    • Tutti: vengono presi in considerazione tutti i potenziali duplicati presenti in Archivio;
    • Escludi verificati dall'amministratore: vengono presi in considerazione solo i potenziali duplicati che non hanno ancora subito una valutazione attraverso questo tool;
    • Escludi verificati dall'utente: vengono presi in considerazione solo i potenziali duplicati che non hanno ancora subito una valutazione in fase di submission;
    • Escludi verificati dall'amministratore e dall'utente: vengono presi in considerazione solo i potenziali duplicati che che non hanno ancora subito una valutazione attraverso questo tool e non hanno ancora subito una valutazione in fase di submission;
  • Ricerca per: permette di scegliere i potenziali prodotti duplicati in base al metadato chiave su cui ha agito il sistema. Le possibili scelte sono
    • Titolo
    • DOI
    • ISBN
    • PubMedID
    • WOS
    • SCOPUS


Warning
titleNOTA

Il valore preimpostato corrisponde alla scelta fatta inizialmente sul raggruppamento su cui operare. È comunque possibile scegliere un altro valore senza tornare alla pagina iniziale.

  • Riepilogo Deduplicazione: corrisponde all'intestazione del gruppo di duplicati (vedi Significato dei risultati mostrati);
  • Id prodotto: indica l'identificativo interno del prodotto;
  • DOI: indica il DOI associato al prodotto;
  • Pubblicato dal - Pubblicato al: Indicano rispettivamente l'anno minimo e massimo di pubblicazione del prodotto;
  • Data inserimento: Dal – al: Indicano rispettivamente la data minima e massima di inserimento in Archivio del prodotto;
  • Handle: indica l'handle del prodotto
  • Dipartimento: indica il dipartimento di appartenenza di almeno uno degli autori interni riconosciuti del prodotto;
  • Autore interno: è il nominativo di almeno uno degli autori interni del prodotto;
  • Tipologia: è la tipologia del prodotto;
  • : è un menù a tendina che consente di visualizzare i prodotti da gestire in base allo stato in cui si trovano. Il menu a tendina ha i seguenti valori

    • Definitivi e validati: consente di visualizzare solo i prodotti che si trovano in stato definitivo o validato;
    • Definitifi, validati e in validazione: consente di visualizzare solo i prodotti che si trovano in stato definitivo, validato o in validazione;
    • Tutti: consente di visualizzare tutti i prodotti. È l'opzione di default;


Warning
titleNOTA
I valori WOS e SCOPUS sono disponibili all'interno del filtro Ricerca per solo per gli Atenei che hanno effettuato la sottoscrizione del servizio premium con i rispettivi editori (Elsevier e Clarivate Analytics).
Warning
titleNOTA
Il filtro Escludi dal titolo parole comuni di default è configurato per escludere le parole Introduzione o Prefazione. È possibile modificare la lista di parole da escludere a seconda delle proprie esigenze. Per farlo occorre far pervenire una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal in cui sono indicate le parole da utilizzare.


Tabella dei risultati

Quando si accede ad un raggruppamento del tool di deduplicazione, o dopo aver effettuato una ricerca attraverso la form, vengono visualizzati i gruppi di potenziali prodotti duplicati presenti in archivio. Ciascun gruppo può essere composto da due o più item. Per facilitare gli utenti nell'attività di deduplicazione è stata introdotta una preview rispetto agli identificati esterni dei prodotti. Per identificativi esterni si intendono gli identificativi bibliografici dei prodotti. All'interno di questo tool sono considerati i seguenti identificativi bibliografici:

  • DOI
  • ISI
  • Scopus
  • PubMed


A seconda di quanti identificativi esterni hanno in comune i prodotti di un gruppo di duplicati, viene attribuito uno sfondo. Il colore dello sfondo ha il seguente significato:

  • VERDE tutti gli identificativi identici
  • GIALLO uno o più identificativi diversi
  • AZZURRO un solo identificativo uguale
  • GRIGIO gli item che non hanno identificativi uguali

Image Added



Note

Nella tabella di confronto item sono presenti anche le informazioni relative allo stato di invio a LoginMIUR,

utili ai fini della scelta del miglior prodotto in fase di fusione. 

Le informazioni nel dettaglio sono: 

  • Item id: id pubblicazione 
  • Codice: codice della risposta della sincronizzazione verso sitodocente 
  • Stato: stato della risposta della sincronizzazione verso sitodocente 
  • Messaggio: messaggio della risposta della sincronizzazione verso sitodocente 
  • Sync: stato della pubblicazione sulla sincronizzazione verso sitodocente 
  • Data: data della sincronizzazione 
  • Autori con invio disabilitato: elenco degli autori che hanno deciso di non inviare la pubblicazione 
  • Fulltext: stato dell'invio dei fulltext 
  • Tipologia: tipologia miur



Significato dei risultati mostrati

I risultati ottenuti dalla ricerca di potenziali duplicati sono raggruppati secondo il metadato su cui è stata individuata la duplicazione.

Intestazione

Per ciascun gruppo questa informazione è visualizzata nell'intestazione che indica il valore del metadato per cui il gruppo di item risultano duplicati (titolo, DOI, ISBN e PubMedID) e il numero di item che appartengono al gruppo.

Dettaglio prodotto

Per ciascun item appartenente al gruppo di duplicati sono visualizzate le informazioni principali. Cliccando sull'identificativo interno del prodotto (Item ID) si accede al dettaglio del prodotto.


Image Added


Azioni

Infine, è presente un pannello di azioni composto dai seguenti bottoni:

Non sono duplicati: Se si è in presenza di un falso positivo, cliccando su questo bottone i prodotti vengono esclusi dal tool di deduplicazione;

Confronta: permette di accedere alla form di confronto di prodotti;

Target: permette di selezionare il target del confronto, ovvero quale prodotto sarà tenuto ed eventualmente integrato con i metadati del prodotto scartato;

Elimina: Permette di eliminare direttamente il prodotto. Questa azione è permanente ed ha lo stesso impatto del bottone Elimina presente nel backoffice dei prodotti;

Seleziona tutti: In presenza di un gruppo di duplicati maggiore di due item, permette di selezionare tutti gli item proposti;

Deseleziona tutti: In presenza di un gruppo di duplicati maggiore di due item, permette di deselezionare tutti gli item proposti;

Gruppi di 3 o più prodotti – scelta del target

Nel caso il sistema abbia rilevato una possibile duplicazione su un gruppo di tre o più prodotti, la scelta del target viene vincolata ai prodotti che si decide di confrontare.

In particolare, a fianco di ciascun prodotto del gruppo compare una checkbox che permette di selezionare il prodotto per il confronto.

Dopo aver selezionato due o più prodotti, se si clicca su "Non sono duplicati" il sistema continua a mostrarli, ma tiene traccia della scelta effettuata valorizzando a 1 la colonna delle operazioni effettuate.


Image Added


Se ad esempio si selezionano il primo e il terzo prodotto, si sceglie come target il terzo e si clicca su Non sono duplicati, il sistema tiene traccia dell'opzione eseguita impostando a 1 il valore delle operazioni eseguite per quei due prodotti


Image Added
Image Added


Se si selezionano nuovamente quei due prodotti e se ne sceglie uno come target, il sistema ci avverte che i due sono già stati valutati come non duplicati.


Image Added


Cliccando sull'icona delle operazioni eseguite di uno dei due, viene visualizzata una form che indica il dettaglio dell'operazione eseguita.

In questo caso, cliccando sul bottone operazioni eseguite per il prodotto 67890, la form riporta che in data il prodotto è stato confrontato con il prodotto 12345 dall'utente Amministratore.


Image Added


Cliccando su Annulla Target, si può annullare la selezione corrente e procedere con una nuova.


Visione Dipartimentale

Premessa: Le afferenze dei prodotti rispecchiano le afferenze degli autori interni riconosciuti. Se un prodotto ha due autori interni e il primo autore afferisce al Dipartimento di Chimica e il secondo al Dipartimento di Fisica, allora il prodotto appartiene a entrambi i Dipartimenti.

Nel caso in cui vi siano degli utenti preposti alla deduplicazione che operano in Visione Dipartimentale, occorre tenere presente che questi potranno operare solo sui prodotti che si riferiscono al proprio Dipartimento. Se in un gruppo di prodotti da confrontare è presente un prodotto che ha almeno un autore interno non afferente al Dipartimento dell'utente che sta operando in Visione Dipartimentale, allora il sistema inibisce il confronto inserendo un messaggio nell'intestazione del gruppo.

Warning
titleNOTA
Gli amministratori dell'Archivio possono modificare il testo del messaggio attraverso il tool di gestione delle etichette utilizzando come chiave jsp.tools.deduplicate.disable.merge.department.authority. Ulteriori dettagli sono presenti nella guida Gestione delle etichette



Image Added


Il confronto del gruppo di prodotti potrà essere fatto dall'amministratore dell'Archivio operando in visione completa.


ESEMPIO:


Francesca Neri è Superuser per Dipartimento di Fisica e opera in visione Dipartimentale:

Gruppo di due prodotti potenziali duplicati:

Prodotto 1

    • Mario Rossi afferente al Diaprtimento di Fisica;

Prodotto 2

    • Roberta Bianchi afferente al Dipartimento di Fisica;
    • Gianni Verdi afferente al Dipartimento di Matematica;

Francesca Neri non potrà gestire questo gruppo di prodotti per che il Prodotto 2 ha come autore interno Gianni Verdi che non afferisce al Dipartimento di Fisica.

Confronto di prodotti

Dopo aver selezionato due o più potenziali duplicati, cliccando sul tasto Confronta si accede alla form di deuplicazione vera e propria. Come esempio prenderemo in considerazione due prodotti duplicati sul titolo. Il prodotto 67890 verrà scelto come target.


Image Added


La form è composta da una parte iniziale in cui sono presentati i dati principali dei prodotti che si sta confrontando, una pulsantiera per eseguire le varie azioni e una form che permette di confrontare ciascun metadato dei prodotti che si sta confrontando, al fine di valutare le differenze e decidere quale tenere o quale scartare.

Riepilogo prodotti da confrontare

La form di confronto dei prodotti ha una parte iniziale in cui vengono mostrati i dati principali dei prodotti su cui si sta lavorando.
Il primo prodotto è quello scelto come target. È contraddistinto dall'identificativo colorato di azzurro.
Gli altri prodotti (nel nostro caso solo uno) sono quelli che verranno eliminati al termine del confronto e sono contraddistinti dall'identificativo di colore grigio.

Image Added


Prodotti riaperti

Un caso particolare è rappresentato dal confronto di prodotti di cui almeno uno è in stato Riaperto.

Quando un prodotto viene riaperto, viene creata una snapshot, ossia una copia temporanea. Questa copia rimane attiva fino a quando non viene terminata la sua modifica (cioè non si è concluso nuovamente il censimento del prodotto). In questi casi compare un messaggio che avverte che si sta operando su prodotti riaperti.


Image Added


Quando si confrontano due prodotti e viene scelto come target il prodotto che NON si trova in stato riaperto, al termine della fusione verrà cancellata solo la snapshot del prodotto riaperto. Il prodotto riaperto rimarrà in archivio, ma verrà automaticamente eliminata la snapshot ponendo il prodotto nello stato in validazione (se soggetto a worckflow di validazione) o nello stato definitivo (se non soggetto a workflow di validazione).


Pulsanti

Sotto al riepilogo dei prodotti su cui si sta lavorando, compare la pulsantiera.


Image Added


I pulsanti servono per eseguire le seguenti azioni:

  • Torna alla lista: permette di tornare alla form precedente, mantenendo i parametri di ricerca impostati;
  • Non sono duplicati: marca i prodotti che si sta confrontando come non duplicati;
  • Mostra/Nascondi valori: vengono mostrati nascosti i valori dei metadati dei prodotti che si sta confrontando;
  • Mostra/Nascondi oggetto finale: vengono mostrati o nascosti i metadati del prodotto target. Se si sceglie di non visualizzare i metadati del prodotto target, i metadati scartati non vengono mostrati
  • Anteprima: visualizza l'anteprima del prodotto target in base alle scelte che sono state fatte sui vari metadati. In fondo a questa form compare il pulsante Fondi per effettuare la fusione dei prodotti e il pulsante Annulla per tornare alla form di confronto;
  • Fondi: si procede alla fusione dei prodotti. Il prodotto target viene integrato con i metadati scelti dal confronto. Il prodotto non selezionato come target viene eliminato
  • Fondi e vai alla scheda: si procede alla fusione dei prodotti e si accede al dettaglio del prodotto target.

Confronto metadati

In questa sezione i metadati di ciascun prodotto sono raggruppati e messi a confronto. Per ciascun metadato viene riportato il valore, quale prodotto lo possiede e le eventuali differenze.


Image Added


Nell'immagine di esempio, nell'intestazione vengono riportate l'etichetta e il metadato che si sta analizzando. Nel nostro caso l'etichetta è "Titolo", mentre il metadato è dc.title.

Nella prima riga viene mostrato il valore del prodotto target. Nel nostro caso il prodotto è il 67890 e il valore del metadato è "Prova tool di deduplicazione". Essendo il prodotto target, questo è il valore che viene scelto di default come valore del prodotto finale e per questo motivo è evidenziato in verde e al suo fianco ha l'icona di una spunta verde.

Nella seconda riga viene mostrato il valore del prodotto da scartare. Nel nostro caso il prodotto è il 12345 e il valore del metadato è "Prova del tool di deduplicazione". Il valore del prodotto da scartare è evidenziato in rosso e al suo fianco ha l'icona di un divieto rosso.

A fianco dell'intestazione ci sono due pulsanti che permettono di eseguire le seguenti azioni:

  • Mostra differenze: Viene aperta una form in cui sono evidenziate le differenze del valore del metadato che si sta confrontando. È una form particolarmente utile nel caso di stringhe lunghe, come ad esempio per gli abstract o per il titolo.
  • Elimina: permette di eliminare il metadato. In questo caso il prodotto finale non conterrà il metadato eliminato.

Mostra differenze

Cliccando sul pulsante mostra differenze, viene visualizzata una form che dettaglia le differenze presenti nel valore del metadato.


Image Added


Nella prima riga viene riportato il valore del metadato del prodotto da scartare, contraddistinto dal colore rosso.

Nella seconda riga viene mostrato il valore del metadato del prodotto scelto come target, contraddistinto dal colore verde.

Infine viene mostrato il valore evidenziando la differenza tra i due prodotti.

Scelta del metadato

Se ci si trova di fronte a un metadato con valori differenti, come nel caso precedente, il sistema propone come valore di default (cioè che sarà applicato al prodotto finale) quello del prodotto target. È comunque possibile scegliere l'altro valore. Per farlo basta cliccare sul valore desiderato che verrà scambiato con quello di default.


Image Added


Metadato con lo stesso valore in entrambi i prodotti

Quando un metadato ha lo stesso valore viene mostrato il valore con gli identificativi di entrambi i prodotti posti sulla stessa riga. Nel nostro caso il metadato dc.date.issued ha per entrambi i prodotti il valore 2018. In questo caso il pulsante Mostra differenze non compare ed è presente solo il pulsante Elimina.


Image Added


Fusione

Quando si fondono due prodotti viene mantenuto il prodotto scelto come target. Gli altri prodotti vengono eliminati. Si accede a un prodotto eliminato viene mostrata una pagina che indica la rimozione del prodotto e presenta il link per accedere al dettaglio del prodotto mantenuto a seguito della fusione.

Image Added


Messaggistica

Il funzionamento di default del tool di deduplicazione prevede l'invio di mail di notifica in base alle azioni che sono state eseguite, sia in fase di submission che attraverso l'interfaccia amministrativa.

Submission

Quando si sceglie l'opzione Crea duplicato dalla form che compare durante il censimento di un prodotto, viene inviata la seguente mail:

Messaggistica di sistema#MAIL.TEMPLATE.DEDUP_CREATE_DUPLICATE

Interfaccia Amministrativa

Quando viene effettuato il merge attraverso il tool di deduplicazione a disposizione degli amministratori, viene inviata la seguente mail:

Messaggistica di sistema#MAIL.TEMPLATE.DEDUP_MERGED_ITEM

Configurazioni possibili

La configurazione di default del tool di deduplicazione prevede che l'invio delle notifiche sia attivo per la creazione duplicato in fase di submission (MAIL.TEMPLATE.DEDUP_CREATE_DUPLICATE) e per l'avvenuta fusione attraverso l'interfaccia amministrativa (MAIL.TEMPLATE.DEDUP_MERGED_ITEM). Entrambe le mail sono spedite sia al responsabile del dato che agli autori interni del prodotto risultato dalla fusione.

È possibile applicare le seguenti configurazioni al sistema di messaggistica del tool di deduplicazione:

  • Inibire l'invio della mail di notifica di creazione duplicato in fase di submission (MAIL.TEMPLATE.DEDUP_CREATE_DUPLICATE);
  • Inibire l'invio della mail di notifica di avvenuta fusione attraverso l'interfaccia amministrativa (MAIL.TEMPLATE.DEDUP_MERGED_ITEM);
  • Inibire l'invio di mail di notifica al responsabile del dato del prodotto risultato dalla fusione;
  • Inibire l'invio di mail di notifica agli autori interni riconosciuti del prodotto risultato dalla fusione;
  • Fare in modo che le mail mail di notifica vengano inviate a un indirizzo mail prestabilito (utile nel caso in Ateneo ci sia un gruppo di persone preposto alla deduplicazione);


Warning
titleNOTA

Ogni modifica deve essere fatta facendo pervenire una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal.



Mail personalizzata a tutti gli autori interni riconosciuti

È possible attivare una configurazione che permette di visualizzare un ulteriore bottone all'interno del gruppo di azioni per consentire l'invio di mail personalizzate a tutti gli autori interni riconosciuti dei prodotti.


Image Added


Warning
titleNOTA
Per attivare questa configurazione occorre fare una richiesta all'Help Desk di IRIS attraverso il sistema di ticketing customerportal.


Cliccando su questo tasto viene generata una mail gestita dal client di posta impostato nel browser. La mail ha come destinatari tutti gli autori interni riconosciuti di tutti i prodotti del gruppo di potenziali duplicati.

L'oggetto della mail è Potenziali duplicati

Il testo è il seguente

Code Block
Abbiamo rilevato un potenziale duplicato


- [Item ID Prodotto 1]:[Titolo prodotto 1] 
- [Item ID Prodotto 2]:[Titolo prodotto 2] 
- [Item ID Prodotto n]:[Titolo prodotto n] 
E' pregato di contattare il suo segretario di dipartimento e comunicargli se la pubblicazione è la stessa oppure è diversa.

Utente: [nome, cognome utente deduplicazione]
Email: [email utente deduplicazione]
Warning
titleNOTA
utente deduplicazione è l'utente che sta utilizzando il tool di deduplicazione


Essendo questa mail gestita dal client di posta di ciascun utente è possibile modificare il testo o l'oggetto a proprio piacimento prima di procedere all'invio.

Tuttavia è possibile modificare il testo di default utilizzando il tool di gestione delle etichette. Le chiavi da utilizzare e i relativi valori di default sono i seguenti:


Code Block
jsp.layout.submit.checkduplicate.email.subject = Potenziali%20duplicati
jsp.layout.submit.checkduplicate.email.bodyPart1 = Abbiamo%20rilevato%20un%20potenziale%20duplicato%0A%0A
jsp.layout.submit.checkduplicate.email.bodyPart2 =  E%27%20pregato%20di%20contattare%20il%20suo%20segretario%20di%20dipartimento%20e%20comunicargli%20se%20la%20pubblicazione%20è%20la%20stessa%20oppure%20è%20diversa%2E
jsp.layout.submit.checkduplicate.email.userFullname = Utente:
jsp.layout.submit.checkduplicate.email.userEmail = Email: