Pagine Figlie


 


Contenuto




 


Introduzione


 


In base al principio di autonomia, ogni Università è libera di istituire all'interno del proprio statuto, le regole di governance del proprio Ateneo. Ma che strumenti fornire a tali organi per governare l'Ateneo? 
Nella scelta di tali strumenti deve essere preso in esame soprattutto il processo di misurazione e valutativo che ha assunto un ruolo centrale per il governo dell'Ateneo negli ultimi anni e che sta prendendo sempre più una forma definita. L'Ateneo deve poter in ogni momento avere a disposizione i principali indicatori che descrivono lo stato di salute dell'Ateneo.
Ed è per questo che, per un Ateneo, assume un'importanza strategica dotarsi di un ambiente di Business Intelligence.
Nel presente volume si vogliono descrivere gli strumenti di Business Intelligence che CINECA mette a disposizione nell'ambito della Risorse Umane.


 


Business Intelligence (BI)


 


Prima di procedere è però necessario fornire alcuni semplici elementi su concetti base quali Business Intelligence, DatawareHouse, DataMart, ODS, rimandando alla bibliografia allegata per ulteriori approfondimenti.
Il termine Business Intelligence (BI), coniato all'inizio degli anni '90 da Howard Dresner, un analista del Gartner Group, viene utilizzato per indicare un insieme di strumenti e metodologie per la raccolta e l'analisi dei datiatti a presentare i dati stessi in modo tale che sia possibile estrarne informazioni utili per gestire i processi decisionali di un'organizzazione.
Si può intuire come questa definizione, piuttosto ampia, includa varie sottocategorie tra cui anche il Data Warehousing, Data Mining.
La BI si rivolge principalmente al management (strategico, tattico, operativo) o al knowledge worker, fornendo loro gli strumenti necessari a prendere decisioni e risolvere problemi.
Un sistema di BI non è solo un sistema di reportistica, ma deve avere le seguenti caratteristiche:


 


  • Facilità d'uso: presentare i dati in un formato che sia facile da leggere e da interpretare, dove sia possibile navigare sui dati seguendo dei percorsi di analisi e che faccia un ampio uso di grafici. I nomi dei campi devono essere facilmente comprensibili dall'utente finale
  • Velocità: possibilità di trattare grandi volumi di dati con tempi di risposta quasi istantanei grazie all'uso di tecniche di modellazione, memorizzazione e indicizzazione dei dati orientate all'analisi piuttosto che all'aggiornamento dei dati.
  • Integrazione: integrare tra loro dati provenienti da fonti differenti, sia interne che esterne all'Ente. Il processo di integrazione deve essere affidabile e testato, in modo che gli utenti possano fare affidamento sui dati presenti nel DW. I dati provenienti dai sistemi gestionali devono passare attraverso un processo di pulizia (data cleansing) e certificazione.
  • Storicizzazione: mantenere la storia dei cambiamenti subiti da certi attributi selezionati, per permettere analisi storiche contestualizzate.
  • Identificazione di trend ed anomalie: gli strumenti devono facilitare l'identificazione di trend nei dati, ad esempio confrontando periodi e corsi di studio diversi. Queste operazioni sono possibili solo con l'utilizzo di strumenti interattivi che permettano di effettuare operazioni di drill down/drill up (visualizzazione dei dettagli su un certo dato) e di slice & dice (cambiamento delle dimensioni di analisi sui due assi).
  • Subject orientation: presentare i dati in modo da fornire la visione di un processo di ateneo attraversando i confini delle singole aree dei sistemi gestionali.
  • Simulazione scenari: in certi casi deve essere possibile impostare degli scenari e confrontarli poi con i valori reali ("actual")
  • Indipendenza dal reparto IT: gli strumenti di analisi e reportistica devono dare la possibilità agli utenti finali di crearsi da soli i report di cui hanno bisogno
  • Adattabilità nel tempo, intesa come la capacità di resistere alle inevitabili evoluzioni della realtà aziendale, dei sistemi operazionali e delle esigenze di analisi
  • Sicurezza: deve essere possibile controllare in maniera al tempo stesso stretta e flessibile l'accesso ai dati, che in molti casi includono informazioni altamente riservate.
  • Soprattutto, nel disegnare un sistema di BI è necessario ricordarsi che deve svolgere bene il suo compito originario, che è quello di supportare le decisioni.
  • Per quanto riguarda la scelta degli strumenti informatici per la realizzazione di un sistema di BI, CINECA ha optato per l'Open Source, utilizzando la suite Pentaho.


 


DatawareHouse (DWH)


 


Il DataWarehouse è un insieme di dati e strumenti software aventi lo scopo di prelevare i dati dai sistemi gestionali di un'azienda o da fonti esterne e di utilizzarli per effettuare vari tipi di interrogazioni a carattere generalmente statistico/analitico. Per rendere facili e veloci le interrogazioni di grandi volumi di dati, questi ultimi devono prima essere organizzati in maniera differente rispetto ai normali database operazionali (OLTP - On Line Transaction Processing).
I DataWarehouse sono generalmente basati sul modello detto dimensionale o Star Schema, ottimizzato per rispondere velocemente a interrogazioni di vario tipo.
In generale un DataWarehouse serve ad accrescere la conoscenza di certi fenomeni, che possono riguardare diverse aree di un ateneo (Segreteria Studenti, Stipendi, Contabilità….).
I processi di alimentazione e trasformazione utilizzano dati contenuti nei database operazionali (nel nostro caso le fonti sono gli ODS inerenti all'ambito Contabilità, Gestione Progetti  e Documenti Gestionali che a loro volta hanno come fonte UGOV).


 


DataMart (DM)


 


Da quanto sopra esposto, si può facilmente dedurre che, per ottenere informazioni mirate partendo da un sistema di DataWarehouse, è necessario, in alcuni casi, restringere il 'campo visivo' a unità più ridotte e specializzate. Il concetto di DataMart nasce proprio da questa visione e rappresenta un raccoglitore di dati specializzato in un particolare argomento. La progettazione di un Data Warehouse (o Enterprise Data Warehouse), parte solitamente dalla progettazione di singoli DataMart tematici (in ambito universitario, ad esempio, si è partiti dalla progettazione del Data Mart Studenti, Data Mart del Personale ecc...). I singoli DataMart vengono successivamente integrati (processo di federazione dei DataMart) per dare origine al sistema di Enterprise Data Warehouse. Detto in termini più tecnici, un DataMart è un sottoinsieme logico o fisico di un DataWarehouse di maggiori dimensioni.


 


Altre definizioni utili


 


Per chi non ha già una conoscenza degli argomenti sopra esposti, in questa sezione definiremo alcuni concetti necessari per la comprensione di quanto sarà esposto nel presente manuale.


 


Modello dati multidimensionale (Cubo)


 


Organizzazione delle informazioni orientata alle funzioni di reporting e analisi, realizzata per consentire un efficace utilizzo degli strumenti automatici di query, reporting ed analisi. Può essere realizzata fisicamente su strutture dati proprietarie (database multidimensionali) o su database relazionali attraverso una modellazione dati denominata "star-schema".


 


Metadati


 


Letteralmente "dati sui dati", è l'insieme di tutte le informazioni che riguardano l'architettura di DWH a parte i dati stessi. Si possono suddividere in
metadati di business: informazioni a supporto delle attività di analisi (es. data ultimo aggiornamento, anno accademico, corso di studi, unità organizzativa, ecc.)
metadati tecnici: informazioni a supporto dell'attività IT di gestione dell'architettura (es. algoritmi di trasformazione e aggregazione, regole di integrazione, dipendenze dei processi di alimentazione, strutture dati dei sistemi operazionali, responsabili dei sistemi, ecc.).


 


Misure o Fatti


 


Valori, generalmente numerici, utilizzati dagli utenti per la misurazione del loro business (es. Numero Iscritti, numero laureati……..).


 


Dimensioni


 


Insieme di attributi, generalmente di tipo testo, che definiscono e danno un significato alle misure (es. Tempo, anno accademico, corso di studio……...)


 


Gerarchie


 


Naturale correlazione tra attributi appartenenti alla stessa dimensione, dipendente dall'organizzazione e dalle specifiche esigenze applicative. 
Possono esistere più gerarchie all'interno della stessa dimensione.
Nei modelli dimensionali le gerarchie stabiliscono le modalità di aggregazione dei dati, ovvero delle misure.


 


Nel presente datamart NON sono state implementate gerarchie.


 


OLAP


 


Letteralmente On Line Analytical Processing, è l'insieme delle funzionalità utente che consentono di rendere "dinamica" la visualizzazione delle informazioni attraverso alcune funzionalità utente denominate drill, slice and dice, pivoting :
Drill : Funzionalità OLAP che consente di visualizzare dati a diversi livelli di dettaglio, "navigando" attraverso le gerarchie. Si parla di drill-up quando l'operazione provoca un'aggregazione delle informazioni (es. da "numero iscritti per corso di studi" a "numero iscritti per dipartimento"), drill-down quando succede il contrario.
Slice and dice o pivoting : Funzionalità OLAP che consente di ristrutturare le informazioni in modo da renderne più efficace la visualizzazione: creazione di master-detail e rotazione degli assi delle rappresentazioni a matrice.


 


Cubo


 


Struttura dati del modello multidimensionale consente una facile navigazione tra i dati su differenti prospettive e diversi livelli di aggregazione.
Il CUBO è una struttura dati costruita appositamente per analizzare le informazioni in forma dimensionale.



Caricamenti del DataMart del Personale

I caricamenti del DM personale avviene ogni notte e saranno aggiornati i dati degli ultimi due anni. La novità di questa versione sarà quella di avere a dispsozione i dati anche del mese in corso e non solo dei mesi pregressi come avveniva nelle versioni precedenti.

Il caricamento del mese incorso riguarderà sia i dati giuridici sia i dati stipendiali ove vi siano (Se i dati stipendiali del mese non sono ancora disponibili ovviamente questi non potranno essere caricati). In questo modo il dato disponibile ricaricato sarà sempre aggiornato con tutti gli eventi inseriti.



 



  • No labels