giovedì 11 giugno 2009

Datawarehouse e sistemi OLTP: differenze e analogie

"Un data warehouse è un data base relazionale subject oriented, integrato, non volatile, time variant, progettato per il supporto alle decisioni."
Un data warehouse (o DW) (magazzino di dati), è un archivio informatico contenente i dati di un'organizzazione, che consente di produrre facilmente relazioni ed analisi.
Componenti essenziali di un sistema Data warehouse risultano essere anche gli strumenti per localizzare i dati, per estrarli, trasformarli e caricarli, come pure gli strumenti per gestire un dizionario dei dati.


Una definizione ampliata comprende inoltre gli strumenti per gestire e recuperare i metadati e gli strumenti di business intelligence.
II DW rappresentano lo strumento per l’evoluzione del dato in informazione.
Dunque, secondo la definizione riportata, il DW deve essere:

  • Orientato al soggetto, il DW è orientato a temi aziendali specifici piuttosto che alle applicazioni o alle funzioni. In un DW i dati vengono archiviati in modo da essere facilmente letti o elaborati dagli utenti. L’obiettivo, quindi, non è più quello di minimizzare la ridondanza mediante la normalizzazione, ma quello di fornire dati organizzati in modo tale da favorire la produzione di informazioni;

  • Integrato: nel data warehouse confluiscono dati provenienti da più sistemi transazionali e da fonti esterne. L’obiettivo dell’integrazione può essere raggiunto mediante l’utilizzo di metodi di codifica uniformi, mediante il perseguimento di una omogeneità semantica di tutte le variabili, mediante l’utilizzo delle stesse unità di misura;

  • Variabile nel tempo: nel DW sono contenute una serie di informazioni relative alle aree di interesse che colgono la situazione relativa ad un determinato fenomeno in un determinato intervallo temporale piuttosto esteso. Ciò comporta che i dati contenuti in un DW siano aggiornati fino ad una certa data che, nella maggior parte dei casi, è antecedente a quella in cui l’utente interroga il sistema;


  • Non volatile: tale caratteristica indica la non modificabilità dei dati contenuti nel DW che consente accessi in sola lettura. Ciò comporta una semplicità di progettazione del database rispetto a quella di un’applicazione transazionale.

Il datawarehouse si inserisce all’interno degli OLAP (On Line Analytical Processing) che presentano una struttura dati costituita da poche tabelle non normalizzate e prevedono una serie di operazioni complesse, che possono coinvolgere molti dati, per il supporto alle decisioni. Tutte queste caratteristiche differenziano i datawarehouse dai sistemi OLTP (On-Line Transaction Processing) i quali non prevedono la creazione di banche dati separate dal momento che le analisi vengono effettuate direttamente sui dati di esercizio. Questa soluzione permette di avere i dati
sempre aggiornati ed evita fasi intermedie di trasformazione dei dati stessi; per la sua stessa natura, tuttavia, non è facilmente applicabile in situazioni dove la quantità di dati da analizzare sia molto elevata ed in questi casi viene generalmente preferito l'utilizzo di analisi di tipo OLAP. Tradizionale elaborazione di transazioni, le quali realizzano i processi operativi dell’azienda-ente, operazioni predefinite e relativamente semplici, coinvolgimento di un esiguo quantitativo di dati, dettaglio e
aggiornamento di questi ultimi, sono alcune delle caratteristiche rilevanti dei sistemi OLTP.

A differenza dei database OLTP (Online Transaction Processing),che hanno strutture complesse,il cui scopo è quello di acquisire volumi elevati di transazioni di modifica e aggiunta di dati, lo scopo dei datawarehouse consiste nell'organizzare grandi quantità di dati stabili per agevolare le operazioni di analisi e recupero.
I database relazionali OLTP sono ideali per la gestione di dati in evoluzione. Generalmente sono utilizzati da diversi utenti che eseguono contemporaneamente transazioni che comportano la modifica dei dati in tempo reale. Sebbene le singole richieste di dati da parte degli utenti facciano in genere riferimento a poche righe, vengono eseguite contemporaneamente molte di queste richieste.

I database OLTP sono progettati per consentire alle applicazioni transazionali di scrivere solo i dati necessari per la gestione di una singola transazione nel modo più rapido possibile.

Il Sistema Informativo Aziendale è identificabile come quel complesso di strumenti, risorse e attività che rileva in modo sistematico, elabora, scambia e archivia dati con lo scopo di produrre e distribuire le informazioni nel momento e nel luogo adatto e
alle persone che in azienda ne hanno bisogno.

I sistemi informativi aziendali svolgono tre funzioni principali:

  1. Acquisizione di dati e comunicazione
  2. Registrazione (storage) e ricerca dei dati
  3. Trattamento e reporting


La sua componente informatizzata è costituita da due categorie di strumenti per la gestione dei dati:
a) Data Base per l’elaborazione delle transazioni:sistemi che supportano in tempo reale le attività giornaliere inerenti il business dell’azienda.
b) Data Base per il Supporto alle Decisioni: sistemi di supporto alle scelte strategiche del management.

Nessun commento:

Posta un commento