Data Management
Conoscere i dati in proprio possesso è il primo fondamentale passaggio per poter condurre su di essi analisi corrette ed efficaci. Per questo motivo TabulaeX concentra una grande parte del proprio sforzo nella definizione e nella comprensione dei modelli dei dati e dei processi che coinvolgono il loro caricamento ed il loro trattamento.
Definizione dei modelli relazionali dei dati
Prima di operare sui dati per migliorare il loro apporto informativo o più semplicemente per caricarli è necessario conoscere e formalizzare il modello alla loro base e il processo che porta alla loro definizione. Un corretto approccio di modellizzazione dei fenomeni e delle strutture su cui essi si basano favorisce i successivi processi di messa in qualità e rappresenta anzi esso stesso il primo passaggio in questa direzione.
Caricamento dei dati
Le soluzioni adottate da TabulaeX consentono di interfacciarsi con tutte i formati più diffusi in cui i dati possono essere presenti sul mercato e gestirne il caricamento in modalità one shot o in modalità schedulata.
- Flat file in formato testo o nei principali formati proposti dai software di produttività individuale
- File in formato XML per mezzo della predisposizione di appositi parser testuali
- Database aziendali di tutti i principali fornitori presenti sul mercato
Nell’ottica di innovazione che caratterizza l’offerta di TabulaeX è anche possibile predisporre strumenti in grado non solo di caricare informazione, ma di strutturare e caricare informazione a partire da formati naturalmente destrutturati come testi liberi e documenti, consentendo di creare o gestire informazione anche là dove si presenti in una forma non immediatamente analizzabile.
Trattamento dei dati
La messa in qualità e il trattamento dei dati consentono di disporre di informazioni corrette e puntuali per favorire le successive fasi di analisi. Le metodologie applicate da TabulaeX permettono di:
- Definire i processi di trattamenti in formato visuale e progettare il corretto flusso informativo a partire dalle sorgenti fino alle strutture di analisi
- Definire lo stato di qualità dei dati prima e dopo il trattamento per mezzo di strumenti automatizzati di profiling delle informazioni
- Integrare nei processi di trattamento dei dati il loro caricamento, la loro interpretazione ed il mapping sulle strutture di analisi
- Utilizzare i più diffusi componenti di filtro, aggregazione, combinazione e calcolo
- Personalizzare i processi con componenti ad hoc rispondenti ad esigenze complesse andando così oltre i classici strumenti di estrazione
- Integrare le informazioni provenienti da diverse sorgenti predisponendo nel contempo un modello dati integrato che valorizzi le informazioni esclusive di ciascuna fonte combinandole a quelle provenienti da altre sorgenti
- Aumentare a qualità delle informazioni per mezzo di processi pulizia che utilizzano le principali metodologie di database bashing e che possono risolvere eventuali conflitti informativi derivanti della presenza dello stesso dato in ambiti differenti
- Normalizzare le informazioni denormalizzate per mezzo di algoritmi e attingendo ad informazioni proveniente da archivi di riferimento, stradari e nomari



