Data Management

Conoscere i dati in proprio possesso è il primo fondamentale passaggio per poter condurre su di essi analisi corrette ed efficaci. Per questo motivo TabulaeX concentra una grande parte del proprio sforzo nella definizione e nella comprensione dei modelli dei dati e dei processi che coinvolgono il loro caricamento ed il loro trattamento.

Definizione dei modelli relazionali dei dati
Prima di operare sui dati per migliorare il loro apporto informativo o più semplicemente per caricarli è necessario conoscere e formalizzare il modello alla loro base e il processo che porta alla loro definizione. Un corretto approccio di modellizzazione dei fenomeni e delle strutture su cui essi si basano favorisce i successivi processi di messa in qualità e rappresenta anzi esso stesso il primo passaggio in questa direzione.

Caricamento dei dati
Le soluzioni adottate da TabulaeX consentono di interfacciarsi con tutte i formati più diffusi in cui i dati possono essere presenti sul mercato e gestirne il caricamento in modalità one shot o in modalità schedulata.

 

  • Flat file in formato testo o nei principali formati proposti dai software di produttività individuale
  • File in formato XML per mezzo della predisposizione di appositi parser testuali
  • Database aziendali di tutti i principali fornitori presenti sul mercato

 

Nell’ottica di innovazione che caratterizza l’offerta di TabulaeX è anche possibile predisporre strumenti in grado non solo di caricare informazione, ma di strutturare e caricare informazione a partire da formati naturalmente destrutturati come testi liberi e documenti, consentendo di creare o gestire informazione anche là dove si presenti in una forma non immediatamente analizzabile.

Trattamento dei dati
La messa in qualità e il trattamento dei dati consentono di disporre di informazioni corrette e puntuali per favorire le successive fasi di analisi. Le metodologie applicate da TabulaeX permettono di:

 

  • Definire i processi di trattamenti in formato visuale e progettare il corretto flusso informativo a partire dalle sorgenti fino alle strutture di analisi
  • Definire lo stato di qualità dei dati prima e dopo il trattamento per mezzo di strumenti automatizzati di profiling delle informazioni
  • Integrare nei processi di trattamento dei dati il loro caricamento, la loro interpretazione ed il mapping sulle strutture di analisi
  • Utilizzare i più diffusi componenti di filtro, aggregazione, combinazione e calcolo
  • Personalizzare i processi con componenti ad hoc rispondenti ad esigenze complesse andando così oltre i classici strumenti di estrazione
  • Integrare le informazioni provenienti da diverse sorgenti predisponendo nel contempo un modello dati integrato che valorizzi le informazioni esclusive di ciascuna fonte combinandole a quelle provenienti da altre sorgenti
  • Aumentare a qualità delle informazioni per mezzo di processi pulizia che utilizzano le principali metodologie di database bashing e che possono risolvere eventuali conflitti informativi derivanti della presenza dello stesso dato in ambiti differenti
  • Normalizzare le informazioni denormalizzate per mezzo di algoritmi e attingendo ad informazioni proveniente da archivi di riferimento, stradari e nomari