Analisi de-strutturate
In questi giorni di quarantena il Tempo, come siamo soliti concepirlo, non manca…ho deciso quindi di dedicarne un po’ per un breve Articolo o, più semplicemente, per riportarvi la mia Esperienza su un particolare Argomento che mi appassiona ed affascina.
Parliamo tutti spesso di Analisi, Grafici, Trend e normalmente quando lo facciamo ci riferiamo a Dati ben Strutturati vale a dire, in una parola, Numeri o comunque Informazioni ben definite all’interno di una “Tabella”. L’analisi è in modo naturale associata al Concetto di Misurazione, di Confronto. Sicuramente tutti in questi giorni, anche chi per Professione è magari meno abituato, siamo continuamente chiamati a confrontarci con i Numeri ed a comprenderli.
Normalmente, o almeno più frequentemente, quando pensiamo ad un’Analisi i concetti che associamo a questa sono le Strutture che per anni abbiamo utilizzato per Memorizzare le Informazioni. E’ sufficiente pensare ai classici fogli Excel, ai file CSV, alle Tabelle che popolano i nostri Database siano questi aziendali, pubblici..
Se vi dicessi che Informazioni rilevanti, spesso molto utili al Business, possono invece essere estratte anche altre fonti come per esempio immagini, documenti, scansioni, post o commenti? Bene da qui in poi vi racconterò cosa possiamo Realizzare ad oggi, riportandovi qualche esempio che possa liberare la vostra fantasia ai possibili scenari di applicazione ed utilizzo nella vostra Azienda.
Prendiamo come esempio l’Analisi di un’Immagine.
Alcune delle prime domande che possono sorgere sono:
- Quali informazioni contiene?
- Che tipo di soggetti e/o oggetti raffigura?
- É presente del testo? Se si posso estrarlo ed elaborarlo? Posso comprenderlo?
ed ancora:
- Come posso creare Grafici e Cruscotti per analizzarla o semplicemente estrapolarne qualche Informazione che non sia strettamente legata alla nostra interpretazione umana?
- Può aggiungere Valore ai miei processi l’integrazione di queste informazioni?
Per farlo dobbiamo cambiare “punto di vista” e abbandonare il rigido concetto di Tabella dove righe e colonne sono utilissime per memorizzare informazioni ben strutturate ma per un’immagine no, almeno non inizialmente.
Partiamo pensando che un’immagine è una Matrice di Pixel, caratterizzata da un susseguirsi di colori oppure, introducendo una qualche forma di Intelligenza, possiamo considerarla una composizione di Oggetti Reali e/o Astratti.
Ecco quindi che l’elaborazione “classica” evolve e diventa “interpretazione“. Si dobbiamo interpretare il Contenuto e gestire l’incertezza intrinseca di qualcosa che è meno definito.
Il paradigma di Analisi cambia radicalmente perché trattare Numeri, per quanto complesso possa essere, è pur sempre trattare qualcosa a cui siamo più abituati ma interpretare Forme, Colori, Testi (ahimè con possibili errori ortografici) e tutt’altro.
I primi passi sono quelli di avere un Campione che possa rappresentare con buona approssimazione le Casistiche che dovremo andare a gestire (il training del nostro sistema) e decidere che tipo di informazioni desideriamo ottenere.
Supponiamo per esempio di voler stabilire il Grado di Somiglianza tra due o più immagini: dovremo comprenderne e interpretarne Contenuti, ma anche analizzare le forme dei diversi oggetti, la loro disposizione… A cosa potrebbe servire?
Per esempio potrebbe essere un Valido Strumento per prevenire delle Frodi sulle prove di Acquisto o Garanzie o ancora per individuare l’utilizzo illecito di Marchi, loghi… coperti da copyright!
E se queste informazioni venissero integrate sul vostro CRM?
Ecco come potrebbero beneficiarne i vostri processi.
Oggi esistono moltissimi scenari e possibili Soluzioni, vi basta fare una rapida Ricerca sul Web per scoprire che la Quantità di Dati non strutturati, generata negli ultimi 10 anni, sta crescendo in modo esponenziale e molto più velocemente rispetto a quelli strutturati.
Forse non dovremo solo cambiare abitudini per via “dell’imprevedibile covid” ma anche per comprendere che ormai molte delle Informazioni Utili al nostro Business non risiedono più solo nei Classici Database.
Sayed S.