Portafoglio crediti e AI: il dossier documentale

L’onboarding documentale è un momento cruciale che influisce sulla consistenza e sul valore dell’intero portafoglio. Soluzioni basate su AI e workflow documentali evoluti hanno un ruolo determinante: il sensibile aumento della qualità del corredo informativo genera significative efficienze di processo e gestione delle risorse.

di Vanes Bolandrini, Direttore Commerciale

Informazioni di qualità come strumento di conoscenza

“Il più grande nemico della conoscenza non è l’ignoranza, è l’illusione della conoscenza” è una delle citazioni più celebri di Stephen Hawking. Parafrasando questa fase, possiamo affermare che la sola presenza di una grande quantità di dati nel proprio sistema gestionale non consente di aumentare la conoscenza dei portafogli, laddove la qualità del dato non sia accuratamente verificata attraverso processi di data quality e di verifica attraverso fonti certificate: i documenti associati alle pratiche ne costituiscono senza dubbio un esempio.

Il Dossier Documentale è un aspetto fondamentale di conoscenza del proprio portafoglio, di ampliamento del corredo informativo a supporto di diversi processi, dalla due diligence fino alla gestione running del portafoglio, passando attraverso l’onboarding.

Il nostro obiettivo, in questo contesto, era rendere l’onboarding documentale più efficace ed efficiente attraverso la modellazione del processo e l’introduzione di elementi di machine learning in alcune fasi critiche e molto dispendiose in termini di intervento umano.

Machine learning per la classificazione: affidabilità ed efficienza

La completezza di un dossier documentale si può misurare sulla base di quali sono le tipologie di documento presenti rispetto a quelle attese: un processo di classificazione efficace consente pertanto di aumentare la qualità del dossier.

Il modulo realizzato da RAD Informatica prevede in primo luogo l’acquisizione dei documenti attraverso un sistema di ingestion basato su un OCR evoluto con diverse tecniche per diminuire l’impatto legato ai classici problemi legati alla qualità delle scansioni. Al termine dell’acquisizione dei dati si passa alla fase classificazione attraverso l’impiego di una rete neurale opportunamente addestrata tramite una metodologia consolidata, che prevede l’utilizzo di un training set per istruire la rete e di un validation set per verificare la bontà dei risultati.

Il motore di classificazione, così configurato, è in grado di identificare le prime tre categorie alle quali il documento appartiene e la relativa percentuale di confidenza. L’attribuzione automatica delle tipologie di documento avviene con un grado di affidabilità molto alto: il test effettuato su un set di pratiche in stock presso un nostro importante cliente, ha consentito alla rete neurale di riconoscere e classificare l’80% della documentazione con un’affidabilità media dell’85%, toccando punte del 100% nel caso di documenti dal formato standard come, per esempio, le visure catastali.

Questo processo consente di raggiungere livelli di efficienza molto elevati, che sono legati esclusivamente al dimensionamento degli elaboratori in termini di risorse: l’effetto principale è la riduzione sostanziale dell’intervento umano, limitato alle situazioni in cui l’affidabilità calcolata dall’algoritmo sia inferiore ad una soglia di sicurezza impostata.

Associazione automatica ai rapporti: come aumentare la qualità del dossier

Nell’ambito di un dossier documentale è essenziale ricondurre i documenti alle singole entità nell’ambito della pratica: esistono documenti collegati direttamente alla controparte (carta d’identità, codice fiscale, documenti di bilancio), documento associati ai rapporti (contratto di mutuo, estratto conto, documento di sintesi), oppure alle garanzie (fideiussioni, ipoteche).

Una volta classificati, i documenti vengono ricondotti alle diverse entità associate alla pratica, attraverso tecniche di Natural Language Processing e Entity Resolution, allo scopo di popolare la check list documentale, che identifica i documenti attesi per ciascuna di queste entità.

Pensiamo, ad esempio, alla necessità di ricondurre i documenti ai rapporti specifici, uno dei casi d’uso più richiesti dai nostri clienti. Il processo di attribuzione inizia con la creazione di un grafo di conoscenza, una struttura che consente di rappresentare tutte le relazioni esistenti tra le entità collegabili ad un rapporto: dati catastali, ipoteche, garanti, informazioni di dettaglio come la data di stipula del contratto, la data di scadenza, piuttosto che le rate previste nel piano di ammortamento.

Tutte queste informazioni costituiscono una matrice di ricerca all’interno di ciascun documento e, attraverso l’analisi statistica dell’occorrenza delle stringhe all’interno dei documenti, consentono di determinare la probabilità che uno specifico documento sia legato proprio al rapporto in esame. Il modulo utilizzato per la riconciliazione ai rapporti apprende in maniera autonoma ed è in grado di modificare il proprio comportamento, attraverso l’applicazione dell’algoritmo Naive Bayes.

Anche per questo caso d’uso i risultati ottenuti sono più che soddisfacenti e hanno consentito ai nostri clienti di aumentare il controllo sulla qualità del dossier, diminuendo in maniera sensibile l’intervento umano, che anche in questo contesto è limitato al completamento della checklist per tutti i casi di riconduzione dubbia.

Text mining e arricchimento informativo

Parallelamente alla fase di riconduzione ai rapporti, viene eseguito un modulo di text mining, che consente di estrarre informazioni strutturate dal testo presente nei documenti, aumentando il patrimonio informativo a supporto di ogni portafoglio. L’approccio utilizzato si basa sull’applicazione di tecniche di ruled based text mining e entity recognition per estrarre le informazioni e, successivamente, normalizzarle nell’ambito di strutture dati in linea con quanto presente nella base di dati:

dati catastali;
informazioni sulle ipoteche (data di iscrizione o scadenza);
informazioni anagrafiche dei soggetti collegati al documento;
informazioni contrattuali (data di stipula, data di scadenza).

Questi dati, estratti in maniera completamente automatica, consentono di intraprendere processi di data remediation, attraverso un confronto con le informazioni già presenti nel sistema gestionale e consentendo la loro correzione attraverso un processo guidato, fino ad arrivare ad una sovrascrittura massiva in tutti i casi nei quali le informazioni presenti sulla base dati risultano talmente incongruenti da rendere troppo onerosa una verifica puntuale delle situazioni anomale.

Gestisci tutto il workflow legato a UTP e sofferenze con EPC