Il ruolo dell’Intelligenza Artificiale nelle reti di prossima generazione

Il ruolo dell’Intelligenza Artificiale nelle reti di prossima generazione
 

Il ruolo dell’Intelligenza Artificiale nelle reti di prossima generazione

 

Gli Operatori di telecomunicazione, fortemente coinvolti nel processo di evoluzione e trasformazione delle proprie reti in ottica 5G, devono affrontare una doppia sfida: la crescente complessità tecnologica e la sostenibilità del business. Appare evidente come gli attuali processi e le procedure appaiano limitati sia in termini di efficacia che di efficienza e, conseguentemente, quanto sia indispensabile progettare e realizzare le nuove reti con funzionalità native di automazione ed auto-organizzazione: la convergenza delle tecniche di intelligenza artificiale e di analisi dei dati possono dare un contributo per il soddisfacimento di questi requisiti.

 

Introduzione

Gli Operatori di telecomunicazione sono fortemente coinvolti nel dispiegamento delle reti di 5° generazione (5G) che non solo garantiscono miglioramenti prestazionali, a fronte di un contenimento dei costi, ma che, al contempo, implicano anche un significativo aumento della complessità tecnologica e, conseguentemente, operativa.
La complessità di cui parliamo ha, almeno, due dimensioni: la prima è relativa al disaccoppiamento delle architetture hardware e software, mentre la seconda attiene alla pervasività del 5G.
In particolare, la prima dimensione è soprattutto legata al livello di sofisticazione ed eterogeneità delle tecnologie impiegate (es. Software Defined Networking, Network Function Virtualization, Cloud ed Edge Computing) per garantire che le nuove reti siano in grado di offrire servizi secondo le prestazioni e la qualità richieste dalle molteplici applicazioni settoriali (es. ICT, manufacturing, transportation, media, robotics, ecc..).
La seconda dimensione, relativa alla pervasività del 5G, è anche determinata dalla quantità ed all’eterogeneità dei devices che potranno essere connessi grazie all’aumento delle capacità prestazionali della rete: sensori ed IoT (Internet of Things) (potranno beneficiare di connessioni ad Internet più convenienti, visori di Augmented / Virtual Reality potranno garantire un’adeguata user-experience, i veicoli (es. auto, droni) disporranno di connessioni veloci ed affidabili.
Ciascuno dei citati dispositivi hanno stringenti requisiti prestazionali e le reti di nuova generazione dovranno essere talmente flessibili e programmabili da poterne garantire dinamicamente il soddisfacimento, in funzione delle reali condizioni trasmissive (ad es. radio) e delle caratteristiche e dei volumi di traffico, nel rispetto dei requisiti di sicurezza e privacy.
Le attuali reti sono state progettate ed esercite da esperti che, basandosi sulle proprie competenze relative all’architettura e alle topologie della rete, ai modelli di utilizzo delle risorse ed ai modelli di propagazione radio, progettano e configurano le politiche di gestione e controllo della rete. Tuttavia, con le reti “virtualizzate” di nuova generazione aumenta l’articolazione delle nuove architetture hardware e software e delle topologie di rete, i modelli di utilizzo diventano più dinamici, meno deterministici, così come aumenta la complessità dell’ottimizzazione dei parametri radio.
In pratica, le reti di nuova generazione, quali ad esempio il 5G, raggiungeranno un livello di complessità talmente elevato da non poter essere controllato unicamente dall’uomo: la creazione, l’esercizio e la manutenzione richiederanno, infatti, un elevato livello di automazione ed auto-organizzazione intrinseco a tali sistemi. L’Intelligenza Artificiale (IA nel seguito) avrà un ruolo fondamentale in tale evoluzione, come testimoniato dalle numerose iniziative di impiego da parte degli Operatori di telecomunicazione a livello mondiale.
L’automazione dei processi di creazione e gestione delle reti è da decenni un obiettivo chiave degli Operatori che, a tal proposito, hanno definito standard, architetture e soluzioni basati su conoscenze e regole deterministiche e statiche. Le nuove tecnologie di IA e di analisi dei big data consentono ora un’innovazione dirompente: l’abbandono dei sistemi “pre-programmati” a favore dell’adozione di soluzioni in grado di apprendere, attuare e modificare dinamicamente ed autonomamente le proprie regole di funzionamento (“self-learn”, “self-evolve”).

 

L’Intelligenza Artificiale abilita l’automazione dei processi operativi degli Operatori di telecomunicazione

Una nostra recente analisi [1] mostra come gli Operatori di telecomunicazione siano particolarmente attivi nella realizzazione di applicazioni di IA finalizzate all’automazione delle interazioni con i propri clienti sviluppando (o specializzando soluzioni di mercato) “chatbot” ed “assistenti intelligenti”. I primi sono programmi automatici usati come mezzo per interagire con le persone tramite mezzi testuali o vocali; i chatbot svolgono un ruolo cruciale nel servizio clienti, ove vengono utilizzati come strumento di interazione e di acquisizione di informazioni. Gli assistenti intelligenti sono degli agenti personali digitali che assistono e coadiuvano le persone nelle proprie attività quotidiane come, ad esempio, nella pianificazione di un appuntamento, nella lettura o scrittura di messaggi o nel controllo di oggetti intelligenti (ad esempio nella smart home).
Un altro ambito di applicazione dell’IA è relativo all’automazione ed ottimizzazione delle reti di telecomunicazione ed è proprio in questo ambito che ci si attendono i maggiori benefici, in particolar modo per le reti di nuova generazione.
L’impiego di tecniche di IA e di analisi dei big data, infatti, possono abilitare funzionalità predittive (predictive analytics), ad esempio, negli ambiti della sicurezza, della gestione delle frodi e della gestione del traffico e delle interferenze radio a supporto dei processi di pianificazione e sviluppo della rete.
L’IA diventa particolarmente importante per l’automazione dei processi operativi relativi alle nuove reti abilitando funzionalità di auto-apprendimento (“self-learning”) e di adattamento dinamico (“adaptive networks”) delle configurazioni di rete in funzione dei requisiti dei device (e relative applicazioni) e delle condizioni operative (es. radio, caratteristiche del traffico).
Inoltre, l’applicazione delle tecniche di IA è indispensabile per l’automazione delle funzionalità di orchestrazione delle nuove reti “softwarizzate”, ove le “VNF” (Virtual Network Function) sono dinamicamente composte, attivate e disattivate con volumi e velocità non gestibili da operatori umani.
Grazie alla convergenza dell’IA con le tecniche di big data analytics è possibile costruire strumenti automatici che identificano e pongono rimedio a guasti e malfunzioni prima che essi compromettano le prestazioni della rete e la qualità del servizio percepita dai clienti [Figura 1].

 

Figura 1 - Le principali iniziative di applicazione dell’IA degli Operatori [1]

In sintesi, IA potrebbe aiutare gli Operatori ad affrontare tre grosse sfide tecnico-economiche:

  1. Come ottimizzare le infrastrutture di rete? Ad esempio, attraverso l’utilizzo di tecniche di IA per la pianificazione e la gestione, l’adozione di sistemi automatici di diagnosi e rilevamento di guasti ed anomalie, l’uso di metodi innovativi di “root cause analysis”.
  2. Come migliorare la user-experience? Ad esempio, utilizzando l’IA per ottimizzare la QoE, gestire in ottica predittiva il churn-rate, fornire servizi di privacy e sicurezza avanzati.
  3. Come aumentare le revenue? Ad esempio, sfruttando l’IA per abilitare anche nuovi ruoli per l’Operatore che gli consentano di massimizzare il valore dei propri assets. Un’infrastruttura pervasiva, dotata di IA, esprimerebbe la capacità di gestire la “complessità” nei più disparati contesti: smart city, Industry 4.0, ecc...

Stiamo dunque assistendo ad un rapido affermarsi della convergenza tra le tecnologie di big data analytics e di IA. Le soluzioni tecnologiche in corso di sviluppo sono volte, da una parte, a risolvere i problemi che emergono della crescente complessità delle infrastrutture di rete di telecomunicazioni e, dall’altra, a valorizzare al massimo gli asset degli Operatori di dette infrastrutture. Gli scenari applicativi e i casi d’uso sono molteplici ed includono: automazione dei processi di gestione, controllo ed orchestrazione, l’ottimizzazione automatica nell’utilizzo delle risorse, la gestione automatica dei malfunzionamenti ai diversi livelli di rete, anche in ottica predittiva. Comune a tutti questi scenari è l’utilizzo e lo sviluppo continuo (attraverso tecniche di learning) da parte della IA della cosiddetta “conoscenza” di rete, a partire dai dati raccolti sulle dinamiche di traffico e di funzionamento di apparati e sistemi di rete.

 

Scenari di applicazione dell’AI da parte degli Operatori

Un esempio di impiego dell’AI e delle tecniche di big data analytics ci viene offerto dall’Operatore sud-coreano SK Telecom per il monitoraggio in “real-time” della qualità della rete e per la gestione della “customer experience” [2]. La soluzione realizza una correlazione end-to-end dei dati raccolti dai segmenti di rete core ed accesso e dai dispositivi dei clienti (End-to-End Operational Intelligence) e suggerisce interventi operativi nel caso di degrado della qualità [Figura 2].

 

Figura 2 - End-to-End Operational Intelligence [2]

La vista end-to-end è assicurata da tre software applicativi che elaborano i dati nel proprio segmento di riferimento (APOLLO, DoD e T-PANI); ad esempio, sul segmento di rete di accesso APOLLO raccoglie i dati relativi alla qualità della rete radio ed esegue il rilevamento delle anomalie in tempo reale, l'ottimizzazione e l’attuazione delle misure proattive al fine di anticipare malfunzioni e garantire una qualità stabile. SKT utilizza tecniche di machine learning per individuare gli indicatori di prestazione della rete (KPI) e per rilevare le situazioni anomale; gli algoritmi di machine learning sono stati addestrati con dati provenienti da use cases reali validati dagli esperti di dominio.
Oltre allo scenario sopra descritto, i dati raccolti sono utilizzati in tutte le aree che coprono la progettazione, la costruzione e l’esercizio della rete di SKT. Inoltre, la selezione delle aree di investimento e la determinazione della priorità di investimento sono basate sulla correlazione di questi dati con quelli di business.
Come detto in precedenza, le nuove reti “softwarizzate” richiederanno necessariamente una piena automazione dei processi operativi. Questo requisito è stato ben compreso da AT&T che, fin dall’inizio del proprio programma di trasformazione della rete (Domain 2.0), ha individuato come strategico l’impiego delle tecnologie di big data analytics e IA. Mazin Gilbert (Vice President, Advanced Technology, AT&T Labs) ha riassunto questo obiettivo strategico con una frase intuitiva: “We think of AI as a smart way for us to do data-powered automation” e l’ha declinato in 3 passi operativi sequenziali. Il primo è la costruzione di sistemi di rete automatizzati che raccolgono dati, li analizzano e cercano di inferire alcune azioni necessarie per garantire il buon funzionamento. Il secondo passo è l’implementazione, all’edge della rete, di funzionalità di automazione basate su analitiche sofisticate e su regole “pre-programmate” per l’attuazione di interventi tempestivi in caso di malfunzionamento o criticità. Il terzo passo è l’implementazione di funzionalità di “hyper-automation” basate sull’utilizzo di tecniche ed algoritmi di IA in grado di apprendere, attuare e modificare dinamicamente ed autonomamente le regole di funzionamento della rete (“self-learn”, “self-evolve”).
Questo approccio ha condotto allo sviluppo, interno ad AT&T, della piattaforma ECOMP (Enhanced Control, Orchestration, Management & Policy) [3], contribuita da AT&T nel progetto open-source ONAP (Open Network Automation Programme) della LFN (Linux Foundation Networking). La piattaforma software ECOMP offre funzionalità per l’automazione dei processi di progettazione, creazione e gestione del ciclo di vita dei prodotti e servizi della rete softwarizzata di Domain 2.0. Dette funzionalità sono supportate da due principali framework architetturali (Figura 3):

  • Il “design time framework” che abilita la progettazione e la programmazione delle risorse, dei servizi e dei prodotti supportati dalla rete di Domain 2.0;
  • Il “runtime execution framework”, responsabile dell’esecuzione delle logiche programmate nella precedente fase di design.
 

Figura 3 - La piattaforma ECOMP di AT&T [3]

Nel runtime execution framework le componenti DCAE (Data Collection, Analytics and Events) e A&AI (Active and Available Inventory) supportano le funzionalità automatiche di controllo e gestione degli asset della rete Domain 2.0. In particolare, DCAE offre le funzionalità di data analytics: colleziona i dati relativi alle prestazioni, all’uso ed alla configurazione degli asset di rete; supporta il calcolo degli analytics; offre elementi utili per la risoluzione dei problemi e pubblica eventi, dati e analisi. Il modulo A&AI fornisce la vista in tempo reale delle risorse, servizi e prodotti e delle loro relazioni. Tutte queste informazioni, aggiornate in tempo reale, consentono ai moduli di orchestrazione e controllo di gestire dinamicamente il ciclo di vita degli asset di Domain 2.0, realizzando la cosiddetta “closed-loop automation” (Figura 4).

 

Figura 4 - Closed-loop automation [3]

La letteratura [4], [5] offre già un’ampia descrizione di interessanti casi d'utilizzo dell’IA per ottimizzare il funzionamento di una rete ottica. In particolare, NTT in [6] propone lo sviluppo e l’adozione di un sistema di raccolta dati, diagnosi e controllo automatico dello stato della rete basato su cicli procedurali CAT (Collect-Analyze-Test) (Figura 5). L’architettura prevede degli engine distribuiti (policy-driven CAT cycles) e un database centralizzato di knowledge. Gli engine policy-driven CAT sono preposti alla raccolta ed analisi dei dati generati ai vari livelli di rete, al fine di controllare dinamicamente lo stato di ciascun elemento di rete (fisico e/o logico). La conoscenza acquisita, e continuamente aggiornata, si basa sulla corrispondenza tra stati di funzionamento e pattern di dati. In particolare, le variazioni nel tempo dei dati raccolti, e quindi lo stato di un determinato elemento di rete, vengono continuamente confrontate con dei modelli di riferimento basati su FFT (Fast Fourier Transform). Lo scostamento dello stato di un elemento di rete (fisico e/o logico) rispetto il funzionamento normale, permette di identificare l’anomalia in base alle conoscenze apprese precedentemente, oppure di generare nuova conoscenza.

 

Figura 5 - Architettura gerarchica logica della piattaforma Collect-Analyze-Test [6]

La Figura 6 illustra l’architettura funzionale/di sistema della piattaforma CAT, con le interfacce di riferimento verso l’infrastruttura, i sistemi di OSS/BSS e orchestrazione e verso le funzioni di big data analytics. L’architettura logica della piattaforma prevedere istanze dei cicli CAT allocate per ogni operatore virtuale ai quali sono forniti servizi di rete virtualizzati.

 

Figura 6 - Piattaforma Collect-Analyze-Test [6]

La Figura 7, infine, illustra una PoC di NTT volta a dimostrare il funzionamento di base della piattaforma CAT. Il caso d’uso prevede un operatore di rete che fornisce servizi di rete virtualizzati (slice) a due operatori virtuali. La piattaforma CAT raccoglie ed elabora, ad esempio, continuamente i dati di traffico in entrata/uscita da/verso i nodi di rete che erogano i servizi. Ogni variazione anomala dei pattern di traffico attiva un ciclo di diagnosi automatica al fine di isolare le eventuali cause di anomalie: in primo luogo, si controlla lo stato di tutte le porte fisiche e quindi tutte le connessioni a livello di collegamento fisico; dopodiché, nel ciclo successivo, si controllano le porte ed i collegamenti a livello logico. La PoC di NTT ha dimostrato l’utilità di misurare continuamente ed elaborare anche altri parametri come la temperatura, l'umidità dell’ambiente e lo stato vibrazionale di ogni nodo/sistema di rete, in quanto informazioni che concorrono, anche in ottica predittiva, a stimare gli stati della rete.

 

Figura 7 - NTT PoC [6]

Conclusioni

La complessità delle reti di nuova generazione, come il 5G, richiederà un nuovo approccio per i processi di gestione, controllo ed orchestrazione di rete. I fattori chiave evolutivi sono infatti: il disaccoppiamento delle architetture hardware e software, la pervasività della rete ed un mercato dei servizi altamente dinamico. In questi scenari, emerge l’esigenza di automatizzare i processi di rete, affiancando all’Operatore umano sistemi di IA.
Infatti, le tecnologie di IA e l’analisi dei big data da sempre trovano ambiti di applicazione molto promettenti con potenziale elevato impatto sull’automazione dei processi e delle procedure nell’ICT. Oggi il tema riguarda l’estensione di tali tecnologie alle reti di nuova generazione.
Ci sono evidenze di primi importanti passi nel percorso di adozione delle soluzioni di IA per l’automazione e l’auto-organizzazione di rete. La contestualizzazione dell’IA ai problemi ed ai requisiti specifici del 5G richiedono ulteriori raffinamenti, tuttavia gli Operatori testimoniano l’alto livello di attenzione e di attese nel settore [9].
In conclusione, come anche confermato dalla visione strategica di alcuni grandi Operatori, appaiono evidenti la centralità e la complementarietà delle tecnologie SDN, NFV, edge e cloud computing, IA e big data analytics nello sviluppo delle reti di nuova generazione.

 

Bibliografia

  1. L. Artusio et alii “Telcos’ application of Artificial Intelligence”, Telecom Italia, presentazione interna 28 maggio 2019
  2. “ATSCALE – Vision on Future Telco Infrastructure”, SK Telecom, luglio 2016
  3. “ECOMP (Enhanced Control, Orchestration, Management & Policy) Architecture”, White Paper, AT&T, 2016
  4. J. Mata, I. Miguel, R. J. Durán, N. Merayo, S. K. Singh, A. Jukan, and M. Chamania, “Artificial intelligence (AI) methods in optical networks: a comprehensive survey”, Optical Switching and Networking, vol. 28, pp. 43-57, aprile 2018
  5. D. Rafique and L. Velasco, “Machine learning for network automation: overview, architecture, and applications”, J. Opt. Commun. Netw., vol. 10, no. 10, pp. D126-D142, ottobre 2018
  6. A. Hirano, “Autonomous network diagnosis with AI” Proceedings of Optical Fiber Communications Conference, Tu2E.4, 2019
  7. A. Manzalini, domanda di brevetto TIM TEL1412 “System for managing services in Software Defined Infrastructures”
  8. Roberto Gonzalez, Filipe Manco, Alberto Garcia-Duran et alii, “Net2Vec: Deep Learning for the Network” disponibile al link arXiv:1705.03881v1 [cs.NI], 10 maggio 2017
  9. E. Damiani, A. Manzalini, “Artificial Intelligence empowering the Digital Transformation” Notiziario Tecnico n.1, anno 2018 - disponibile al link https://www.telecomitalia.com/tit/it/notiziariotecnico/edizioni-2018/n-1-2018/capitolo-10.html