La voce del padrone digitale

set 21

La voce del padrone digitale

La voce sta diventando lo strumento principale dell’interazione tra uomo e macchina in questo evo digitale contemporaneo.

All’inizio fu la parola scritta a comandare il processore. Da schermi neri e comandi verdi, da parole e radici, siamo poi passati ad abbracciare l’era delle icone, del mouse e del più intuitivo puntare e cliccare. Immagini, oggetti e gesti che sono divenuti paradigma dell’interfaccia tra uomo e macchina intelligente, che hanno costruito un mito (apple) e un creso (Microsoft). E’ stato un passaggio necessario a rendere il computer fenomeno di massa utilizzabile dal pianeta intero, e al contempo un momento rivoluzionario che ha introdotto un nuovo catalogo di semantica nella nostra vita quotidiana. La strada non era, però, conclusa; la necessità di mobilità, gli spazi costretti dei piccoli schermi, la ricerca di gesti efficienti in movimento, ha reso obsoleto persino il mouse e introdotto un serbatoio intero di gestualità manuali dirette come toccare, sfiorare, pizzicare o sfogliare e le ha rese elemento dominante della comunicazione tra uomo ed elaboratore.

Ora però le necessità stanno cambiando e, ancora una volta, trasformando il modo in cui comandiamo i nostri computer. Nelle automobili, in casa e in ufficio spesso abbiamo le mani impegnate, abbiamo bisogno di velocità e d’immediatezza nel trasferire un comando o nell’aprire un’applicazione. Per secoli abbiamo usato la voce per dominare questi ambienti, verbalizzando comandi di solito rivolti a un altro umano, comandi che oggi indirizziamo all’intelligenza artificiale e a una pletora di servizi e di oggetti connessi e intelligenti che innervano i nostri ambienti.

La crescita vertiginosa della capacità delle macchine d’imparare, determinata dalla disponibilità di capacità computazionale, ha permesso salti quantici nell’interpretazione del linguaggio naturale. Oggi un computer è in grado di interpretare con esattezza circa il 93% del nostro linguaggio naturale e, col tempo, arriva vicino alla perfezione proprio perché ha a disposizione memoria e capacità per ricordare e catalogare gli errori e i successi ottenuti. Anche il più economico dei nostri telefoni ha, infatti, accesso a una nuvola di capacità di calcolo capace d’interpretare in tempo reale tutte le lingue del mondo e di ricordare e classificare quando sbaglia e quando indovina a interpretare le nostre voci, traendo da queste esperienze regole e costanti che potrà applicare al futuro. Questi sono i fattori tecnologici indissolubilmente legati allo sviluppo che oggi ci permette di comandare le nostre case, i nostri telefoni o le nostre automobili con la voce.

Si tratta di sistemi complessi su di cui i più grandi gruppi digitali, Amazon e Alphabet in testa, stanno lavorando alacremente. Occorre però guardare in profondità, non fermarsi alla punta dell’Iceberg di piccole macchine o di gadget che oggi sono già in commercio. Echo di Amazon o Home di Google sono riproduzioni fisiche di una esperienza che può chiamare a supporto risorse d’intelligenza artificiale che solo pochi anni fa erano impensabili anche per la NASA, e di rispondere in tempo reale a comandi vocali di persone con centinaia di migliaia di accenti e vocabolari diversi, interfacciando piattaforme proprietarie ma neutre, con strumenti e servizi prodotti da ecosistemi di marchi e società terze. La complessità si annida soprattutto nel costruire un sistema capace di comandare in un’unica esperienza oggetti diversi prodotti da produttori diversi, dettando, un po come Google ha saputo fare nella ricerca, Facebook nello scambio sociale e Amazon stessa nelle piattaforme commerciali, una lingua franca che diventa rapidamente standard del comando e della comunicazione tra oggetti in casa, nelle automobili o in altri ambienti intelligenti come gli uffici. Dal sistema musicale di Sonos, alle luci connesse di Philips; dalle web camere adibite alla sorveglianza, ai termostati a comando;  dagli acquisti tramite Amazon Dash o Prime, alla programmazione non lineare in televisione, si tratta non solo di connettere i vari oggetti presenti nella casa o nell’automobile, ma di costruire un’esperienza unica di comando da parte dell’umano che la abita o la guida. Il sistema operativo, insomma, dell’internet delle cose. La voce è lo strumento principe su cui si stanno costruendo queste esperienze che per molti versi determineranno il consumo di intrattenimento o informazione nel nostro immediato futuro.

Entro a casa e, a gran voce, richiedo al mio Echo/Home che mi accenda la musica in bagno, apra l’acqua della vasca a 36 gradi, accenda il calorifero sotto il mio accappatoio; contestualmente, chiedo anche che, mentre mi spoglio, mi legga le ultime notizie relative ai Pittsburgh Steelers prese dai miei 3 blog preferiti. Se Amazon o Alphabet riusciranno a disegnare la macchina/interfaccia e l’ambiente aperto a cui tutti gli impianti si devono collegare, la sfida sarà poi combattuta sulla quota di mercato; per definizione, infatti, il sistema vincente sarà quello effettivamente adottato dal massimo numero di partner esterni, cioè, inevitabilmente, il sistema con maggiore trazione sul mercato. Ecco perché chi produce contenuti o informazione non dovrebbe star fuori da questa sfida, pena ritrovarsi, come già accaduto nel social, re-intermediato da un terzo che definisce indipendentemente la forma e la sostanza del rapporto col cliente.

Il futuro richiede all’editore una complessità distributiva del suo prodotto molto superiore a quella odierna; dall’edicola al desktop, dal mobile alle app, i social, il messaging e ora le esperienze domotiche e gli abitacoli di automobili connesse; dagli oggetti da indossare come orologi o occhiali fino ai tessuti intelligenti, il mondo iperconnesso che ci aspetta prevede consumatori abituati a usufruire di informazione ed intrattenimento in continuazione e in maniera determinata dal contesto di consumo. Pena l’irrilevanza, l’editore deve inseguire ed essere presente in ciascuno di questi momenti, e per fare questo deve sapere produrre e impacchettare il proprio prodotto in maniera efficace per le diverse esperienze, le diverse interfacce e i diversi modelli di business che questo tipo di consumo frammentato richiede. Il costo di questo sforzo è alto soprattutto per un’industria già in crisi di fatturati e profitti, da sempre vittima e non carnefice di chi la tecnologia la disegna o la produce, di chi crea le piattaforme di distribuzione digitale. Forti di questa debolezza che nasce dalle scelte organizzative e di investimento dei grandi editori e che accomuna la carta stampata alla televisione e alla radio, i grandi gruppi digitali hanno fatto monopolio delle risorse e delle intelligenze necessarie a definire le chiavi semantiche (tornando alla voce) e le piattaforme d’interscambio che domineranno le nostre esperienze di consumo nei prossimi anni.

Come la mucca che guarda il treno passare, gli editori – a corto di risorse e di talento – stanno ancora una volta ritagliandosi un ruolo da spettatore nell’innovazione che sta andando a definire i canoni e le liturgie di consumo del loro prodotti per i prossimi 15 anni. Alla fine, ancora una volta, quando della crescente domanda di informazione vedranno tornare al loro tavolo solo le briciole di valore, non potranno che guardare colpevolmente a loro stessi e alle loro scelte strategiche.

 

 

 

 

Share Button

Leave a Reply

L'indirizzo email non verrà pubblicato. I campi obbligatori sono contrassegnati *

È possibile utilizzare questi tag ed attributi XHTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>