L’Insostenibile Leggerezza delle WordCloud

Le parole sono importanti. A maggior ragione lo sono quelle pronunciate davanti al Parlamento da un nuovo Presidente della Repubblica in occasione del proprio insediamento. In un momento così solenne il peso simbolico dei termini espressi chiaramente si moltiplica.

Per verificare quali siano le parole più ricorrenti in un testo o in un discorso le WordCloud sono ottimi strumenti di controllo. Si tratta di applicazioni che generano delle “forme” grafiche nelle quali i termini chiave sono rappresentati con un corpo che aumenta in funzione della frequenza con le quali si sono ripetuti. Esattamente come le parole comunque rilevanti ma apparse meno vengono rappresentante in corpo più piccolo. L’effetto finale è interessante: una “nuvola” composta in media di una cinquantina di parole con grandezze diverse e che ruota intorno a alcune chiavi principali in corpo maggiore. Quell’immagine in qualche modo dovrebbe rappresentare l’essenza, l’anima di un testo.

In rete è facile trovare le applicazioni gratuite capaci di generare un WordCloud. Le più conosciute sono Wordle e Tagxedo. A seconda del programma scelto, si possono controllare le proporzioni, il carattere da scegliere, impostare filtri di esclusione per alcuni termini, si può decidere l’inclinazione delle singole parole nella nuvola finale, il relativo colore e persino definire la forma della nuvola [rotonda, a forma di cuore, quadrata e via dicendo]. Il risultato è sempre un “oggetto” visuale che cattura l’attenzione.

Nel caso di Mattarella, i media italiani [quotidiani, tv, Ansa, siti di informazione online] hanno mostrato un certo entusiasmo verso le WordColud, come se fosse una novità straordinaria. Ne sono uscite “nuvole” in cui la parola più in evidenza è stata quasi sempre “significa”.

info mattarella

Però quello è un termine che isolato vuol dire ben poco. In realtà “significa” faceva parte di una costruzione incalzante giocata dal neo Presidente per descrivere l’idea che “Difendere la Costituzione” si deve tradurre nel garantire il diritto allo studio, nella difesa di quello al lavoro, nel sostegno alla famiglia e via dicendo fino al rifiuto di ogni forma di mafia e di illegalità. Per questo motivo “significa” è stato ripetuto ben 18 volte nel discorso pronunciato in Parlamento. Nel dire “Significa” Mattarella richiamava direttamente i valori della Costituzione.

Le WordCoud sono strumenti efficaci perché veloci ma in un certo senso approssimativi proprio perché è complesso valutare il peso di una parola estrapolandola dal contesto. Non solo, ma i programmi che generano i Clouds tendono a escludere alcuni termini, le congiunzioni giustamente, o a penalizzarne altri, gli aggettivi per esempio.

Eppure a rileggere il testo del Presidente si nota che la parola più frequente (26 volte) in realtà è stata proprio un aggettivo, “nostro” [nostro, nostra, nostri, nostre]. E non si tratta di un dettaglio da poco. Il Presidente, nei suoi riferimenti al Paese, ha volutamente evitato termini formali – solo 2 volte la parola “Patria” – per dare invece enfasi a un concetto di appartenenza, di comunità. E questo spiega l’uso di “nostro” che appare come:

– nostro paese – nostro popolo – nostro essere comunità – nostra Costituzione – nostra democrazia – nostra gente – nostra politica – nostra convivenza – nostri concittadini – nostri ragazzi – nostri tesori

Ora, nessun WordCloud è capace di riconoscere e leggere così in profondità la struttura di un discorso. E’ bene ricordarselo ogni volta che si passa al setaccio di un generatore di nuvole un testo da esaminare. I Clouds restano comunque validi strumenti per una prima verifica a caldo, ma per un approfondimento, anche di natura puramente visuale, sarebbero necessari altri interventi.

Per restare all’esempio del discorso di Mattarella nessun giornale, digitale e/ cartaceo, è riuscito a andar oltre le “nuvole”. Purtroppo. Eppure di materiale da rappresentare in termini visuali, a partire proprio dai vari Clouds, non mancava.

Tanto per fare un esempio, quale è stato il peso dei riferimenti alle Istituzioni o quelli ai valori etici rispetto al totale? Poi è mancata la comparazione coi termini più ricorrenti nei discorsi dei predecessori. Quante volte Napolitano ha citato l’Europa presentando il suo primo mandato e quante volte lo ha fatto Mattarella? Sarebbe stato interessante scoprire certi tipi di differenze.

La rincorsa generale ai WordCloud non è stato un errore. Al contrario. Neanche l’aver evidenziato la parola “significa”. Infatti nel totale del discorso di Mattarella composto da 2.274 parole, ben 351 sono state spese nel passaggio sulla difesa della Costituzione. Non poco.

Però le WordCloud, come spiegato in precedenza, vanno comunque usati con cautela. Proprio Mattarella parlando in Parlamento ha accennato, novità assoluta, alla necessità di abbattere in Italia il “digital divide”. Lo ha fatto una volta sola, quindi nessun Cloud lo ha registrato. E’ un buon motivo per considerarla una citazione irrilevante?

Ogni medium ha un suo ruolo e significato, come noto. Un conto è un tweet, o un post su Facebook, ed un altro è invece un articolo di giornale, sia esso digitale o cartaceo poco importa. Le WordCloud, lo ribadiamo ancora, vanno benissimo ci piacerebbe però che non fossero considerate solo uno dei tanti elementi visivi di contorno, come è avvenuto nel caso di Mattarella che abbiamo usato come esempio, ma che vi sia data la giusta attenzione ed accuratezza che si riserva ad ogni elemento informativo, magari corredandolo con una corretta analisi del discorso.

È questo, anche, il valore aggiunto che giornali e giornalisti possono portare al lettore che altrimenti, stante l’ampiezza di tool a disposizione, è assolutamente in grado di farsela da solo la WordCloud. L’insostenibile leggerezza delle WordCloud crediamo sia un buon esempio del giornalismo frettoloso, raffazzonato [o peggio], da evitare se si vuole ridare centralità all’informazione – di qualità – ormai sempre più traballante, unbranded e dominata dai social. Dove sta il ruolo del giornalista se non nella capacità di guidare il lettore attraverso una narrazione che in questo caso sarà di tipo grafico?

cloud mattarella

Nota metodologica: per il conteggio esatto delle parole, è stato preso il testo originale della trascrizione. Poi gli spazi bianchi tra parole sono stati sostituiti con un a capo. A quel punto il testo, composto da una parola per riga, è stato messo in Excel. Ne è risultata una lista a tabella da una colonna con le parole in ordine alfabetico. A quel punto il conteggio delle ripetizioni è stato facile.

LA CLASSIFICA DELLE PAROLE PIÙ RICORRENTI PRONUNCIATE DAL PRESIDENTE

26 nostri 18 significa 13 tutti 12 speranza 12 volti 11 parlamento 11 nuovo 10 Paese 9 sociale 9 libertà 9 rappresentanza 9 libertà 9 italiano 8 politica 7 repubblica 7 giovani 6 Italia 6 vita 6 nazionale 6 Europa 5 lotta 5 società 5 sfida 5 religione 5 terrorismo 4 sovranità 4 pace 4 valori 4 risorse 4 rischio 4 mafia 4 ragazzi 4 stato 4 lavoro 4 istituzioni 4 grave 4 guerra 4 globali 3 partecipazione 3 ostaggi 3 sicurezza 3 servizio 3 risposte 3 regole 3 magistratura 3 ingiustizia 2 Patria 2 paura 2 riforme 2 tecnologia 2 nazifascismo 2 mezzogiorno 2 povertà 2 principi 2 onesto 2 imprese 2 governo 2 giustizia 2 indignazione 1 Nord 1 occupazione

Bonus track: Da leggere, “8 Great Examples of Data Visualization”

Social
Latest posts by Pier Luca Santoro (see all)

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.