L’Insostenibile Leggerezza delle WordCloud

Le paro­le sono impor­tan­ti. A mag­gior ragio­ne lo sono quel­le pro­nun­cia­te davan­ti al Par­la­men­to da un nuo­vo Pre­si­den­te del­la Repub­bli­ca in occa­sio­ne del pro­prio inse­dia­men­to. In un momen­to così solen­ne il peso sim­bo­li­co dei ter­mi­ni espres­si chia­ra­men­te si mol­ti­pli­ca.

Per veri­fi­ca­re qua­li sia­no le paro­le più ricor­ren­ti in un testo o in un discor­so le Wor­d­Cloud sono otti­mi stru­men­ti di con­trol­lo. Si trat­ta di appli­ca­zio­ni che gene­ra­no del­le “for­me” gra­fi­che nel­le qua­li i ter­mi­ni chia­ve sono rap­pre­sen­ta­ti con un cor­po che aumen­ta in fun­zio­ne del­la fre­quen­za con le qua­li si sono ripe­tu­ti. Esat­ta­men­te come le paro­le comun­que rile­van­ti ma appar­se meno ven­go­no rap­pre­sen­tan­te in cor­po più pic­co­lo. L’effetto fina­le è inte­res­san­te: una “nuvo­la” com­po­sta in media di una cin­quan­ti­na di paro­le con gran­dez­ze diver­se e che ruo­ta intor­no a alcu­ne chia­vi prin­ci­pa­li in cor­po mag­gio­re. Quell’immagine in qual­che modo dovreb­be rap­pre­sen­ta­re l’essenza, l’anima di un testo.

In rete è faci­le tro­va­re le appli­ca­zio­ni gra­tui­te capa­ci di gene­ra­re un Wor­d­Cloud. Le più cono­sciu­te sono Word­le e Tag­xe­do. A secon­da del pro­gram­ma scel­to, si pos­so­no con­trol­la­re le pro­por­zio­ni, il carat­te­re da sce­glie­re, impo­sta­re fil­tri di esclu­sio­ne per alcu­ni ter­mi­ni, si può deci­de­re l’inclinazione del­le sin­go­le paro­le nel­la nuvo­la fina­le, il rela­ti­vo colo­re e per­si­no defi­ni­re la for­ma del­la nuvo­la [roton­da, a for­ma di cuo­re, qua­dra­ta e via dicen­do]. Il risul­ta­to è sem­pre un “ogget­to” visua­le che cat­tu­ra l’attenzione.

Nel caso di Mat­ta­rel­la, i media ita­lia­ni [quo­ti­dia­ni, tv, Ansa, siti di infor­ma­zio­ne onli­ne] han­no mostra­to un cer­to entu­sia­smo ver­so le Wor­d­Co­lud, come se fos­se una novi­tà straor­di­na­ria. Ne sono usci­te “nuvo­le” in cui la paro­la più in evi­den­za è sta­ta qua­si sem­pre “signi­fi­ca”.

info mattarella

Però quel­lo è un ter­mi­ne che iso­la­to vuol dire ben poco. In real­tà “signi­fi­ca” face­va par­te di una costru­zio­ne incal­zan­te gio­ca­ta dal neo Pre­si­den­te per descri­ve­re l’idea che “Difen­de­re la Costi­tu­zio­ne” si deve tra­dur­re nel garan­ti­re il dirit­to allo stu­dio, nel­la dife­sa di quel­lo al lavo­ro, nel soste­gno alla fami­glia e via dicen­do fino al rifiu­to di ogni for­ma di mafia e di ille­ga­li­tà. Per que­sto moti­vo “signi­fi­ca” è sta­to ripe­tu­to ben 18 vol­te nel discor­so pro­nun­cia­to in Par­la­men­to. Nel dire “Signi­fi­ca” Mat­ta­rel­la richia­ma­va diret­ta­men­te i valo­ri del­la Costi­tu­zio­ne.

Le Wor­d­Coud sono stru­men­ti effi­ca­ci per­ché velo­ci ma in un cer­to sen­so appros­si­ma­ti­vi pro­prio per­ché è com­ples­so valu­ta­re il peso di una paro­la estra­po­lan­do­la dal con­te­sto. Non solo, ma i pro­gram­mi che gene­ra­no i Clouds ten­do­no a esclu­de­re alcu­ni ter­mi­ni, le con­giun­zio­ni giu­sta­men­te, o a pena­liz­zar­ne altri, gli agget­ti­vi per esem­pio.

Eppu­re a rileg­ge­re il testo del Pre­si­den­te si nota che la paro­la più fre­quen­te (26 vol­te) in real­tà è sta­ta pro­prio un agget­ti­vo, “nostro” [nostro, nostra, nostri, nostre]. E non si trat­ta di un det­ta­glio da poco. Il Pre­si­den­te, nei suoi rife­ri­men­ti al Pae­se, ha volu­ta­men­te evi­ta­to ter­mi­ni for­ma­li — solo 2 vol­te la paro­la “Patria” — per dare inve­ce enfa­si a un con­cet­to di appar­te­nen­za, di comu­ni­tà. E que­sto spie­ga l’uso di “nostro” che appa­re come:

- nostro pae­se — nostro popo­lo — nostro esse­re comu­ni­tà — nostra Costi­tu­zio­ne — nostra demo­cra­zia — nostra gen­te — nostra poli­ti­ca — nostra con­vi­ven­za — nostri con­cit­ta­di­ni — nostri ragaz­zi — nostri teso­ri

Ora, nes­sun Wor­d­Cloud è capa­ce di rico­no­sce­re e leg­ge­re così in pro­fon­di­tà la strut­tu­ra di un discor­so. E’ bene ricor­dar­se­lo ogni vol­ta che si pas­sa al setac­cio di un gene­ra­to­re di nuvo­le un testo da esa­mi­na­re. I Clouds resta­no comun­que vali­di stru­men­ti per una pri­ma veri­fi­ca a cal­do, ma per un appro­fon­di­men­to, anche di natu­ra pura­men­te visua­le, sareb­be­ro neces­sa­ri altri inter­ven­ti.

Per resta­re all’esempio del discor­so di Mat­ta­rel­la nes­sun gior­na­le, digi­ta­le e/ car­ta­ceo, è riu­sci­to a andar oltre le “nuvo­le”. Pur­trop­po. Eppu­re di mate­ria­le da rap­pre­sen­ta­re in ter­mi­ni visua­li, a par­ti­re pro­prio dai vari Clouds, non man­ca­va.

Tan­to per fare un esem­pio, qua­le è sta­to il peso dei rife­ri­men­ti alle Isti­tu­zio­ni o quel­li ai valo­ri eti­ci rispet­to al tota­le? Poi è man­ca­ta la com­pa­ra­zio­ne coi ter­mi­ni più ricor­ren­ti nei discor­si dei pre­de­ces­so­ri. Quan­te vol­te Napo­li­ta­no ha cita­to l’Europa pre­sen­tan­do il suo pri­mo man­da­to e quan­te vol­te lo ha fat­to Mat­ta­rel­la? Sareb­be sta­to inte­res­san­te sco­pri­re cer­ti tipi di dif­fe­ren­ze.

La rin­cor­sa gene­ra­le ai Wor­d­Cloud non è sta­to un erro­re. Al con­tra­rio. Nean­che l’aver evi­den­zia­to la paro­la “signi­fi­ca”. Infat­ti nel tota­le del discor­so di Mat­ta­rel­la com­po­sto da 2.274 paro­le, ben 351 sono sta­te spe­se nel pas­sag­gio sul­la dife­sa del­la Costi­tu­zio­ne. Non poco.

Però le Wor­d­Cloud, come spie­ga­to in pre­ce­den­za, van­no comun­que usa­ti con cau­te­la. Pro­prio Mat­ta­rel­la par­lan­do in Par­la­men­to ha accen­na­to, novi­tà asso­lu­ta, alla neces­si­tà di abbat­te­re in Ita­lia il “digi­tal divi­de”. Lo ha fat­to una vol­ta sola, quin­di nes­sun Cloud lo ha regi­stra­to. E’ un buon moti­vo per con­si­de­rar­la una cita­zio­ne irri­le­van­te?

Ogni medium ha un suo ruo­lo e signi­fi­ca­to, come noto. Un con­to è un tweet, o un post su Face­book, ed un altro è inve­ce un arti­co­lo di gior­na­le, sia esso digi­ta­le o car­ta­ceo poco impor­ta. Le Wor­d­Cloud, lo riba­dia­mo anco­ra, van­no benis­si­mo ci pia­ce­reb­be però che non fos­se­ro con­si­de­ra­te solo uno dei tan­ti ele­men­ti visi­vi di con­tor­no, come è avve­nu­to nel caso di Mat­ta­rel­la che abbia­mo usa­to come esem­pio, ma che vi sia data la giu­sta atten­zio­ne ed accu­ra­tez­za che si riser­va ad ogni ele­men­to infor­ma­ti­vo, maga­ri cor­re­dan­do­lo con una cor­ret­ta ana­li­si del discor­so.

È que­sto, anche, il valo­re aggiun­to che gior­na­li e gior­na­li­sti pos­so­no por­ta­re al let­to­re che altri­men­ti, stan­te l’ampiezza di tool a dispo­si­zio­ne, è asso­lu­ta­men­te in gra­do di far­se­la da solo la Wor­d­Cloud. L’insostenibile leg­ge­rez­za del­le Wor­d­Cloud cre­dia­mo sia un buon esem­pio del gior­na­li­smo fret­to­lo­so, raf­faz­zo­na­to [o peg­gio], da evi­ta­re se si vuo­le rida­re cen­tra­li­tà all’informazione — di qua­li­tà — ormai sem­pre più tra­bal­lan­te, unbran­ded e domi­na­ta dai social. Dove sta il ruo­lo del gior­na­li­sta se non nel­la capa­ci­tà di gui­da­re il let­to­re attra­ver­so una nar­ra­zio­ne che in que­sto caso sarà di tipo gra­fi­co?

cloud mattarella

Nota meto­do­lo­gi­ca: per il con­teg­gio esat­to del­le paro­le, è sta­to pre­so il testo ori­gi­na­le del­la tra­scri­zio­ne. Poi gli spa­zi bian­chi tra paro­le sono sta­ti sosti­tui­ti con un a capo. A quel pun­to il testo, com­po­sto da una paro­la per riga, è sta­to mes­so in Excel. Ne è risul­ta­ta una lista a tabel­la da una colon­na con le paro­le in ordi­ne alfa­be­ti­co. A quel pun­to il con­teg­gio del­le ripe­ti­zio­ni è sta­to faci­le.

LA CLASSIFICA DELLE PAROLE PIÙ RICORRENTI PRONUNCIATE DAL PRESIDENTE

26 nostri 18 signi­fi­ca 13 tut­ti 12 spe­ran­za 12 vol­ti 11 par­la­men­to 11 nuo­vo 10 Pae­se 9 socia­le 9 liber­tà 9 rap­pre­sen­tan­za 9 liber­tà 9 ita­lia­no 8 poli­ti­ca 7 repub­bli­ca 7 gio­va­ni 6 Ita­lia 6 vita 6 nazio­na­le 6 Euro­pa 5 lot­ta 5 socie­tà 5 sfi­da 5 reli­gio­ne 5 ter­ro­ri­smo 4 sovra­ni­tà 4 pace 4 valo­ri 4 risor­se 4 rischio 4 mafia 4 ragaz­zi 4 sta­to 4 lavo­ro 4 isti­tu­zio­ni 4 gra­ve 4 guer­ra 4 glo­ba­li 3 par­te­ci­pa­zio­ne 3 ostag­gi 3 sicu­rez­za 3 ser­vi­zio 3 rispo­ste 3 rego­le 3 magi­stra­tu­ra 3 ingiu­sti­zia 2 Patria 2 pau­ra 2 rifor­me 2 tec­no­lo­gia 2 nazi­fa­sci­smo 2 mez­zo­gior­no 2 pover­tà 2 prin­ci­pi 2 one­sto 2 impre­se 2 gover­no 2 giu­sti­zia 2 indi­gna­zio­ne 1 Nord 1 occu­pa­zio­ne

Bonus track: Da leg­ge­re, “8 Great Exam­ples of Data Visua­li­za­tion”

Social

Pier Luca Santoro

Marketing & Communication at DataMediaHub
Pier Luca Santoro è un esperto di marketing, comunicazione & sales intelligence. Project Manager @DataMediaHub . Dal 1998 opera come consulente per progetti di posizionamento strategico, organizzazione, comunicazione & formazione per aziende pubbliche e private, associazioni di categoria e amministrazioni pubbliche. Sperimentatore e creativo ha sviluppato un’esperienza significativa nell’ambito dell’edutainment, nell’utilizzo dei giochi come medium e la gamification.
Dal 1987 in poi é stato responsabile del marketing e dell’organizzazione commerciale di grandi imprese [Star, Giuliani, Bonomelli].
Social
About Pier Luca Santoro 3101 Articoli
Pier Luca Santoro è un esperto di marketing, comunicazione & sales intelligence. Project Manager @DataMediaHub . Dal 1998 opera come consulente per progetti di posizionamento strategico, organizzazione, comunicazione & formazione per aziende pubbliche e private, associazioni di categoria e amministrazioni pubbliche. Sperimentatore e creativo ha sviluppato un’esperienza significativa nell’ambito dell’edutainment, nell’utilizzo dei giochi come medium e la gamification. Dal 1987 in poi é stato responsabile del marketing e dell’organizzazione commerciale di grandi imprese [Star, Giuliani, Bonomelli].

2 Trackback & Pingback

  1. L’Insostenibile Leggerezza delle WordClou...
  2. ChartaMente - DataMediaHub

Lascia un commento