L’Intelligenza artificiale contro il dilagare dell’hate speech

I social media sono diventati lo strumento di comunicazione principale nella vita di milioni di persone in tutto il mondo. Tuttavia, la facilità di espressione ha consentito la diffusione di una propaganda di odio nota come hate speech. I casi di linguaggio violento e antisemita sono diventati così comuni da costringere alcuni utenti ad abbandonare i propri profili per non essere risucchiati nel “pozzo nero dell’odio” [Jonathan Weisman, The New York Times].

Per evitare la violazione dei sistemi di controllo introdotti dalle diverse piattaforme digitali, come ad esempio il Google Conversation AI, gli haters hanno codificato un linguaggio composto da parole comuni che insieme formano tweet carichi di rabbia. Un codice semantico difficile da riconoscere anche per un colosso come Twitter che riesce a rimuovere solo una bassa percentuale di contenuti a sfondo antisemita.

Per identificare i tweet codificati, i ricercatori dell’università di Rochester hanno studiato il comportamento degli utenti inclini all’hate speech e si sono affidati all’intelligenza artificiale creando un software, basato sull’indice di correlazione di Pearson, capace di riconoscere le parole in codice utilizzate in un contesto razzista.

I ricercatori si sono concentrati su un campione composto da un milione di tweet generati dal 23 settembre al 18 ottobre 2016, una settimana dopo le elezioni presidenziali americane. L’analisi dei testi ha prodotto la prima hate-list, formata da 3 hashtag e 7 parole.

  • #MAGA (Make American Great Again) e #ALTRIGHT sono i due hashtag più diffusi con chiari riferimenti al movimento sulla supremazia bianca.
  • Le parentesi triple sono utilizzate con accezione antisemita per identificare i singoli componenti della comunità ebraica.
  • Il sostantivo gas è quasi sempre associato alla comunità ebraica (Skypes).

Successivamente, con l’utilizzo dell’algoritmo Apriori per la ricerca delle associazioni, sono stati tracciati dei modelli di tweet composti da due o più code words come [#MAGA, #Altright, Skypes], [Gas, Skypes], [Googles, Birilli, Skypes] ed è emerso che:

  • Un alto numero di tweet contiene più parole in codice. Elemento che mostra come l’odio degli aggressori verbali sia rivolto verso più comunità contemporaneamente.
  • La comunità ebraica è la più colpita dalle associazioni linguistiche.

A sostegno di quest’ultimo punto si inserisce la ricerca eseguita dal Congresso Ebraico Mondiale che traccia uno scenario preoccupante: nel corso del 2016 sono stati pubblicati più di 382mila post antisemiti, al ritmo di 1 ogni 83 secondi. Lo studio, condotto dalla Vigo Social Intelligence, ha analizzato decine di milioni di messaggi, in oltre 20 lingue, postati su social media, forum e blog: il 63% di questi si trovano su Twitter, il 16% sui blog, l’11% su Facebook, il 6% su Instagram, il 2% su YouTube e il restante 2% sui forum.

In questo contesto, il lavoro svolto dai ricercatori dell’università di Rochester potrebbe offrire un contributo significativo, insieme ad adeguate misure di prevenzione legislativa, per limitare il fenomeno dell’odio digitale. Il loro software, infatti, ha raggiunto un’accuratezza del 79,4397% producendo una lista certa di haters.

Il prossimo passo sarà quello di affinare il sistema sia per identificare automaticamente le nuove parole in codice sia per scoprire eventuali nessi tra comunità di utenti dediti all’aggressione verbale. E per farlo dovranno essere presi in considerazione precisi momenti storici caratterizzati da disordini politici o attacchi terroristici, le vere scintille che più di ogni altra cosa soffiano sul fuoco dell’hate speech.

Ma la rete, per fortuna, non è solo il luogo dell’odio. È lo specchio di una società multiforme ed eterogenea che riversa dentro questo grande contenitore attitudini e insicurezze generando contenuti dalle mille sfumature. Un comportamento omnicomprensivo, dove età e classe sociale non sono mai stati una scriminante, ma che troppo spesso non è accompagnato da un manuale per l’uso. Così centinaia di persone, ogni giorno, si trovano impantanate in una palude d’odio nella quale il ruolo di carnefice e quello di vittima tendono a sovrapporsi diventando uno la conseguenza dell’altro in un ciclo continuo che potrebbe essere interrotto semplicemente con l’istruzione e la conoscenza. In Inghilterra la chiamano la digital literacy, in Italia potrebbe definirsi educazione digitale e diventare materia di studio in tutte le scuole così da offrire alle prossime generazioni gli strumenti necessari per prevenire e stigmatizzare i messaggi carichi di odio.

 

Lascia un commento

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.