COME IMPLEMENTARE
LA SOTTOTITOLAZIONE
IN TEMPO REALE
IN CONTESTI EDUCATIVI
Linee guida per rendere accessibili
le lezioni universitarie
Traduzione italiana a cura di +Cultura Accessibile
Questo progetto è stato realizzato con il sostegno della Commissione Europea.
Questa pubblicazione riflette il punto di vista degli autori, e la Commissione non può essere ritenuta responsabile per l’utilizzo delle informazioni in essa contenute
Con il supporto del Programma Erasmus+ dell'Unione Europea
Come citare il documento
Dutka, Ł., Szczygielska, M., Szarkowska, A., Figiel, W., Romero-Fresco, P., Pöchhacker, F., Tampir, M., Robert, I., Schrijver, I., Haverhals, V. and Meiriño, J. (2020) How to implement speech-to-text interpreting (live subtitling) in educational settings. Guidelines on making university lectures accessible to hard of hearing, deaf and foreign students. ILSA Project. http://ka2-ilsa.webs.uvigo.es/guidelines
Introduzione
Le lezioni universitarie possono essere tradotte e rese accessibili grazie alla sottotitolazione in tempo reale.
Ci sono differenti metodi per produrre la sottotitolazione in tempo reale, per esempio utilizzando una tastiera o attraverso diversi gradi di automazione (riconoscimento vocale, traduzione automatica).
Il progetti ISLA, e queste linee guida, si concentrano sulla sottotitolazione in tempo reale intralinguistica e specialmente interlinguistica che utilizza il respeaking.
In questa pratica il sottotitolatore chiamato respeaker interlinguistico (o traspeaker) traduce ciò che viene detto, (dettando anche la punteggiatura), a un software di riconoscimento vocale che visualizza su uno schermo la traduzione sotto forma di sottotitoli.
Questo documento è rivolto ai responsabili dell’accessibilità degli istituti di istruzione superiore, responsabili delle direttive universitarie, docenti e chiunque desideri rendere più accessibile l’istruzione superiore. Ha lo scopo quindi, di implementare, negli istituti di istruzione superiore, l’interpretazione e la trasposizione da parlato a testo.
Per indicare la fornitura di servizi di sottotitolazione in tempo reale, vengono utilizzate terminologie differenti che variano a seconda degli Stati e dei mercati.
Il progetto ILSA si propone di chiarire questa confusione terminologica.
Nella pagina seguente sono indicati i termini più utilizzati e la loro definizione adottate in questo testo e in tutte le guide ISLA
DEFINIZIONI
CABINA – Spazio insonorizzato (come si usa, nella tipologia standard per la traduzione simultanea).
RESPEAKING INTERLINGUISTICO – Vedi ‘Transpeaking’.
RESPEAKING INTRALINGUISTICO – Vedi ‘Respeaking’.
SOTTOTITOLI LIVE – Sottotitoli live visualizzati sullo schermo in basso, o come parte dell’immagine.
TITOLI LIVE – Testo scritto prodotto da sottotitolazione in tempo reale.
TITOTLAZIONE LIVE – Vedi ‘Sottotitolazione in tempo reale’.
RESPEAKING – Metodo per creare sottotitoli dal vivo utilizzando il riconoscimento vocale. Pratica in cui un professionista (respeaker) ripete e/o parafrasa ciò che è stato detto – compresa la punteggiatura – Il respeaking è anche definito come voce scrivente.
TRASPOSIZIONE DI UN TESTO ORALE IN UN TESTO SCRITTO (STTI) – Produzione di una versione scritta di un messaggio vocale contemporaneamente alla sua emissione. È per lo più utilizzato per traduzioni intralinguistiche (nella stessa lingua), utilizzando la tastiera o il respeaking, a vantaggio delle persone sorde, ma può essere anche utilizzato interlinguisticamente. In alcuni paesi e contesti la sottotitolazione in tempo reale si riferisce anche alla sottotitolazione dal vivo o alla produzione di didascalie.
STENOMASK – Copertura fonoisolante intorno a un microfono utilizzato dai respeaker per attutire i suoni del linguaggio (vedi Fig. 5).
TRANSCRIPT – Testo scritto che rappresenta un messaggio parlato.
TRANSPEAKING – Metodo per realizzare sottotitolazione interlinguistica in tempo reale tramite tecnologie di riconoscimento vocale: un professionista (reaspeker interlinguistico – o transpeaker) traduce ciò che viene detto compresa la punteggiatura.
UTILIZZATORI
La sottotitolazione in tempo reale nelle lezioni/conferenze è a vantaggio di molti e differenti utilizzatori e in particolare:
- Studenti sordi o sordastri, che possono partecipare in classe assieme ai propri compagni udenti.
- Studenti stranieri e visitor universitari che non conoscono la lingua in cui viene rilasciata la lezione, e possono usufruire della sottotitolazione in tempo reale interliguistica o intralinguistica.
- Altre persone che possono avere difficoltà di accesso ai contenuti di lezioni accademiche, come persone con disturbi dello spettro autistico o dislessici.Per la sottotitolazione intralinguistica in tempo reale, il target più numeroso è rappresentato dai sordastri . La sottotitolazione intralinguistica in tempo reale è rivolta agli studenti stranieri o ai visitor professor che non conoscono la lingua del relatore, come pure a sordi e sordastri.
Per la sottotitolazione intralinguistica in tempo reale, il target più numeroso è rappresentato dai sordastri.
La sottotitolazione intralinguistica in tempo reale è rivolta agli studenti stranieri o ai visitori professor che non conoscono la lingua del relatore, come pure a sordi e sordastri.
La sottotitolazione in tempo reale può essere utilizzata anche per le lezioni o per le conferenze, a beneficio dei sordi, di coloro che non capiscono la lingua del relatore, di coloro che stanno in un ambiente rumoroso, o non possono attivare l’audio
Al termine della lezione/conferenza, la trascrizione della sottotitolazione in tempo reale può essere utilizzata come appunti.
BENEFICI
- La sottotitolazione in tempo reale aumenta prima di tutto l’accessibilità e favorisce l’inclusione della vostra istituzione.
- Incrementando la partecipazione di gruppi definiti, la sottotitolazione in tempo reale favorisce la consapevolezza tra gli studenti e lo staff accademico, delle diversità tra i gruppi di studenti.
- La maggior parte degli studenti si avvarrà della sottotitolazione in tempo reale per concentrarsi sul contenuto della lezione. Alcune ricerche hanno dimostrato che la sottotitolazione può incrementare il rendimento degli studenti favorendo la comprensione e l’assimilazione delle informazioni. (vedi riferimenti).
- Nei corsi di lingue la sottotitolazione in tempo reale aiuta gli studenti a capire la lezione in lingua straniera, e a imparare la dizione corretta.
- Il prodotto derivato dalla sottotitolazione in tempo reale è una trascrizione o una traduzione delle lezioni che possono essere messe a disposizione del docente, dello staff universitario o degli studenti.
- La sottotitolazione in tempo reale ha un impatto positivo sullo sviluppo delle competenze digitali.
- L’introduzione della sottotitolazione in tempo reale contribuirà alla trasformazione digitale della vostra istituzione.
- Se registrate, e rendete successivamente disponibili le lezioni, la sottotitolazione in tempo reale può essere risincronizzata per essere utilizzata come sottotitolazione per il video.
Le ricerche hanno evidenziato che i punteggi degli studenti sono significativamente migliorati nelle prove di comprensione dei contenuti delle lezioni, quando sono dotate di sottotitolazione intralinguistica in tempo reale. Inoltre, i sottotitoli in tempo reale intralinguistici consentono agli studenti della seconda lingua di raggiungere lo stesso livello di prestazione degli studenti di madre lingua che non usufruiscono della sottotitolazione.
FLUSSI DI LAVORO
I flussi di lavoro possibili sono due, e dipendono dalle condizioni logistiche in cui viene prodotto il respeaking:
- Respeaking in presenza: il respeaker lavora nella stessa stanza, preferibilmente in una cabina o utilizzando la stenomask.
- Respeaking da remoto: il respeaker lavora in un altro luogo all’interno o all’esterno del campus.
Le figure 1 e 2 mostrano gli schemi del respeaking in presenza e da remoto
Sebbene il respeaker possa lavorare in contiguità con i fruitori nell’aula, o nella sala conferenze, e restituire la traduzione in diretta, è più pratico per il respeaker lavorare da remoto, in una stanza silenziosa.
In questa condizione lavorativa si hanno meno distrazioni e interferenze con il software di riconoscimento
Se il respeaker è seduto nella stessa stanza e non in cabina, è raccomandabile l’utilizzo della stenomask (Fig. 5 e 6). Le maschera dal momento che smorza la voce, previene la possibilità di disattenzione da parte degli uditori. La stenomask con banda elastica permette al respeaker di avere le mani sulla tastiera per correggere il testo, i termini tecnici ecc.
Se il respeaking è realizzato in presenza nella sala conferenze/didattica considerate i seguenti elementi:
- Se viene utilizzata la stenomask, il reaspeaker dovrebbe sedere in prima fila perché se è vicino al relatore può sentire meglio.
- Se viene usata la cabina, il respeaker deve essere in condizione di vedere il relatore, la presentazione dell’intervento e la sala. Prima dell’inizio della lezione/conferenza deve testare anche il microfono e le cuffie.
- Quando viene utilizzata una cabina interpreti, il respeaker sentirà solo coloro che parlano al microfono, per cui è essenziale che il conferenziere/docente utilizzi sempre il microfono. Se ci sono altre persone che parlano durante la lezione/conferenza devono essere microfonati . Se ciò non è possibile il relatore deve ripetere le domende degli student al microfono.
In caso di respeaking interlinguistico – Flussi di lavoro possibili:
Il respeaking può essere intra o interlinguistico come si vede nelle figure 8-11.
Il flusso di lavoro illustrato nella figura 9 richie che l’interprete senta, capisca e traduca in prima battuta (lingua orale A nella lingua orale B) prima che il respeaker inizi a speakerare (la lingua orale B in lingua scritta B). Questo può provocare più ritardo, ma in compenso il respeaker non ha bisogno di conoscere la lingua originale.
Utilizzare un respeker interlinguistico (Fig. 10) per i fruitori significa ridurre al minimo il ritardo di rilascio della sottotitolazione. E’ comunque difficile trovare un respeaker interlinguistico che copra alcune lingue.
L’utilizzo della traduzione automatica (Fig. 11) permette di realizzare la titolazione in tempo reale in più lingue contemporaneamente. In relazione all’accoppiata delle lingue, la qualità della traduzione automatica può risultare inadeguata. I risultati del rilascio della traduzione automatica possono migliorare se il respeaker usa una lingua semplice o strutture linguistiche semplificate.
CORREZIONE DAL VIVO
Poiché è difficile che il riconoscimento vocale sia curato al 100% il testo necessita di essere corretto. A seconda della difficoltà degli argomenti e della quantità degli errori indotti dal sistema, le correzioni possono essere fatte dal respeaker (Fig. 6) o da un correttore in presenza. In alcuni casi può essere necessario uno studente che corregga il testo.
- correzione da parte del respeaker stesso.
- correzione in parallelo da parte di un correttore in presenza. 3. correzione in parallelo da parte di uno studente (fruitore).
La correzione fatta da un correttore in presenza produce il risultato migliore, specialmente per lezioni brevi e con terminologia complessa. Richiede però un contributo professionale che incide sul costo del servizio.
La correzione in parallelo da parte degli studenti è possibile quando il testo della sottotitolazione è disponibile in un documento condiviso che gli studenti possono redigere , sebbene può essere mentalmente impegnativo per questi studenti allo stesso tempo seguire la lezione/conferenza.
L’auto-correzione può essere utilizzata quando le lezioni sono rilasciate con tempi lenti e non ci sono troppi errori da correggere. Il respeaker può fermarsi, correggere l’errore e ricominciare.
RACCOMANDAZIONI
- Ogni volta che è possibile la sottotitolazione in tempo reale dovrebbe essere accompagnata dalla correzione.
- La trascrizione della sottotitolazione in tempo reale deve essere corretta dal reaspeaker dopo la conferenza/lezione in modo da poter essere utilizzata come “appunti”.
- Poiché il respeaking richiede un alto sforzo cognitivo (che aumenta se viene utilizzata la stenomask), è difficile mantenere la concentrazionei per più di 20-30 minuti senza intervallo. E’ raccomandabile quindi includere un intervallo per il respeaker , o avere una squadra di respeaker che possono alternarsi. Un respeaker intralinguistico non può lavorare per più di 45 minuti (o massimo 1 ora) senza cambio. Il turno di un respeaker interliguistico non può essere superiore ai 30 minuti.
Figure 12 e 13. I respeaker solitamente lavorano in gruppo (© Sabien Hanoulle)
TITOLAZIONE IN TEMPO REALE STRUMENTI
A seconda delle necessità dell’ istituzione, del budget e delle dotazioni tecniche, potete scegliere diverse soluzioni. Per cominciare avete bisogno di un portatile, un software di riconoscimento vocale e un microfono. Ogni utilizzatore ha bisogno di un dispositivo connesso a Internet.
Strumenti base per fornire titolazione in tempo reale
- App di video conferenze (Microsoft Teams, Google Meet, ZOOM) per mandare suono (e in opzione anche video).
- App di messaggistica (Messenger, Whatsapp, etc.) per inviare il sonoro dal docente/conferenziere al respeaker.
- Una connessione telefonica per inviare il sonoro dal docente/conferenziere al respeaker;
- Il testo può essere reso disponibile su Google Doc al quale gli studenti possono accedere dai loro apparecchi.
Soluzioni professionali per fornire titolazione in tempo reale
- Text on Top – software per produrre e mettere in video la titolazione in tempo reale. Consente la collaborazione tra un certo numero di stazioni di lavoro attraverso connessione wireless (utilizzando chiavette USB). C’è anche una versione che consente la titolazione in diretta da remoto attraverso internet, chiamata Text on Tap.
- Svariati servizi di accessibilità hanno le proprie piattaforme o strumentazione alcune delle quali consentono l’utilizzo da remote.
Alcune soluzioni prevedono che gli studenti ricevano un tablet dedicato con software e microfoni wireless. Gli utilizzatori possono personalizzare la grafica dei sottotitoli come il carattere, il colore, ecc.
Come visualizzare la titolazione in tempo reale
• La sottotitolazione in tempo reale può essere visualizzata su uno grande schermo aggiuntivo nella sala conferenze/docenza.
• Oppure possono essere visualizzati come sottotitoli (per esempio su due righe sullo schermo principale, sotto la presentazione.
• La modalità più flessibile per gli studenti è quella di visualizzare la titolazione in tempo reale sui loro device – computer, tablet, smartphone – (questa opzione li lascia liberi di organizzare come preferiscono la modalità grafiche di presentazione)
Figure 15 e 16 Visualizzazione sui propri device (recuperare immagini)
SFIDE E SOLUZIONI
- Suono — se il respeaker lavora da remoto, il suono può essere trasmesso via telefono, app di messaggistica o soluzione di video conferenza.
- Visualizzazione —la titolazione può essere visualizzata su un sito che i fruitori possono aprire sui loro dispositivi mobili, o su uno schermo in aula (sia sullo stesso schermo che usa il docente, sia su uno schermo indipendente).
- Accesso a internet —se manca la connessione WiFi o è lenta o sovraccarica, utilizzate la connessione del telefono per trasmettere l’audio. Gli studenti possono utilizzare la loro connessione.
LISTA DI CONTROLLO PER L’ACCESSIBILITY MANAGER
La lista di controllo è rivolta all’accessibility manager negli istituti di alta formazione.
- Indentificate i bisogni dei tuoi utilizzatori:
- – Gli studenti sordi preferiscono i sottotitoli o l’interprete in lingua dei segni?
- – Gli studenti stranieri o ospiti hanno bisogno di una traduzione nella loro lingua madre o in inglese?
- Contattate il dipartimento IT (Information Technology) per verificare se la connessione internet nell’aula è sufficientemente performante per consentire il servizio.
- Controllate se il servizio di sottotitolazione in tempo reale è da remoto o in presenza.
- Scegliete la lingua in cui verranno rilasciati i sottotitoli.
- Contattate i relatori per discutere le condizioni della sottotitolazione in diretta.
- Chiedete che venga prodotto del materiale preparatorio.
- Condividete le informazioni sull’introduzione del servizio con la comunità dell’istituzione.
- Rassicuratevi che le informazioni sul servizio siano continuamente accessibili a tutti gli studenti (per esempio sul sito).
- Prevedete un meccanismo per l’assicurazione della qualità e il feedback per gli utilizzatori. Decidete se le trascrizioni delle lezioni saranno disponibili e per chi.
- Se prevedete una registrazione della lezione per essere disponibile a posteriori, assicuratevi che ci siano anche i sottotitoli.
LISTA DI CONTROLLO PER I RELATORI
Ci sono alcune azioni che potete fare come relatori per migliorare l’esperienza degli studenti che hanno accesso alla lezione grazie alla sottotitolazione in tempo reale:
- Prima dell’intervento rendete disponibili per il respeaker, i materiali e specificamente la presentazione, per scritto o sotto forma di appunti (così che il respeaker si possa preparare prima della lezione e familiarizzare con la terminologia specifica.
- Assicuratevi di non aver preparato troppe diapositive il che significherebbe accelerare la proiezione.
- Durante la presentazione evitate di scorrere le diapositive troppo velocemente perché gli studenti devono contemporaneamente leggere i sottotitoli e i contenuti visivi che fate scorrere, e i sottotitoli appaiono con qualche secondo di ritardo. Consentite un extra time agli studenti per leggere le scritte e vedere i grafici o i contenuti scritti che condividete.
- Usate il microfono per l’intera durata della lezione (il rilascio del respeaker è migliore se ha un audio pulito).
- Assicuratevi che anche gli altri relatori usino il microfono e se necessario, ricordateglielo loro..
- Se ci sono commenti o domande dal parte degli uditori non microfonati, ripetete le domande al microfono (il respeaker è in grado di riportare solo quello che sente).
- Non parlate troppo veloce (ciò rende difficile il lavoro del respeaker e anche per gli studenti è difficile capire la lezione).
LISTA DI CONTROLLO PER PER IL RESPEAKER
- Contattare il responsabile accessibilità per discutere i flussi e ottenere in anticipo i materiali di riferimento.
- Familiarizzare con la terminologia specialistica.
- Aggiornare il lessico del software di riconoscimento vocale così che la maggior parte dei termini e dei nomi siano inclusi nel lessico e che siano riconosciuti correttamente.
- Controllate la connessione internet.
- Controllate se ricevete l’audio dei relatori e regolate il volume del suono.
- All’inizio della lezione ricordate a tutti i partecipanti di parlare al microfono.
- Fermatevi e intervenite, o chiedete a qualcuno di farlo, se un relatore non parla al microfono, o se la qualità dell’audio si deteriora in modo significativo.
- Durante la lezione verificate se gli studenti vedono chiaramente i sottotitoli.
- Dopo la lezione salvate una trascrizione nel caso ce ne fosse bisogno in seguito.
QUALITA’ NELLA SOTTOTITOLAZIONE IN TEMPO REALE
Sebbene ci siano differenti metodi di valutazione della qualità della (sotto) titolazione in tempo reale prodotta da professionisti di settore, il più comune è il modello NER (Romero-Fresco & Martínez, 2015), che distingue tra errori di riconoscimento (causati dalla interazione tra respeaker e software) e gli errori di redazione (causati dalla non corrette decisioni del respeaker quando omette o cambia le informazioni).
Questi errori possono essere minimi, standard, o seri a seconda di come impattano sulla comprensione del fruitore. Il modello NER è correntemente usato dalle autorità di controllo del governo, delle telecomunicazioni e delle università in Stati come la Spagna, Regno Unito, Belgio, Polonia, Svizzera, Sud Africa, Australia, Stati Uniti e Canada dove il modello è stato nella legislazione la certificazione della qualità della sottotitolazione in tempo reale.
Maggiori dettagli sul modello NER si possono trovare nei corsi ISLA e nel sito web dell’Osservatorio Galiziano per l’Accessibilità ai Media, che include anche informazioni sul modello NERLE una versione del NED che è stato adattato specificamente agli eventi dal vivo (Moores, 2020).
Il modello NER è usato per la validazione dei sottotitoli intra-linguistici (uelli prodotto nella stessa lingua dell’audio originale). La validazione del sottotitoli in tempo reale inter-linguistici (quelli che traducono l’audio originale in un’altra lingua) può essere fatta con il modello NTR (Romero-Fresco & Pöchhacker, 2017).
ULTERIORI INFORMAZIONI
Sui benefici educativi della sottotitolazione
De Meulder, A., Robert, I. S., Schrijver, I. (in preparation). Live subtitling for access to education: A pilot study of university students’ reception of intralingual live subtitling.
Gernsbacher, M. A. (2015). Video Captions Benefit Everyone. Policy Insights from the Behavioral and Brain Sciences, 2(1), 195-202. doi:10.1177/2372732215602130
Kruger, J.-L., Hefer, E., & Matthew, G. (2014). Attention distribution and cognitive load in a subtitled academic lecture: L1 vs. L2. Journal of Eye Movement Research, 7(5), 1-15.
Jelinek Lewis, M., & Jackson, D. W. (2001). Television Literacy: Comprehension of Program Content Using Closed Captions for the Deaf. Journal Of Deaf Studies And Deaf Education, 6(1), 43-53. doi:10.1093/deafed/6.1.43
Linebarger, D., Piotrowski, J. T., & Greenwood, C. R. (2010). On-screen print: the role of captions as a supplemental literacy tool. Journal of Research in Reading, 33(2), 148-167. doi:10.1111/j.1467-9817.2009.01407.x
Vanderplank, R. (2013). ‘Effects of’ and ‘effects with’ captions: How exactly does watching a TV programme with same-language subtitles make a difference to language learners? Language Teaching, 49(02), 235-250. doi:10.1017/s0261444813000207
Yoon, J.-O., & Kim, M. (2011). The Effects of Captions on Deaf Students’ Content Comprehension, Cognitive Load, and Motivation in Online Learning. American Annals of the Deaf, 156(3), 283-289. doi:10.1353/aad.2011.0026
Sulla sottotitolazione attraverso il respeaking
Moores, Z. (2020) ‘Measuring the quality of intralingual respeaking at live events.’ 7th Live Subtitling and Accessibility Symposium, 5th and 6th November, 2020, Universitat Autònoma de Barcelona.
Pöchhacker, F., & Remael, A. (2019). New efforts?: A competence-oriented task analysis of interlingual live subtitling. Linguistica Antverpiensia, New Series: Themes in Translation Studies, 18, 130–143
https://lans-tts.uantwerpen.be/index.php/LANS-TTS/article/view/515/471
Robert, I. S., & Remael, A. (2017). Assessing quality in live interlingual subtitling: A new challenge. Linguistica Antverpiensia, New Series: Themes in Translation Studies, 16, 168-195. https://lans-tts.uantwerpen.be/index.php/LANS-TTS/article/view/454
Romero-Fresco, P. (2011). Subtitling through speech recognition: respeaking. Manchester: St. Jerome Publishing.
Romero-Fresco, P. (2012). Respeaking in Translator Training Curricula. The Interpreter and Translator Trainer, 6(1), 91-112. doi:10.1080/13556509.2012.10798831
Romero-Fresco, P., & Martínez, J. (2015). Accuracy Rate in Live Subtitling: The NER Model. In J. Díaz-Cintas & R. Baños Piñero (Eds.), Audiovisual Translation in a Global Context. Mapping an Ever-changing Landscape (pp. 28-50). London: Palgrave.
Romero-Fresco, P., & Pöchhacker, F. (2017). Quality assessment in interlingual live subtitling: The NTR Model. Linguistica Antverpiensia, New Series – Themes in Translation Studies, 16, 149–167.
https://lans-tts.uantwerpen.be/index.php/LANS-TTS/article/view/438
Romero-Fresco, P. (2018). Respeaking. In L. Pérez-González (Ed.), The Routledge Handbook of Audiovisual Translation (pp. 96-113).
Romero-Fresco, Pablo and Eugeni, C. (2020). Live subtitling through respeaking. In Łukasz Bogucki and Mikołaj Deckert (Eds.), Handbook of Audiovisual Translation and Media Accessibility, Palgrave.