• No results found

Aspetti etici e The Observer’s Paradox

3. Metodo e raccolta dei materiali linguistici

3.3 Il corpus parlato

3.3.1 Aspetti etici e The Observer’s Paradox

Nella sua precoce campionatura casuale per gli studi sociolinguistici a New York City, Labov (1972a) ha posto una domanda a 264 commessi di tre vari grandi

magazzini di Manhattan che avrebbe elicitato la stessa risposta “fourth floor”, dopo di che avrebbe notato la loro pronuncia della [r] insieme ai dati personali degli

informatori. Ha trovato che la pronuncia ha correlato con la loro stratificazione sociale. Creando una situazione normale in cui l’informatore non è cosciente di essere osservato, evita che gli informatori modifichino la loro parlata locale cercando di parlare in un modo più corretto o proprio di quel che fanno normalmente.

Usando le registrazioni nascoste, secondo il paradosso dell’osservatore si ottiene la parlata più autentica. Questo rappresenta comunque un problema per quanto riguarda la privacy. Il Norsk senter for forskningsdata (NSD), è garante della privacy nei corpora delle scienze sociali norvegesi. Il NSD, infatti, richiede che i dati siano raccolti con la piena approvazione degli informatori. È molto probabile che dati di studi sociolinguistici compiuti nell’ultima parte del secolo scorso non sarebbero stati approvati dal NSD se la metodologia della raccolta dei dati fosse stata apertamente dichiarata. Volendo indagare l’uso del dialetto, si devono elicitare le situazioni in cui l’informatore si trova tra gli amici o in famiglia, ovvero in uno stato d’animo agitato, quando sappiamo che il dialetto viene usato di più. Alfonzetti (1992), raccogliendo i dati per la sua ampia ricerca su codeswitching tra italiano e siciliano a Catania verso la fine degli anni 80, ha registrato la parlata naturale di persone a riunioni di

ricercatori dell’università, a riunioni dei membri di un condominio, oppure

conversazioni tra amici, familiari e colleghi di lavoro in cui ha anche partecipato lei stessa. Un ottimo esempio in cui i suoi informatori si sarebbero agitati e in modo naturale avrebbero cambiato codice in siciliano, era durante delle interviste sul sistema fiscale, anche se l’interlocutore era uno sconosciuto.

I dati registrati apertamente vengono accettati dalle istituzioni come il NSD, però rappresentano ulteriori sfide per il ricercatore dovuto al paradosso

dell’osservatore, perché le registrazioni aperte possono rappresentare problemi

riguardanti l’autenticità dei dati. Il fatto che gli informatori sanno di essere registrati può fino a un certo grado creare situazioni artificiali, e il fatto che dopo la tecnica MG sanno che il dialetto è l’oggetto principale della ricerca, può creare l’uso eccessivo, falso o messo in scena del dialetto. Stenström, Andersen e Hasund hanno provato questo durante la loro raccolta dei dati per il COLT corpus, quando il

commento di un ragazzo parlando direttamente al registratore è molto rappresentativo in questo riguardo: “Now for some fucking dirty swear!” (Stenström et al., 2002, p.

35).

Sostengo che nel presente corpus (e probabilmente anche nella maggior parte dei corpora di parlato in generale), il problema della parlata innaturale è limitato, e che anche interazioni artificiali possono essere valido come oggetto di ricerca.

Anche se gli adolescenti parlano delle registrazioni e di essere registrati, non possono usare che il proprio comportamento linguistico nelle situazioni comunicative in cui agiscono. Inoltre, non sembrano affatto intimiditi dalla presenza del

registratore. Lo illustra perfettamente il commento di uno dei giovani informatori maschi dell’Istituto Tecnico Industriale in una delle sue ultime registrazioni in classe, in cui esclama riferendosi alle proprie registrazioni: “È materiale d’oro questo!” 32 3.3.2 L’innaturalezza dei dati

L’innaturalezza dei dati riguarda in genere una sovrarappresentazione di alcune caratteristiche linguistiche o non linguistiche dovute all’artificiosità della situazione di registrazione33. Alcune di queste caratteristiche sono più facili da osservare di altre.

Questo coincide presumibilmente con una sottorappresentazione di altre

caratteristiche che non sono direttamente osservabili, e quindi non saranno trattate in questa sede. Ho trovato utile classificare la nozione d’innaturalezza in tre categorie che non sono reciprocamente esclusive, ma comunque chiaramente distinguibili, e

32 Sulla registrazione degli adolescenti, vedi Stenström et al. (2002, p. 3).

33 John Wilson ha trattato come i dati linguistici vengono influenzati dal registratore, chiamerebbe questi dati tape-affected speech (1987, p. 168-176), cioè quando i ragazzi apertamente discutono se un lessema o una parola siano approriati da usare davanti al registratore.

che in misura diversa possono essere dette caratterizzare l’artificialità in una situazione di registrazione. Le tre categorie d’innaturalezza sono:

 Tematica: Gli informatori parlano della registrazione, del progetto e della ricercatrice norvegese, parlano della loro lingua e il dialetto, hanno un uso eccessivo di bestemmie e esclamazioni dialettali;

 linguistica: Quando l’informatore è cosciente del fatto di essere analizzato da un linguista, è probabile che più o meno consapevolmente cercherà di

modificare il suo vernacolo in un modo più corretto, in un registro più formale o nella varietà che sa è desiderata come oggetto di ricerca;

 paralinguistica: tratti soprasegmentali come caratteristiche prosodiche di intonazione o inflessione della voce, gesti, ridacchiando e recitando vari ruoli in una conversazione perché sanno che vengono registrati.

Sarà esemplificato come queste categorie a vario grado sono problematiche per quanto riguarda l’autenticità dei dati. L’artificialità tematica riguarda l’argomento degli informatori, di che cosa stanno parlando. Se parlano del fatto di essere registrati, del proprio uso linguistico oppure di ricercatori norvegesi non possono usare che la loro lingua naturale, l’innaturalezza si trova solamente in un uso eccessivo di certe particelle lessicali (cioè parolacce) in relazione al contesto situazionale.

L’innaturalezza linguistica riguarda fattori sociolinguistici e stilistici nei vari livelli analitici. Gli informatori tendono a scegliere una certa varietà su un’altra perché pensano che sia desiderata. Può riguardare tratti fonetici, morfologici o lessicali, ma può anche essere a livello stilistico o pragmatico, come l’uso eccessivo di alcuni segnali discorsivi o esclamazioni dialettali. L’innaturalezza paralinguistica è la categoria più difficile da osservare perché riguarda fattori che sono tratti

soprasegmentali acustici. Possono essere locati tramite scrupolose analisi strumentali (Walker, 2011; Wichmann, 2011). Questo non è fattibile da un’analisi auditiva con una trascrizione ortografica come è convenzionalmente applicata nel progetto attuale e in molti altri corpora di parlato (COLT e COLA), ma verrà comunque esemplificato nell’analisi.