La natura dei dati

La natura dei dati

Scheda
Rilevanza teorica
Complessità concettuale e/o operativa
Completezza dell'articolo

I dati sono costruiti dal ricercatore, non sono neutrali, non hanno a che fare con la “realtà” nel modo ingenuo a cui ancora alcuni credono.

Il formato informativo dei dati

Il ricercatore esperto non usa tecniche “a caso” ma, esattamente, quelle tecniche che costruiranno il dato nel formato informativo che gli serve per costruire l’argomentazione nella maniera più efficace in quel dato caso, in quel contesto, per rispondere alle domande iniziali della ricerca.

È il caso di capire cosa sia il “formato informativo”.

Immaginiamo di dovere costruire un piccolo sistema di valutazione di un corso formativo; si potrebbe decidere, per esempio, di somministrare ai partecipanti un piccolo questionario con domande tipo “Ti è sembrato interessante il corso?”, “Credi che quanto appreso ti potrà essere utile?” e cose del genere; le risposte potrebbero essere chiuse; per esempio:

Credi che quanto appreso ti potrà essere utile?

1 Sicuramente sì

2 Probabilmente sì

n Etc.

Oppure aperte. Oppure potremmo decidere di non fare questionari ma interviste (cosiddette ‘ermeneutiche’ o ‘biografiche’). Ma potremmo anche decidere di fare un bel focus group radunando tutti gli studenti assieme e chiedendo loro le medesime cose. Non andiamo oltre, ma di possibilità ce ne sono parecchie.

Adesso domandiamoci: qual è la vera differenza in questi diversi approcci? Il contesto è il medesimo, i soggetti intervistati gli stessi e le domande anche; ci aspettiamo forse di ricevere le stesse identiche informazioni? La risposta corretta è “No”; certo, nell’esempio fatto il gruppo è piccolino, le variabili in gioco minime, potrebbe anche succedere di rilevare gli stessi dati ma, in generale, ciò non avverrà perché tecniche diverse costruiscono diversamente il dato, e tale diversa costruzione riguarda appunto ciò che abbiamo chiamato ‘formato informativo’. Nel caso del questionario strutturato rileviamo variabili (= proprietà quando vengono operativizzate, e vengono registrate in una matrice). Nel caso di domande aperte rileviamo informazioni testuali da post-codificare per eventualmente trasformarle in variabili (e quindi saranno oggetto di un’interpretazione). Nel caso del focus, idem, con l’aggiunta dell’interazione fra partecipanti, che ci fornisce indizi sulla genesi di determinate dichiarazioni. Ecco: formato numerico o testuale, prodotto autonomamente o attraverso interazioni diverse, riguarda il formato dell’informazione. Per ragioni strettamente linguistiche il modo in cui dati e informazioni vengono prodotti, trasformati, elaborati e interpretati portano a differenze sintattiche e semantiche anche notevoli, a seconda della tecnica utilizzata.

A questo punto abbiamo una notevole serie di nuovi quesiti da affrontare, fra i quali: in che modo agiscono, esattamente, queste “ragioni linguistiche”? In che maniera pratica agiscono le differenti costruzioni di dati? E infine: se le tecniche costruiscono le informazioni in maniera così differente, come possiamo essere certi di avere scelto quella giusta? Al momento accontentiamo di affrontare – e solo parzialmente – la prima questione, introducendo i concetti di intensione ed estensione.

Intensione ed estensione

Nella ricerca sociale (e quindi anche in valutazione) abbiamo costantemente dei problemi definitori: definire i concetti, chiarire le domande valutative, specificare standard, costruire indicatori, lavorare su cosa e come e quanto un programma sia “efficace”, semmai ritenendo che sia chiaro a tutti cosa sia, esattamente, efficacia.

La difficoltà definitoria non è nell’oggetto di studio ma nello strumento linguistico utilizzato per la sua definizione. Il problema della definizione (qualunque) riguarda il livello sintattico del discorso che viene generalmente dato per condiviso da tutti i parlanti consimili per educazione, competenze, esperienze e così via. Se per esempio dicessimo:

I bambini sono da considerare idonei a mangiare il cibo da soli quando sanno arrotolare gli spaghetti con la forchetta

ci rivolgeremmo a parlanti occidentali (probabilmente italiani ma questo può non essere chiaro) di classe media (perché c’è un riferimento implicito a una “buona maniera”) escludendo molti altri popoli (in Cina l’analogo riferimento potrebbe riguardare il saper mangiare il riso con le bacchette) e così via. In realtà poi la frase ha diversi livelli di ambiguità: il termine ‘idonei’ a cosa si riferisce? Idonei per mangiare a casa, per andare al ristorante, per non sfigurare con gli amici? E comunque gli spaghetti si possono mangiare anche in altri modi, sia pure considerabili “scorretti” solo a partire da uno schema mentale assai ben definito e stereotipato.

Il livello lessicale crea facile condivisione solo a patto di lasciare ampi margini oscuri e non argomentati. Ma anche il livello semantico può essere ingannevole e inadatto. Facciamo un esempio: l’analisi di un servizio per minori stranieri non accompagnati (MSNA); i nostri MSNA provengono da culture così differenti che diventa impossibile pensare alla condivisione di una qualsiasi semantica. E’ facile constatare dalle loro testimonianze lo “stupore” (in positivo o in negativo, anche se prevalentemente in positivo) per la vita in Occidente, declinata in maniera assai diversa da ciascuno di loro. Ma anche gli operatori del servizio hanno culture diverse, anche se in questo caso si tratta di culture professionali, di conoscenze tacite e lessici condivisi, e agende distinte fra gli operatori degli eventuali diversi centri e, ovviamente, distinte da quelle del vertice organizzativo. Le culture professionali piegano la visione del servizio, dell’utente, etc. “laminandole” in un determinato modo, come un imprinting particolare e potente. Anche se il livello semantico è enormemente più approfondito e utile di quello lessicale, è in ogni modo complesso e sfuggente e difficilmente analizzabile (se non ancora a un livello semantico, ma ciò genera una ricorsività infinita).

Quel che si intende affermare qui è che non esiste la possibilità di una definizione di ‘efficacia’ del centro, se con definizione si intende

L’atto, il fatto, il modo di definire, di determinare cioè il significato di una parola o comunque di una espressione verbale mediante una frase (il più possibile concisa, e comunque completa) costituita da termini il cui significato si presume già noto, così da individuare di quella parola o espressione le qualità peculiari e distintive, sia con l’indicarne l’appartenenza a determinate specie, generi, classi, ecc., sia col rilevarne funzioni, relazioni, usi, ecc. (Vocabolario Treccani).

Ciò che intende il vocabolario noi chiamiamo intensione ed estensione del concetto che possono essere così definiti:

  • Estensione: insieme di oggetti che ricadono nel dominio di uno stesso concetto, o all’interno di una stessa classe. Specie in altri ambiti disciplinari (linguistica, logica) anche ‘denotazione’, ‘significato’, ‘riferimento’.
  • Intensione: insieme delle caratteristiche costitutive di un concetto; ai fini della classificazione: le caratteristiche che un oggetto deve possedere per appartenere a una classe. Specie in altri ambiti disciplinari (linguistica, logica) anche ‘connotazione’, ‘senso’ o ‘comprensione’.

La prossima figura mostra un esempio di applicazione dei due concetti:

1-introduzione-alla-valutazione.001

Nel caso dei bambini che mangiano con la forchetta, possiamo disegnare così un’analoga figura:

1-introduzione-alla-valutazione.002

La definizione sintattica sarebbe quindi:

Bambini che sanno arrotolare gli spaghetti = bambini occidentali, presumibilmente italiani, di classe media e senza particolari problemi dietetici e di manualità, che a partire dai 4 anni circa sanno mangiare gli spaghetti con la forchetta secondo gli standard tipici della classe media.

Una definizione di questo genere per ‘efficacia del centro’, come si è visto, non è possibile, la qual cosa ci riporta al problema iniziale.

Nel caso del centro ipotizzato, l’estensione e l’intensione del concetto ‘MSNA’ possono essere definite a patto di riconoscere la continua variabilità e approssimazione di entrambe mentre, nel concetto di ‘efficacia’ (dell’intervento del centro sui MSNA) l’estensione può essere definita solo in termini osservativi (sono MSNA tutti quelli conosciuti dal centro più quelli ragionevolmente ipotizzati), come l’intensione (sono caratteristiche dei MSNA tutte quelle realmente verificate), e quindi il concetto – come già detto cangiante – è definibile ex post, basandolo sul risultato di un’osservazione. Il contrario di una definizione ex ante, stabilita per consentire l’osservazione.

Se torniamo all’esempio iniziale, dello strumento di valutazione del corso formativo, possiamo osservare che le risposte alle nostre domande, frutto di tecniche differenti, hanno in sostanza intensioni ed estensioni differenti, esprimendo qualità sintattica (denotazione) e semantica (connotazione) differenti e quindi, in buona sostanza, diversamente utilizzabili (per esempio in una matrice), diversamente elaborabili, diversamente integrabili con altri metodi (con riferimento ai mixed method).

I numeri come linguaggio

E i numeri? I dati numerici sfuggono a questa logica linguistica? No. I numeri sono una forma specifica di linguaggio, con una loro intensione ed estensione. Se riusciamo a capire questo elemento non avremo più una distinzione radicale fra linguaggio ordinario (quello delle parole che utilizziamo tutti i giorni) e linguaggio matematico, e potremo fare un discorso molto innovativo sul metodo come linguaggio. Ora: che in generale quello matematico sia “un linguaggio” è conoscenza comune, ma perché lo sia e, soprattutto, perché lo sia non già come analogia ma proprio in senso ristretto, questo non viene quasi mai indagato. Per potere accostare in senso proprio il linguaggio ordinario e quello matematico, occorre che i due elementi possiedano alcune caratteristiche in comune, caratteristiche che li accomunino come classe, mantenendo diversità di livello inferiore che li differenzino come sottoclassi (uso qui ‘classe’ e ‘sottoclasse’ non in senso specifico).

Le prime proprietà ad accumunare linguaggio ordinario e matematico sono l’estensione e l’intensione, già trattate nel precedente paragrafo. Anche i numeri, le funzioni, i calcoli e ogni utilizzo della matematica hanno un’estensione e un’intensione, ma di natura particolare (che è l’unica cosa che li differenzi realmente). L’intensione è minima (le proprietà di ‘3’ o di ‘x=y2’ sono legate alla funzione d’uso, e non a proprietà intrinseche) ma anche l’estensione è minima – diversamente da quanto accade nel linguaggio ordinario – perché ‘3’ non significa “tutti i ‘3’ del mondo, da ‘3 mele sulla mia tavola’ fino a ‘i 3 Re Magi’” ma solo e semplicemente quel numero 3 che sto utilizzando in quel momento, in quel contesto. I numeri hanno le proprietà dell’intensione e dell’estensione che si comportano diversamente dal linguaggio ordinario dove, di regola, maggiore è l’intensione e minore è l’estensione, e viceversa. E perché in matematica queste estensioni sono entrambe minime? Perché quello matematico è un linguaggio altamente formalizzato, costruito appunto per superare i “qualche, un po’, abbastanza, molti”, etc. Linguaggio formalizzato = minima estensione e intensione.

Un’altra proprietà comune ai due linguaggi è l’indicalità. Con questo termine si segnala il fatto che il linguaggio ordinario, notoriamente vago (concetto fondamentale introdotto da Russell nel 1923), si rende comprensibile ai parlanti grazie al fatto che fa riferimenti a circostanze e oggetti noti e contestuali; alcune parole sono marcatamente indicali. “io, tu, questo, quello, così…” ma a livelli diversi tutto il discorso umano (tutto il linguaggio) è indicale in quanto vago. Ebbene anche i numeri sono vaghi e perciò indicali. E dal discorso precedente già si è capito: ‘3’ non significa assolutamente nulla, esattamente come se io dicessi “G”. Ma neppure ‘3 mele’ significa nulla, esattamente come se io dicessi “Groenlandia”. Invece ‘Quelle 3 mele sul tavolo hanno un bel colore’ ha indubbiamente un significato, esattamente come “Mi piacerebbe fare un viaggio in Groenlandia”, ma solo se siamo interessati a quelle 3 mele e siamo lì in quella stanza a guardarle.

Come vedete i numeri hanno un significato vago che si traduce con una forte indicalità che – come detto sopra – in matematica si risolve con un linguaggio più formalizzato, diversamente dal linguaggio ordinario (non c’è “un po’” di mele, ce ne sono esattamente 3). Vediamo quindi che i numeri sono meri segni che – al pari delle lettere – si combinano per formulare concetti. I numeri sono concetti – quando non restano a mero livello segnico delle cifre – esattamente come le parole, e possono formare concetti matematici complessi esattamente come le parole possono formulare concetti più elaborati attraverso frasi complesse. In entrambi i casi abbiamo le regole combinatorie, grammaticali, per elaborare, accostare, far aumentare di senso i segni letterari e quelli matematici.

lettere (a, b, c, … z)parole o frasi nuclearifrasi complesse o periodiargomentazione (attori e contesto)
cifre (1, 2, 3, …0)numeri (p. es. naturali)operazionirelazioni; indicatori
segni (specificat.: simboli)concetticoncetti complessi o assertiuso pratico
analisi linguisticasintassisemanticapragmatica
inferenzededuzioneinduzioneabduzione
indicatoritipo 1tipo 2tipo 3

Ci sono altre proprietà che mostrano come i due linguaggi appartengano alla medesima classe. Per esempio il paradosso del Sorite che potremmo formulare così: se – col linguaggio ordinario – dico che “la piazza era gremita di manifestanti”, se ne togliessi uno la piazza sarebbe ancora definibile ‘gremita’? Indubbiamente sì; e se ne tolgo un altro, e un altro ancora? Di questo passo la piazza resterebbe con un solo manifestante, e in nessun caso potrei definirla ‘gremita’. A che punto, esattamente, la piazza da ‘gremita’ è diventata ‘non più gremita’? Sarebbe troppo lungo spiegare qui perché questo paradosso sia importante per i linguisti che trattano della vaghezza; basti dire che vi sono diverse proposte di soluzione e nessuna esente da critiche. Vedete comunque, in questo paradosso, un effetto della vaghezza del linguaggio ordinario. Ebbene il paradosso del Sorite si può applicare benissimo anche al linguaggio matematico; esistono numeri vaghi (i decimali periodici, i numeri irrazionali…) che devono essere arrotondati; ci sono limiti agli strumenti di misura (tolleranza); esiste un uso empirico estremamente approssimativo dei numeri in un certo tipo di indicatori di realizzazione utilizzati in valutazione… In tutti questi e altri casi fa capolino il paradosso del Sorite.

Il linguaggio matematico si differenzia quindi da quello ordinario solo per una maggiore formalizzazione, ma che condivida con questo le medesime caratteristiche e proprietà. Perché ci siamo soffermati su questo punto? Perché così facendo abbiamo sgomberato il campo da concetti errati: il linguaggio matematico non è più preciso, è più formalizzato; il linguaggio matematico non è un’altra cosa, è sempre linguaggio e soggetto alla stessa vaghezza; il linguaggio matematico quindi non è fondativo di una categoria del pensiero, di un metodo o – peggio detto – di una “scienza”; è appunto solo un linguaggio, e il metodo e le tecniche dei ricercatori sociali presentano solo differenze di formato informativo (come detto nella precedente puntata). Questa riflessione apre le porte di nuovi territori di riflessione, o di meno nuovi ma comunque poco praticati, come quello sui Mixed Method.

Come scegliere le tecniche col “giusto” formato informativo

Dovrebbe essere chiaro, a questo punto, che le diverse tecniche e procedure differiscono per l’estensione e l’intensione del dato, ciò che sopra abbiamo chiamato “formato informativo”. Le tecniche standard quali il questionario producono dati di ampia estensione e di limitata intensione. L’intervista biografica, al contrario, costruisce dati di limitatissima estensione e di molta profonda intensione.

Il ricercatore deve quindi conoscere come le proprietà ‘estensione’ e ‘intensione’ definiscano ogni diversa procedura operativa di costruzione dei dati per scegliere quelle più opportune. In ogni caso: “opportune” rispetto a che cosa? Torniamo per esempio sul caso iniziale, l’analisi del corso formativo. Abbiamo capito perché le diverse tecniche siano differenti, ma non abbiamo ancora una guida alla loro scelta. Ma non è poi difficile.

Nella ricerca valutativa, per esempio, ciò che deve guidare la scelta delle opportune tecniche sono, semplicemente:

Nella ricerca sociale non valutativa questa coppia fondamentale viene sostituita da questa:

  • le ipotesi da verificare:
  • la teoria generale.

(Per approfondire queste importi differenze consultare QUI).

Le differenti finalità e obiettivi della valutazione, il programma da valutare, i rapporti fra gli attori sociali e, in sintesi, tutto ciò che definisce il mandato, opportunamente calato nella cultura locale, alla luce di opportunità ed eventuali minacce, culture professionali, qualità delle reti e, in sintesi, tutto ciò che definisce il contesto, indirizzano il ricercatore verso approcci e tecniche di maggiore o minore estensione e intensione, proprio perché in quel modo e non in altri si riesce a comunicare col committente, coi decisori, con gli attori sociali. In quel modo, e non in altri, si riesce a costruire dati di maggiore significato perché quegli attori, in quel modo, hanno donato significato ai dati.

Sarà chiaro ai più che questa riflessione, giunta al termine, ha a che fare con molteplici argomenti di enorme interesse:

e non poco altro ancora.

Claudio Bezzi, 23 Febbraio 2018

Sostenete questo blog

interamente autofinanziato.






Categories: Metodo

Tags: , , , , , , , ,

Rispondi

%d blogger hanno fatto clic su Mi Piace per questo: