Scala Likert - Likert scale

Una scala Likert ( / l ɪ k . Ər t / LIK -ərt o / l . K ər t / LY -kərt ) è un psicometrico scala comunemente coinvolti nella ricerca che impiega questionari . È l'approccio più utilizzato per ridimensionare le risposte nella ricerca sui sondaggi, in modo tale che il termine (o più completamente la scala di tipo Likert ) è spesso usato in modo intercambiabile con la scala di valutazione , sebbene esistano altri tipi di scale di valutazione.

La scala prende il nome dal suo inventore, lo psicologo Rensis Likert . Likert distingue tra una scala propriamente detta, che emerge dalle risposte collettive a un insieme di elementi (di solito otto o più), e il formato in cui le risposte sono valutate lungo un intervallo. Tecnicamente parlando, una scala Likert si riferisce solo alla prima. La differenza tra questi due concetti ha a che fare con la distinzione operata da Likert tra il fenomeno sottostante oggetto di indagine e i mezzi per catturare la variazione che punta al fenomeno sottostante.

Quando rispondono a un elemento Likert, gli intervistati specificano il loro livello di accordo o disaccordo su una scala simmetrica accordo-disaccordo per una serie di affermazioni. Pertanto, la gamma cattura l'intensità dei loro sentimenti per un determinato oggetto. In quanto tali, le scale Likert hanno trovato applicazione in psicologia e scienze sociali, statistica, economia e marketing.

È possibile creare una scala come semplice somma o media delle risposte al questionario sull'insieme dei singoli elementi (domande). In tal modo, il ridimensionamento Likert presuppone che le distanze tra ciascuna scelta (opzione di risposta) siano uguali. Molti ricercatori impiegano una serie di tali elementi che sono altamente correlati (che mostrano un'elevata coerenza interna ) ma anche che insieme cattureranno l'intero dominio in studio (che richiede correlazioni non perfette). Altri si attengono a uno standard in base al quale "Si presume che tutti gli elementi siano repliche l'uno dell'altro o in altre parole gli elementi sono considerati strumenti paralleli". Al contrario, la moderna teoria dei test tratta la difficoltà di ciascun elemento (gli ICC ) come informazioni da incorporare negli elementi di scala.

Composizione

Un esempio di questionario sul design di un sito web, con risposte in scala Likert

Una scala Likert è la somma delle risposte su diversi item Likert . Poiché molte scale Likert accoppiano ogni elemento Likert costituente con la propria istanza di una scala analogica visiva (ad esempio, una linea orizzontale, su cui il soggetto indica una risposta cerchiando o spuntando segni di graduazione), a volte si fa riferimento erroneamente a un singolo elemento. come essere o avere una scala, con questo errore che crea una confusione pervasiva nella letteratura e nel linguaggio del settore.

Un elemento Likert è semplicemente un'affermazione che l'intervistato è chiamato a valutare attribuendogli un valore quantitativo su qualsiasi tipo di dimensione soggettiva o oggettiva, con il livello di accordo/disaccordo come dimensione più comunemente utilizzata. Gli articoli Likert ben progettati mostrano sia "simmetria" che "equilibrio". Simmetria significa che contengono un numero uguale di posizioni positive e negative le cui rispettive distanze sono bilateralmente simmetriche rispetto al valore "neutro"/zero (indipendentemente dal fatto che tale valore sia presentato come candidato). Equilibrio significa che la distanza tra ciascun valore candidato è la stessa, consentendo confronti quantitativi come la media per essere validi tra elementi contenenti più di due valori candidati.

Il formato di un tipico elemento Likert a cinque livelli, ad esempio, potrebbe essere:

  1. Assolutamente in disaccordo
  2. Disaccordo
  3. Nè d'accordo né in disaccordo
  4. Concordare
  5. Assolutamente d'accordo

Il ridimensionamento Likert è un metodo di ridimensionamento bipolare , che misura la risposta positiva o negativa a un'affermazione. A volte viene utilizzata una scala pari, in cui l'opzione centrale di "né d'accordo né in disaccordo" non è disponibile. Questo è talvolta chiamato metodo di "scelta forzata", poiché l'opzione neutra viene rimossa. L'opzione neutrale può essere vista come un'opzione facile da prendere quando un rispondente non è sicuro, quindi è discutibile se si tratti di un'opzione veramente neutrale. Uno studio del 1987 ha trovato differenze trascurabili tra l'uso di "indeciso" e "neutro" come opzione centrale in una scala Likert a cinque punti.

Le scale Likert possono essere soggette a distorsione per diverse cause. Gli intervistati possono:

  • Evita di utilizzare categorie di risposta estreme ( pregiudizio di tendenza centrale ), soprattutto per il desiderio di evitare di essere percepiti come aventi opinioni estremiste (un esempio di pregiudizio per la desiderabilità sociale ). Questo effetto può apparire all'inizio di un test a causa dell'aspettativa che possano seguire domande su cui il soggetto ha una visione più forte, in modo tale che alle domande precedenti si "lascia spazio" a risposte più forti più avanti nel test. Questa aspettativa crea un bias che è particolarmente dannoso in quanto i suoi effetti non sono uniformi durante il test e non possono essere corretti attraverso una semplice normalizzazione generale;
  • Concordare con le dichiarazioni presentate ( bias di acquiescenza ), con questo effetto particolarmente forte tra le persone, come i bambini, le persone con disabilità dello sviluppo e gli anziani o gli infermi, che sono soggetti a una cultura di istituzionalizzazione che incoraggia e incentiva il desiderio di compiacere;
  • Non sono d'accordo con le frasi presentate per un desiderio difensivo di evitare di fare affermazioni errate e/o evitare conseguenze negative che gli intervistati possono temere possano derivare dalle loro risposte usate contro di loro, specialmente se interpretate male e/o prese fuori contesto;
  • Fornire risposte che ritengono verranno valutate come indicanti forza o mancanza di debolezza/disfunzione ("fingere bene"),
  • Fornire risposte che ritengono verranno valutate come indicanti debolezza o presenza di menomazione/patologia ("fingere di essere cattivi"),
  • Cerca di ritrarre se stessi o la loro organizzazione in una luce che ritengono più favorevole all'esaminatore o alla società rispetto alle loro vere convinzioni ( bias da desiderabilità sociale , la versione intersoggettiva del "finto bene" oggettivo discusso sopra);
  • Cerca di ritrarre se stessi o la loro organizzazione in una luce che ritengono che l'esaminatore o la società consideri meno favorevoli/più sfavorevoli delle loro vere convinzioni (la sfida alle norme , la versione intersoggettiva dell'obiettivo "fingere male" discusso sopra).

Progettare una scala con una chiave bilanciata (un numero uguale di affermazioni positive e negative e, soprattutto, un numero uguale di affermazioni positive e negative riguardo a ciascuna posizione o problema in questione) può ovviare al problema del bias di acquiescenza, poiché l'acquiescenza su elementi con chiave positiva sarà bilanciare l'acquiescenza su elementi con chiave negativa, ma i pregiudizi difensivi, di tendenza centrale e di desiderabilità sociale sono in qualche modo più problematici.

Punteggio e analisi

Dopo che il questionario è stato completato, ogni elemento può essere analizzato separatamente o in alcuni casi le risposte agli elementi possono essere sommate per creare un punteggio per un gruppo di elementi. Quindi, le scale Likert sono spesso chiamate scale sommative.

Se i singoli elementi Likert possano essere considerati dati a livello di intervallo, o se debbano essere trattati come dati categorici ordinati è oggetto di notevole disaccordo in letteratura, con forti convinzioni su quali siano i metodi più applicabili. Questo disaccordo può essere ricondotto, per molti aspetti, alla misura in cui gli elementi Likert vengono interpretati come dati ordinali .

Ci sono due considerazioni principali in questa discussione. Innanzitutto, le scale Likert sono arbitrarie. Il valore assegnato a un elemento Likert non ha una base numerica oggettiva, né in termini di teoria della misura né di scala (dalla quale si può determinare una metrica di distanza ). Il valore assegnato a ciascun elemento Likert è semplicemente determinato dal ricercatore che progetta l'indagine, che prende la decisione in base a un livello di dettaglio desiderato. Tuttavia, per convenzione, agli elementi Likert tendono ad essere assegnati valori interi positivi progressivi. Le scale Likert in genere vanno da 2 a 10, con 3, 5 o 7 che sono le più comuni. Inoltre, questa struttura progressiva della scala è tale che ogni successivo elemento Likert viene trattato come se indicasse una risposta "migliore" rispetto al valore precedente. (Questo può differire nei casi in cui è necessario l'ordine inverso della scala Likert).

Il secondo punto, forse più importante, è se la "distanza" tra ciascuna categoria di articoli successiva sia equivalente, come si deduce tradizionalmente. Ad esempio, nell'elemento Likert a cinque punti sopra, la deduzione è che la "distanza" tra la categoria 1 e 2 è la stessa tra la categoria 3 e 4. In termini di buona pratica di ricerca, è importante una presentazione equidistante da parte del ricercatore ; in caso contrario, potrebbe risultare una distorsione nell'analisi. Ad esempio, è improbabile che un elemento Likert a quattro punti con le categorie "Scarso", "Media", "Buono" e "Molto buono" abbia tutte le categorie equidistanti poiché esiste solo una categoria che può ricevere una valutazione inferiore alla media. Ciò probabilmente distorcerebbe qualsiasi risultato a favore di un risultato positivo. D'altra parte, anche se un ricercatore presenta quelle che crede siano categorie equidistanti, non può essere interpretato come tale dal rispondente.

Una buona scala Likert, come sopra, presenterà una simmetria di categorie intorno a un punto medio con qualificatori linguistici chiaramente definiti. In tale scalatura simmetrica, gli attributi equidistanti saranno tipicamente osservati più chiaramente o, almeno, dedotti. È quando una scala Likert è simmetrica ed equidistante che si comporterà più come una misurazione a livello di intervallo. Quindi, mentre una scala Likert è effettivamente ordinale , se ben presentata può comunque approssimare una misurazione a livello di intervallo. Questo può essere utile poiché, se fosse trattato solo come una scala ordinale, alcune informazioni preziose potrebbero andare perse se la "distanza" tra gli elementi Likert non fosse disponibile per essere presa in considerazione. L'idea importante qui è che il tipo appropriato di analisi dipende da come è stata presentata la scala Likert.

Le nozioni di tendenza centrale sono spesso applicabili a livello di elemento, ovvero le risposte mostrano spesso una distribuzione quasi normale. La validità di tali misure dipende dalla natura dell'intervallo sottostante della scala. Se si assume la natura dell'intervallo per un confronto di due gruppi, il test t per campioni appaiati non è inappropriato. Se devono essere eseguiti test non parametrici, si raccomanda la modifica di Pratt (1959) al test dei ranghi con segno di Wilcoxon rispetto al test dei ranghi con segno di Wilcoxon standard .

Le risposte a più domande Likert possono essere sommate a condizione che tutte le domande utilizzino la stessa scala Likert e che la scala sia un'approssimazione difendibile di una scala a intervalli, nel qual caso il teorema del limite centrale consente di trattare i dati come dati di intervallo che misurano una variabile latente. Se le risposte sommate soddisfano queste ipotesi, possono essere applicati test statistici parametrici come l' analisi della varianza . I limiti tipici per pensare che questa approssimazione sarà accettabile sono un minimo di quattro e preferibilmente otto elementi nella somma.

Per modellare direttamente le risposte binarie di Likert, queste possono essere rappresentate in forma binomiale sommando separatamente le risposte di accordo e di disaccordo. Il chi quadrato , il test Q di Cochran o il test McNemar sono procedure statistiche comuni utilizzate dopo questa trasformazione. Test non parametrici come il test del chi quadrato , il test di Mann-Whitney , il test dei ranghi con segno di Wilcoxon o il test di Kruskal-Wallis . sono spesso utilizzati nell'analisi dei dati di scala Likert.

In alternativa, le risposte alla scala Likert possono essere analizzate con un modello probit ordinato , preservando l'ordinamento delle risposte senza l'assunzione di una scala a intervalli. L'uso di un modello probit ordinato può prevenire errori che si verificano quando si trattano le valutazioni ordinate come misurazioni a livello di intervallo.

La valutazione basata sul consenso (CBA) può essere utilizzata per creare uno standard oggettivo per le scale Likert in domini in cui non esiste uno standard generalmente accettato o oggettivo. La valutazione basata sul consenso (CBA) può essere utilizzata per perfezionare o persino convalidare standard generalmente accettati.

Presentazione visiva di dati di tipo Likert

Una parte importante dell'analisi e della presentazione dei dati è la visualizzazione (o il tracciamento) dei dati. L'argomento del tracciamento dei dati di valutazione Likert (e altri) è discusso a lungo in due articoli di Robbins e Heiberger. Nella prima consigliano l'uso di quelli che chiamano grafici a barre in pila divergenti e li confrontano con altri stili di stampa. Il secondo articolo descrive l'uso della funzione Likert nel pacchetto HH per R e fornisce molti esempi del suo utilizzo.

Livello di misurazione

Si ritiene spesso che le cinque categorie di risposta rappresentino un livello di misurazione dell'intervallo . Ma questo può essere vero solo se gli intervalli tra i punti della scala corrispondono ad osservazioni empiriche in senso metrico. Reips e Funke (2008) mostrano che questo criterio è molto meglio soddisfatto da una scala analogica visiva . In effetti, possono apparire anche fenomeni che mettono in discussione anche il livello ordinale della scala nelle scale Likert. Ad esempio, in un insieme di elementi A ,  B ,  C classificati con una scala Likert possono apparire relazioni circolari come A  >  B , B  >  C e C  >  A. Ciò viola l' assioma della transitività per la scala ordinale.

La ricerca di Labovitz e Traylor fornisce prove che, anche con distorsioni piuttosto grandi delle distanze percepite tra i punti della scala, gli elementi di tipo Likert si avvicinano alle scale che sono percepite come intervalli uguali. Quindi questi elementi e altre scale di uguale apparenza nei questionari sono resistenti alle violazioni del presupposto della parità di distanza che molti ricercatori ritengono siano necessari per procedure e test statistici parametrici.

Modello Rasch

I dati in scala Likert possono, in linea di principio, essere utilizzati come base per ottenere stime a livello di intervallo su un continuum applicando il modello Rasch politomico , quando è possibile ottenere dati che si adattano a questo modello. Inoltre, il modello politomico di Rasch consente di verificare l' ipotesi che le affermazioni riflettano livelli crescenti di un atteggiamento o di un tratto, come previsto. Ad esempio, l'applicazione del modello spesso indica che la categoria neutra non rappresenta un livello di atteggiamento o tratto tra le categorie in disaccordo e in accordo.

Ancora una volta, non tutti i set di elementi scalati Likert possono essere utilizzati per la misurazione Rasch. I dati devono essere accuratamente controllati per soddisfare i rigidi assiomi formali del modello. Tuttavia, i punteggi grezzi sono le statistiche sufficienti per le misure Rasch, una scelta deliberata di Georg Rasch , quindi, se sei pronto ad accettare i punteggi grezzi come validi, puoi accettare anche le misure Rasch come valide.

Pronuncia

Rensis Likert , lo sviluppatore della scala, pronunciato il suo nome / l ɪ k . ər t / LIK -ərt '. Alcuni hanno sostenuto che il nome di Likert "è tra i più pronunciato male in [la] campo", perché molte persone pronunciare il nome della scala come / l . k ər t / LY -kərt .

Guarda anche

Riferimenti

link esterno