Regressione del lavello da cucina - Kitchen sink regression

In senso peggiorativo , una regressione del lavello da cucina è una regressione statistica che utilizza un lungo elenco di possibili variabili indipendenti per tentare di spiegare la varianza in una variabile dipendente . In economia , psicologia e altre scienze sociali , l'analisi di regressione viene tipicamente utilizzata in modo deduttivo per testare le ipotesi, ma una regressione al lavello da cucina non segue questa norma. Invece, l'analista getta "tutto tranne il lavandino della cucina" nella regressione nella speranza di trovare un modello statistico.

Questo tipo di regressione porta spesso a overfitting (ovvero suggerendo in modo fuorviante relazioni tra variabili indipendenti e dipendenti nei dati, il che può portare a generalizzazioni affrettate ). La ragione di ciò è che più variabili indipendenti sono incluse in una regressione, maggiore è la probabilità che una o più siano statisticamente significative mentre di fatto non hanno alcun effetto causale sulla variabile dipendente, cioè, più è probabile che la risultati devono essere affetto da errori di tipo I .

La regressione del lavello da cucina è un esempio della pratica del dragaggio dei dati .

Riferimenti

  • Barreto e Howland (2005). "Capitolo 17: Test di ipotesi congiunte". Econometria introduttiva: utilizzo della simulazione Monte Carlo con Microsoft Excel . Cambridge University Press. ISBN   0-521-84319-7 .