Differenza media rigorosamente standardizzata - Strictly standardized mean difference

In statistica , la differenza media rigorosamente standardizzata (SSMD) è una misura della dimensione dell'effetto . È la media divisa per la deviazione standard di una differenza tra due valori casuali ciascuno di uno dei due gruppi. Inizialmente è stato proposto per il controllo di qualità e la selezione dei risultati nello screening ad alto rendimento (HTS) ed è diventato un parametro statistico che misura le dimensioni dell'effetto per il confronto di due gruppi qualsiasi con valori casuali.

Sfondo

Nello screening ad alta produttività (HTS), il controllo di qualità (QC) è fondamentale. Un'importante caratteristica del controllo qualità in un test HTS è la differenza tra i controlli positivi, i composti del test e i controlli negativi. Questa caratteristica QC può essere valutata utilizzando il confronto di due tipi di pozzetti nei saggi HTS . Il rapporto segnale-rumore (S/N), il rapporto segnale-sfondo (S/B) e il fattore Z sono stati adottati per valutare la qualità dei saggi HTS attraverso il confronto di due tipi di pozzetti studiati. Tuttavia, il S/B non tiene conto di alcuna informazione sulla variabilità; e il S/N può catturare la variabilità solo in un gruppo e quindi non può valutare la qualità del saggio quando i due gruppi hanno variabilità diverse. Zhang JH et al. proposto il Z-fattore . Il vantaggio del fattore Z rispetto a S/N e S/B è che tiene conto delle variabilità in entrambi i gruppi confrontati. Di conseguenza, il fattore Z è stato ampiamente utilizzato come metrica di controllo qualità nei test HTS. Il segno assoluto nel fattore Z rende scomodo derivare matematicamente la sua inferenza statistica.

Per derivare un parametro interpretabile meglio per misurare la differenziazione tra due gruppi, Zhang XHD ha proposto SSMD per valutare la differenziazione tra un controllo positivo e un controllo negativo nei saggi HTS. SSMD ha una base probabilistica a causa del suo forte legame con d + -probabilità (cioè la probabilità che la differenza tra due gruppi sia positiva). In una certa misura, la d + -probabilità è equivalente all'indice probabilistico ben stabilito P( X  >  Y ) che è stato studiato e applicato in molte aree. Supportato sulla sua base probabilistica, SSMD è stato utilizzato sia per il controllo di qualità che per la selezione dei risultati nello screening ad alto rendimento.

Concetto

Parametro statistico

Come parametro statistico, SSMD (indicato come ) è definito come il rapporto tra media e deviazione standard della differenza di due valori casuali rispettivamente da due gruppi. Supponiamo che un gruppo con valori casuali abbia media e varianza e un altro gruppo abbia media e varianza . La covarianza tra i due gruppi è Quindi, la SSMD per il confronto di questi due gruppi è definita come

Se i due gruppi sono indipendenti,

Se i due gruppi indipendenti hanno varianze uguali ,

Nella situazione in cui i due gruppi sono correlati, una strategia comunemente utilizzata per evitare il calcolo di consiste nell'ottenere prima osservazioni appaiate dai due gruppi e quindi stimare SSMD in base alle osservazioni appaiate. Sulla base di una differenza appaiata con la media della popolazione e , SSMD è

Stima statistica

Nella situazione in cui i due gruppi sono indipendenti, Zhang XHD ha derivato la stima della massima verosimiglianza (MLE) e la stima del metodo del momento (MM) di SSMD. Assumiamo che i gruppi 1 e 2 abbiano media campionaria e varianze campionarie . La stima MM di SSMD è quindi

Quando i due gruppi hanno distribuzioni normali con uguale varianza , la stima uniformemente minima della varianza imparziale (UMVUE) di SSMD è,

dove sono le dimensioni del campione nei due gruppi e .

Nella situazione in cui i due gruppi sono correlati, sulla base di una differenza appaiata con dimensione del campione, media campionaria e varianza campionaria , la stima MM di SSMD è

La stima UMVUE di SSMD è

SSMD è simile alla statistica t e alla d di Cohen, ma sono diverse tra loro come illustrato in.

Applicazione in saggi di screening ad alta produttività

SSMD è il rapporto tra media e deviazione standard della differenza tra due gruppi. Quando i dati vengono preelaborati utilizzando la trasformazione logaritmica come facciamo normalmente negli esperimenti HTS, SSMD è la media della variazione della piega logaritmica divisa per la deviazione standard della variazione della piega logaritmica rispetto a un riferimento negativo. In altre parole, SSMD è il cambio di piega medio (sulla scala logaritmica) penalizzato dalla variabilità del cambio piega (sulla scala logaritmica) . Per il controllo di qualità, un indice per la qualità di un test HTS è l'entità della differenza tra un controllo positivo e un riferimento negativo in una piastra di test . Per la selezione dei risultati, l'entità degli effetti di un composto (cioè una piccola molecola o un siRNA ) è rappresentata dall'entità della differenza tra il composto e un riferimento negativo. SSMD misura direttamente l'entità della differenza tra due gruppi. Pertanto, SSMD può essere utilizzato sia per il controllo di qualità che per la selezione dei risultati negli esperimenti HTS.

Controllo di qualità

Il numero di pozzetti per i controlli positivo e negativo in una piastra nella piattaforma da 384 o da 1536 pozzetti è normalmente progettato per essere ragionevolmente grande. Si supponga che i controlli positivo e negativo in una piastra abbiano media del campione , varianze del campione e dimensioni del campione . Di solito, vale l'ipotesi che i controlli abbiano la stessa varianza in una piastra. In tal caso, l'SSMD per la valutazione della qualità in quella piastra è stimato come

dove . Quando l'ipotesi di uguale varianza non è valida, l'SSMD per valutare la qualità in quella piastra è stimato come

Se ci sono chiaramente valori anomali nei controlli, l'SSMD può essere stimato come

dove sono le mediane e le deviazioni assolute mediane nei controlli positivi e negativi, rispettivamente.

Il criterio QC basato sul fattore Z è comunemente utilizzato nei test HTS. Tuttavia, è stato dimostrato che questo criterio QC è più adatto per un test con controlli molto o estremamente forti positivi. In un test RNAi HTS, un controllo positivo forte o moderato è solitamente più istruttivo di un controllo positivo molto o estremamente forte perché l'efficacia di questo controllo è più simile ai risultati di interesse. Inoltre, i controlli positivi nei due esperimenti HTS hanno teoricamente diverse dimensioni degli effetti. Di conseguenza, le soglie QC per il controllo moderato dovrebbero essere diverse da quelle per il controllo forte in questi due esperimenti. Inoltre, è comune che due o più controlli positivi vengano adottati in un singolo esperimento. L'applicazione degli stessi criteri di controllo qualità basati sul fattore Z a entrambi i controlli porta a risultati incoerenti come illustrato nelle letterature.

I criteri QC basati su SSMD elencati nella tabella seguente tengono conto dell'entità dell'effetto di un controllo positivo in un test HTS in cui il controllo positivo (come un controllo di inibizione) ha teoricamente valori inferiori al riferimento negativo.

Tipo di qualità A: Controllo moderato B: forte controllo C: Controllo molto forte D: Controllo estremamente forte
Eccellente
Bene
Inferiore
Povero

Nell'applicazione, se l'entità dell'effetto di un controllo positivo è nota biologicamente, adottare il criterio corrispondente basato su questa tabella. In caso contrario, la seguente strategia dovrebbe aiutare a determinare quale criterio QC dovrebbe essere applicato: (i) in molti test HTS per piccole molecole con un controllo positivo, di solito dovrebbe essere adottato il criterio D (e occasionalmente il criterio C) perché questo controllo di solito ha molto o molto effetti forti; (ii) per i saggi RNAi HTS in cui la vitalità cellulare è la risposta misurata, il criterio D dovrebbe essere adottato per i controlli senza cellule (vale a dire, i pozzetti senza cellule aggiunte) o controlli di fondo; (iii) in un saggio virale in cui la quantità di virus nelle cellule ospiti è di interesse, viene solitamente utilizzato il criterio C e occasionalmente il criterio D per il controllo positivo costituito da siRNA del virus.

Simili criteri QC basati su SSMD possono essere costruiti per un test HTS in cui il controllo positivo (come un controllo di attivazione) ha teoricamente valori maggiori del riferimento negativo. Maggiori dettagli su come applicare i criteri QC basati su SSMD negli esperimenti HTS possono essere trovati in un libro.

Hit selezione

In un test HTS, un obiettivo primario è selezionare composti con una dimensione desiderata di inibizione o effetto di attivazione. L'entità dell'effetto del composto è rappresentata dall'entità della differenza tra un composto in esame e un gruppo di riferimento negativo senza effetti di inibizione/attivazione specifici. Un composto con una dimensione desiderata di effetti in una schermata HTS è chiamato hit. Il processo di selezione dei risultati è chiamato selezione dei risultati. Ci sono due strategie principali per selezionare i successi con grandi effetti. Uno consiste nell'utilizzare determinate metriche per classificare e/o classificare i composti in base ai loro effetti e quindi selezionare il maggior numero di composti potenti che sia pratico per i test di convalida . L'altra strategia è verificare se un composto ha effetti abbastanza forti da raggiungere un livello prestabilito. In questa strategia, devono essere controllati i tassi di falsi negativi (FNR) e/o i tassi di falsi positivi (FPR).

SSMD può non solo classificare la dimensione degli effetti, ma anche classificare gli effetti come mostrato nella tabella seguente in base al valore della popolazione ( ) di SSMD.

Sottotipo di effetto Soglie per SSMD negativo Soglie per SSMD positivo
Estremamente forte
Molto forte
Forte
Abbastanza forte
Moderare
Abbastanza moderato
Abbastanza debole
Debole
Molto debole
Estremamente debole
Nessun effetto

La stima di SSMD per gli schermi senza repliche differisce da quella per gli schermi con repliche.

In uno schermo primario senza repliche, assumendo che il valore misurato (di solito sulla scala logaritmica) in un pozzetto per un composto testato sia e il riferimento negativo in quella piastra abbia dimensione del campione , media del campione , mediana , deviazione standard e deviazione assoluta mediana , il SSMD per questo composto è stimato come

dove . Quando ci sono valori anomali in un test che di solito è comune negli esperimenti HTS, è possibile ottenere una versione robusta di SSMD utilizzando

In una schermata di conferma o primaria con replicati, per il composto di prova i-esimo con replicati, calcoliamo la differenza appaiata tra il valore misurato (solitamente sulla scala logaritmica) del composto e il valore mediano di un controllo negativo in una piastra, quindi ottenere la media e la varianza della differenza appaiata tra i replicati. L'SSMD per questo composto è stimato come

In molti casi, gli scienziati possono utilizzare sia SSMD che il cambiamento di piegatura media per la selezione dei risultati negli esperimenti HTS. La trama dual-torcia elettrica in grado di visualizzare sia il cambiamento piega media e SSMD per tutti i test di composti in un saggio e di aiuto per integrare entrambi per selezionare successi in esperimenti HTS. L'uso di SSMD per la selezione dei risultati negli esperimenti HTS è illustrato passo dopo passo in

Guarda anche

Ulteriori letture

Riferimenti