media bayesiana - Bayesian average

Una media bayesiana è un metodo per stimare la media di una popolazione utilizzando informazioni esterne, in particolare una credenza preesistente, che viene presa in considerazione nel calcolo. Questa è una caratteristica centrale dell'interpretazione bayesiana . Questo è utile quando il set di dati disponibile è piccolo.

Il calcolo della media bayesiana utilizza la media precedente m e una costante  C . C  viene scelto in base alla dimensione tipica del set di dati richiesta per una stima robusta della media campionaria. Il valore è maggiore quando la variazione attesa tra i set di dati (all'interno della popolazione più ampia) è piccola. È più piccolo quando si prevede che i set di dati varino sostanzialmente l'uno dall'altro.

Ciò equivale ad aggiungere punti dati C di valore m al set di dati. È una media ponderata di una media precedente m e della media campionaria.

Quando sono valori binari 0 o 1, m può essere interpretato come la stima precedente di una probabilità binomiale con la media bayesiana che fornisce una stima a posteriori per i dati osservati. In questo caso, C può essere scelto in base all'intervallo di confidenza della proporzione binomiale desiderato per il valore del campione. Ad esempio, per risultati rari quando m è piccolo, la scelta garantisce che un intervallo di confidenza del 99% abbia una larghezza di circa 2 m .


Guarda anche

Riferimenti

  • Yang, Xiao; Zhang, Zhaoxin (2013). "Combinazione di prestigio e classifica di rilevanza per la raccomandazione personalizzata". Atti della 22a conferenza internazionale ACM sulla gestione delle informazioni e della conoscenza (CIKM) : 1877-1880. doi : 10.1145/2505515.2507885 .