Rapporto segnale-rumore di picco - Peak signal-to-noise ratio
Rapporto segnale-rumore di picco ( PSNR ) è un termine tecnico per il rapporto tra la massima potenza possibile di un segnale e la potenza del rumore corruttore che influisce sulla fedeltà della sua rappresentazione. Poiché molti segnali hanno una gamma dinamica molto ampia , il PSNR è solitamente espresso come quantità logaritmica utilizzando la scala dei decibel .
PSNR è comunemente usato per quantificare la qualità della ricostruzione per immagini e video soggetti a compressione con perdita di dati .
Definizione
PSNR è più facilmente definito tramite l' errore quadratico medio ( MSE ). Data un'immagine monocromatica m × n priva di rumore I e la sua approssimazione rumorosa K , MSE è definito come:
Il PSNR (in dB ) è definito come:
Qui, MAX I è il valore pixel massimo possibile dell'immagine. Quando i pixel sono rappresentati utilizzando 8 bit per campione, questo è 255. Più in generale, quando i campioni sono rappresentati utilizzando PCM lineare con B bit per campione, MAX I è 2 B -1.
Applicazione in immagini a colori
Per le immagini a colori con tre valori RGB per pixel, la definizione di PSNR è la stessa eccetto che MSE è la somma di tutte le differenze di valori quadrati (ora per ciascun colore, ovvero tre volte le differenze rispetto a un'immagine monocromatica) divisa per la dimensione dell'immagine e per tre. In alternativa, per le immagini a colori, l'immagine viene convertita in uno spazio colore diverso e il PSNR viene riportato su ciascun canale di quello spazio colore, ad esempio YCbCr o HSL .
Stima della qualità con PSNR
PSNR è più comunemente usato per misurare la qualità della ricostruzione dei codec di compressione con perdita (ad esempio, per la compressione delle immagini ). Il segnale in questo caso sono i dati originali e il rumore è l'errore introdotto dalla compressione. Quando si confrontano i codec di compressione, PSNR è un'approssimazione della percezione umana della qualità della ricostruzione.
I valori tipici per il PSNR nell'immagine con perdita e nella compressione video sono compresi tra 30 e 50 dB, a condizione che la profondità di bit sia di 8 bit , dove più alto è meglio. La qualità di elaborazione delle immagini a 12 bit è considerata elevata quando il valore PSNR è 60 dB o superiore. Per i dati a 16 bit i valori tipici per il PSNR sono compresi tra 60 e 80 dB. I valori accettabili per la perdita di qualità della trasmissione wireless sono considerati compresi tra circa 20 dB e 25 dB.
In assenza di rumore, le due immagini I e K sono identiche e quindi l'MSE è zero. In questo caso il PSNR è infinito (o indefinito, vedi Divisione per zero ).
Confronto delle prestazioni
Sebbene un PSNR più elevato indichi generalmente che la ricostruzione è di qualità superiore, in alcuni casi potrebbe non esserlo. Bisogna essere estremamente attenti con l'intervallo di validità di questa metrica; è valido solo in modo definitivo quando viene utilizzato per confrontare i risultati dello stesso codec (o tipo di codec) e dello stesso contenuto.
In generale, è stato dimostrato che PSNR ha prestazioni scadenti rispetto ad altre metriche di qualità quando si tratta di stimare la qualità delle immagini e in particolare dei video percepiti dagli umani.
varianti
PSNR-HVS è un'estensione di PSNR che incorpora proprietà del sistema visivo umano come la percezione del contrasto .
PSNR-HVS-M migliora su PSNR-HVS tenendo conto anche del mascheramento visivo . In uno studio del 2007, ha fornito migliori approssimazioni dei giudizi sulla qualità visiva umana rispetto a PSNR e SSIM con ampio margine. È stato anche dimostrato di avere un netto vantaggio rispetto a DCTune e PSNR-HVS.
Guarda anche
- Rapporto di compressione dei dati
- Valutazione percettiva della qualità video (PEVQ)
- Indice di somiglianza strutturale (SSIM)
- Qualità video soggettiva
- Fusione di valutazione multimetodo video
- Qualità video