Frequenza dei fotogrammi - Frame rate

Frame rate (espresso in fotogrammi al secondo oFPS) è lafrequenza(velocità) con cuivengono catturate o visualizzateimmaginiconsecutive(fotogrammi). Il termine si applica ugualmente afilmevideocamere,computer graficaesistemi dicattura del movimento. Il frame rate può anche essere chiamato ilframe frequency ed essere espresso inhertz. La frequenza dei fotogrammi nelle specifiche della fotocamera elettronica può fare riferimento alla velocità massima possibile, dove, in pratica, altre impostazioni (come il tempo di esposizione) possono ridurre la frequenza a un numero inferiore.

Visione umana

La sensibilità temporale e la risoluzione della visione umana varia a seconda del tipo e delle caratteristiche dello stimolo visivo e differisce da individuo a individuo. Il sistema visivo umano può elaborare da 10 a 12 immagini al secondo e percepirle individualmente, mentre le frequenze più elevate sono percepite come movimento. La luce modulata (come il display di un computer ) è percepita come stabile dalla maggior parte dei partecipanti agli studi quando la frequenza è superiore a 50 Hz. Questa percezione della luce modulata come stabile è nota come soglia di fusione dello sfarfallio . Tuttavia, quando la luce modulata non è uniforme e contiene un'immagine, la soglia di fusione dello sfarfallio può essere molto più alta, nell'ordine delle centinaia di hertz. Per quanto riguarda il riconoscimento delle immagini , è stato scoperto che le persone riconoscono un'immagine specifica in una serie ininterrotta di immagini diverse, ognuna delle quali dura appena 13 millisecondi. La persistenza della visione a volte rappresenta uno stimolo visivo molto breve di un millisecondo con una durata percepita compresa tra 100 ms e 400 ms. Stimoli multipli molto brevi sono talvolta percepiti come un singolo stimolo, come un lampo di luce verde di 10 ms immediatamente seguito da un lampo di luce rossa di 10 ms percepito come un singolo lampo di luce gialla.

Film e video

Film muti

I primi film muti indicavano frame rate compresi tra 16 e 24 fotogrammi al secondo (fps), ma poiché le telecamere erano azionate a mano, la velocità cambiava spesso durante la scena per adattarsi all'atmosfera. I proiezionisti potrebbero anche modificare la frequenza dei fotogrammi nel cinema regolando un reostato che controlla la tensione che alimenta il meccanismo di trasporto della pellicola nel proiettore . Le compagnie cinematografiche spesso intendevano che i cinema mostrassero i loro film muti a frame rate più alti di quelli con cui sono stati girati. Questi frame rate erano sufficienti per il senso del movimento, ma era percepito come un movimento a scatti. Per ridurre al minimo lo sfarfallio percepito, i proiettori impiegavano otturatori a doppia e tripla lama , quindi ogni fotogramma veniva visualizzato due o tre volte, aumentando la frequenza di sfarfallio a 48 o 72 hertz e riducendo l'affaticamento degli occhi. Thomas Edison ha affermato che 46 fotogrammi al secondo erano il minimo necessario all'occhio per percepire il movimento: "Qualsiasi cosa in meno affatica l'occhio". Tra la metà e la fine degli anni '20, il frame rate per i film muti è aumentato da 20 a 26 FPS.

Film sonori

Quando la pellicola sonora fu introdotta nel 1926, le variazioni nella velocità della pellicola non erano più tollerate, poiché l'orecchio umano è più sensibile dell'occhio ai cambiamenti di frequenza. Molti cinema avevano proiettato film muti da 22 a 26 FPS, motivo per cui l'industria ha scelto 24 FPS per i film sonori come compromesso. Dal 1927 al 1930, man mano che vari studi aggiornavano le apparecchiature, la velocità di 24 FPS divenne standard per i film sonori da 35 mm. A 24 FPS, il film viaggia attraverso il proiettore a una velocità di 456 millimetri (18,0 pollici) al secondo. Ciò ha permesso a semplici otturatori a due lamelle di fornire una serie di immagini proiettate a 48 al secondo, soddisfacendo la raccomandazione di Edison. Molti moderni proiettori cinematografici da 35 mm utilizzano otturatori a tre lamelle per fornire 72 immagini al secondo: ogni fotogramma viene proiettato sullo schermo tre volte.

Animazione

Questo cartone animato di un cavallo al galoppo viene visualizzato a 12 disegni al secondo e il movimento veloce è sull'orlo di essere discutibilmente a scatti.

Nel tratto di animazione , personaggi che si muovono sono spesso di ripresa "a due a due", vale a dire, un disegno viene mostrato per ogni due fotogrammi del film (che di solito va a 24 fotogrammi al secondo), significa che ci sono solo 12 disegni al secondo. Anche se la velocità di aggiornamento dell'immagine è bassa, la fluidità è soddisfacente per la maggior parte dei soggetti. Tuttavia, quando a un personaggio è richiesto di eseguire un movimento rapido, di solito è necessario tornare all'animazione "su uno", poiché i "due" sono troppo lenti per trasmettere adeguatamente il movimento. Una miscela delle due tecniche mantiene l'occhio ingannato senza costi di produzione inutili.

L'animazione per la maggior parte dei " cartoni animati del sabato mattina " è stata prodotta nel modo più economico possibile ed è stata spesso girata su "tre" o anche "quattro", cioè tre o quattro fotogrammi per disegno. Questo si traduce rispettivamente in solo 8 o 6 disegni al secondo. Anche l'anime è solitamente disegnato su tre.

Standard video moderni

A causa della frequenza di rete delle reti elettriche, la trasmissione televisiva analogica è stata sviluppata con frame rate di 50 Hz (la maggior parte del mondo) o 60 Hz (Canada, Stati Uniti, Giappone, Corea del Sud). La frequenza della rete elettrica era estremamente stabile e quindi era logico utilizzarla per la sincronizzazione.

L'introduzione della tecnologia televisiva a colori ha reso necessario abbassare quella frequenza di 60 FPS dello 0,1% per evitare il " dot crawl ", un artefatto del display che appare sui display in bianco e nero legacy, mostrando su superfici altamente sature di colore. È stato riscontrato che riducendo il frame rate dello 0,1%, l'effetto indesiderato è stato ridotto al minimo.

A partire dal 2021, gli standard di trasmissione video in Nord America, Giappone e Corea del Sud si basano ancora su 60/1.001 × 59,94 immagini al secondo. In genere vengono utilizzate due dimensioni di immagini: 1920×1080 ("1080i") e 1280×720 ("720p"). Confusamente, i formati interlacciati sono solitamente indicati a metà della loro frequenza immagine, 29,97 FPS e il doppio della loro altezza dell'immagine, ma queste affermazioni sono puramente personalizzate; in ogni formato vengono prodotte 60 immagini al secondo. Una risoluzione di 1080i produce 59,94 immagini 1920×540, ciascuna schiacciata a metà altezza nel processo fotografico e allungata all'indietro per riempire lo schermo durante la riproduzione in un televisore. Il formato 720p produce immagini 59,94 1280×720p, non compresse, in modo che non sia necessaria alcuna espansione o compressione dell'immagine. Questa confusione era diffusa nel settore nei primi giorni del software video digitale, con molti software scritti in modo errato, i programmatori credevano che ci si aspettassero solo 29,97 immagini al secondo, il che non era corretto. Mentre era vero che ogni elemento dell'immagine veniva interrogato e inviato solo 29,97 volte al secondo, la posizione del pixel immediatamente sotto quella veniva interrogata 1/60 di secondo dopo, parte di un'immagine completamente separata per il successivo fotogramma di 1/60 di secondo .

Il film, alla sua velocità nativa di 24 FPS, non potrebbe essere visualizzato senza il necessario processo di pulldown , che spesso porta a "judder": per convertire 24 fotogrammi al secondo in 60 fotogrammi al secondo, ogni fotogramma dispari viene ripetuto, riproducendolo due volte, mentre ogni fotogramma pari è triplicato. Questo crea un movimento irregolare, apparendo stroboscopico. Altre conversioni hanno un raddoppio del frame irregolare simile. Gli standard video più recenti supportano 120, 240 o 300 fotogrammi al secondo, quindi i fotogrammi possono essere campionati uniformemente per frame rate standard come film a 24, 48 e 60 FPS o video a 25, 30, 50 o 60 FPS. Ovviamente questi frame rate più elevati possono essere visualizzati anche con i loro tassi nativi.

La frequenza dei fotogrammi nelle specifiche della fotocamera elettronica può fare riferimento alla velocità massima possibile, dove, in pratica, altre impostazioni (come il tempo di esposizione) possono ridurre la frequenza a un numero inferiore.

Aumento del frame rate

L'up-conversion del frame rate è il processo di aumento della risoluzione temporale di una sequenza video sintetizzando uno o più frame intermedi tra due frame consecutivi. Una frequenza fotogrammi bassa causa aliasing , produce artefatti da movimento improvvisi e degrada la qualità del video. Di conseguenza, la risoluzione temporale è un fattore importante che influenza la qualità video. Gli algoritmi per FRC sono ampiamente utilizzati nelle applicazioni, tra cui il miglioramento della qualità visiva, la compressione video e la generazione di video al rallentatore.

Video con frame rate basso
Video con frame rate 4 volte maggiore

metodi

La maggior parte dei metodi FRC può essere classificata in flusso ottico o metodi basati su kernel e allucinazioni pixel.

FRC . basato sul flusso

I metodi basati sul flusso combinano linearmente i flussi ottici previsti tra due frame di input per approssimare i flussi dal frame intermedio di destinazione ai frame di input. Propongono anche l'inversione del flusso (proiezione) per una deformazione dell'immagine più accurata . Inoltre, esistono algoritmi che forniscono pesi diversi di vettori di flusso sovrapposti a seconda della profondità dell'oggetto della scena tramite uno strato di proiezione del flusso.

FRC basato sulle allucinazioni pixel

I metodi basati sull'allucinazione dei pixel utilizzano la convoluzione deformabile al generatore di frame centrale sostituendo i flussi ottici con vettori di offset. Esistono algoritmi che interpolano anche i frame intermedi con l'aiuto della convoluzione deformabile nel dominio delle caratteristiche. Tuttavia, poiché questi metodi allucinano direttamente i pixel a differenza dei metodi FRC basati sul flusso, i fotogrammi previsti tendono ad essere sfocati quando sono presenti oggetti in rapido movimento.

Strumenti

Attrezzo disponibilità Moltiplicatore di aumento del frame massimo
Adobe Premiere Pro Commerciale, prova gratuita di 7 giorni 100
Vegas Pro Commerciale, prova gratuita di 30 giorni 100
Filtro di conversione del frame rate AviSynth MSU Commerciale Qualsiasi numero intero positivo
Convertitore di frame rate avanzato (AFRC) Gratuito Qualsiasi numero intero positivo
Topaz Video Migliora AI Commerciale, prova gratuita di 30 giorni 100
  • Adobe Premiere Pro - Adobe Premiere Pro è un programma software commerciale per l'editing video che consente di rallentare il video utilizzando il flusso ottico e gli effetti di rimappatura del tempo su filmati girati in modo convenzionale per creare un rallentatore dall'aspetto migliore e più fluido.
  • Vegas Pro - Vegas Pro è anche un programma software di editing video commerciale. Esiste anche un metodo per realizzare video al rallentatore. Per eseguirlo devi scegliere l'ampiezza del movimento nel tuo video e le percentuali di velocità di riproduzione.
  • Filtro di conversione del frame rate AviSynth MSU - Il filtro di conversione del frame rate AviSynth MSU è uno strumento open source destinato alla conversione della frequenza dei fotogrammi video. Aumenta il frame rate di volte interi. Permette, ad esempio, di convertire un video con 15 fps in un video con 30 fps.
  • Advanced Frame Rate Converter (AFRC) - Il vantaggio principale dell'algoritmo AFRC è l'utilizzo di diverse tecniche di miglioramento della qualità come il mascheramento adattivo degli artefatti, l'elaborazione delle strisce nere e il monitoraggio dell'occlusione:
    • la tecnica di mascheramento adattivo degli artefatti consente di rendere gli artefatti meno evidenti per gli occhi aumentando così la qualità integrale del video elaborato;
    • l'elaborazione della striscia nera permette di evitare gli artefatti che comunemente compaiono nei fotogrammi interpolati nel caso in cui la striscia nera si presenti vicino ai bordi del fotogramma;
    • il tracciamento dell'occlusione esegue il ripristino di alta qualità di frame interpolati vicino ai bordi in caso di presenza di movimento con direzione da/verso il bordo del frame.
  • Topaz Video Enhance AI - Topaz Video Enhance AI ha il modello Chronos AI che utilizza il deep learning per aumentare la frequenza dei fotogrammi video senza artefatti. Questo algoritmo genera nuovi fotogrammi che sono spesso indistinguibili dai fotogrammi acquisiti nella fotocamera.

Guarda anche

Riferimenti

link esterno

( Copia Wayback Machine )