EIDR - EIDR

Entertainment ID Registry Association
Logo EIDR 1.png
Formazione 2010
genere 501 (c) (6) società senza scopo di lucro
Sede centrale Redwood City, California
Direttore esecutivo
Kip Welch
Sito web www .eidr .org

L' intrattenimento Identifier Registry , o EIDR , è una società globale identificatore univoco del sistema per una vasta gamma di oggetti visivi audio, tra cui il cinema , la televisione , e radiofonici programmi. Il sistema di identificazione risolve un identificatore in un record di metadati associato a titoli, modifiche, DVD , codifiche, clip e mash-up di primo livello . EIDR fornisce anche identificatori per i fornitori di servizi video, come le reti di trasmissione e via cavo.

A giugno 2020, EIDR contiene oltre 2 milioni di record, inclusi quasi 400mila film e quasi un milione di episodi di oltre 40.000 serie TV.

EIDR è un'implementazione di un identificatore di oggetto digitale (DOI).

Storia

I sistemi di identificazione delle risorse multimediali esistono da decenni. La motivazione comune alla loro creazione è quella di abilitare la gestione delle risorse multimediali attraverso l'assegnazione di un ID univoco a un insieme di metadati che rappresentano le caratteristiche salienti di ciascuna risorsa. Nel corso del tempo tali sistemi tendono a proliferare e ciascuno di essi nasce per affrontare una serie specifica di problemi. Di conseguenza, vi è una notevole variazione tra i sistemi in termini di quali risorse sono classificate, quali metadati sono associati a ciascuna risorsa e la definizione stessa di una risorsa. Per citare alcuni esempi, il " taglio alla regia " di un film dovrebbe essere distinto dall'uscita nelle sale originale? Come tenere conto delle variazioni regionali (ad es. Traduzione del titolo o dialogo in lingue straniere)? Ulteriori complicazioni includono le procedure (e le credenziali richieste) per l'aggiunta di nuove risorse, la modifica di risorse esistenti e la creazione di risorse derivate.

EIDR è stato creato per affrontare questi problemi, così come altri riscontrati nei flussi di lavoro delle risorse video , sia in un contesto business-to-business che nelle attività di post-produzione intramurale dei produttori di contenuti. EIDR ha le seguenti caratteristiche:

  • Un registro centrale a disposizione di tutti i partecipanti
  • Possibilità di registrare facilmente nuove risorse
  • Un ID risorsa immutabile (e in particolare per quanto riguarda i cambiamenti nella proprietà della risorsa o nella posizione dei metadati o della risorsa stessa)
  • Rilevamento / prevenzione della creazione di duplicati della stessa risorsa
  • Possibilità di creare una serie di risorse video derivate da un'opera astratta (ad es. Uscita cinematografica originale, montaggio del regista, varianti linguistiche)
  • Possibilità di raggruppare le risorse video in base a relazioni più generali (ad es. Episodi di una stagione di una serie TV)
  • Un set base di metadati per differenziare le risorse, anche se strettamente correlate
  • Scalabile, immutabile, persistente

L'EIDR intende integrare, non sostituire, i sistemi di identificazione delle risorse esistenti. Al contrario, una caratteristica fondamentale è consentire a un record EIDR di includere riferimenti all'ID di quella risorsa in altri sistemi. Questa funzione è particolarmente utile per gli archivi cinematografici e televisivi, in quanto consente loro di incrociare facilmente i loro fondi con altre fonti per il lavoro e i metadati su di esso. In base alla progettazione, EIDR non replica le caratteristiche di altri sistemi di identificazione delle risorse, ad esempio sistemi commerciali che cercano di aggiungere valore attraverso metadati avanzati (ad esempio riepiloghi di trama, dettagli di produzione). È anche un obiettivo non tenere traccia delle informazioni sulla proprietà e sui diritti, che possono, tuttavia, essere implementate come applicazioni che utilizzano l'ID EIDR.

Modello di contenuto

EIDR si basa su una raccolta di record (ulteriormente suddivisi in campi) archiviati in un registro centrale. Questi record sono referenziati esternamente dai DOI, che vengono assegnati quando viene creato un record, e ogni identificatore è quindi immutabile. Il sistema di risoluzione degli identificatori alla base dei DOI è il sistema di gestione e quindi ogni Content ID EIDR nativo è un handle formattato, in maggiore specificità, per gestire gli standard DOI e EIDR.

Formato di Content ID

La forma canonica di un Content ID EIDR è un'istanza di un handle e ha il formato:

10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C

dove

  • 10.5240 è il prefisso DOI per una risorsa EIDR. Il "10" indica che l'handle è un DOI; altri prefissi sono assegnati ad altri tipi di risorse (ad esempio pubblicazioni accademiche ). Le cifre tra "." e "/" formano il prefisso secondario, che indica quale agenzia di registrazione all'interno della Fondazione Internazionale DOI (IDF) ha i diritti per gestire queste maniglie. "5240" è assegnato all'Associazione EIDR.
  • XXXX-XXXX-XXXX-XXXX-XXXX-C è il suffisso DOI. Ogni "X" indica una cifra esadecimale (AF), e "C" è una cifra di controllo ISO 7064 Mod 37,36 .

Esiste anche un formato binario compatto a 96 bit destinato all'incorporamento in piccoli carichi utili come le filigrane . Questo modulo viene generato dal formato canonico come segue:

  • Prefisso secondario a 16 bit: generato interpretando il prefisso secondario come valore binario, ad es. B'0001010001111000 '
  • Suffisso a 80 bit: la parte non checksum del suffisso, rappresentata come 10 byte

Il modulo Nome risorsa uniforme per un ID EIDR è specificato in RFC   7302 .

Per l'utilizzo sul Web, un ID contenuto EIDR può essere rappresentato come URI in una di queste forme:

  • https://doi.org/10.5240/XXXX-XXXX-XXXX-XXXX-XXXX-C : questo è un ID EIDR rappresentato come un riferimento proxy DOI (verrà reindirizzato da DOI al registro EIDR)
  • info: doi: 10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C [obsoleto] : questo è un ID EIDR rappresentato come un URI "info" conforme a RFC 4452 (ricordando che tutti gli ID EIDR sono anche ID DOI, ma non il conversare).

Tipi di record

Esistono quattro tipi di record di contenuto, ciascuno associato a un prefisso riservato:

  • Content ID (10.5240 / XXXX-XXXX-XXXX-XXXX-XXXX-C): è associato a una risorsa di intrattenimento come un film o una serie TV. I record di contenuto sono gerarchici, consentendo di esprimere relazioni come una serie, i cui figli sarebbero Stagioni, i cui figli a loro volta sarebbero episodi individuali. Sono supportate molte altre relazioni, come descritto di seguito. I record di contenuto costituiscono la maggior parte dei dati nel registro EIDR.
  • ID parte (10.5237 / XXXX-XXXX): identifica entità come dichiaranti, produttori di contenuti e distributori.
  • ID servizio video (10.5239 / XXXX-XXXX): identifica un servizio video, colloquialmente noto come "canale" o "rete": una sequenza lineare (di solito) di contenuti pianificata per essere trasmessa a orari specificati (ad es. L'ID servizio per Cartoon Network è 10.5239 / 8BE5-E3F6). I servizi video sono gerarchici: ad esempio, un genitore può avere più figli per tenere conto delle variazioni regionali o linguistiche).
  • ID utente (10.5238 / [0-9a-zA-Z _. # ()] {2-32}): identifica un utente utilizzando una stringa di 2–32 caratteri alfanumerici e caratteri speciali selezionati (illustrati qui con sintassi Perl ). Un Utente è principalmente un concetto amministrativo subordinato alle Parti (dalle quali ereditano i diritti di accesso). A differenza degli altri DOI EIDR, l'ID utente può essere utilizzato solo all'interno di EIDR (ad es. API di programmazione).

I sotto prefissi 5237, 5238, 5239 e 5240 sono tutti assegnati all'Associazione EIDR.

Record di contenuto

I record di contenuto sono oggetti classificati in base al tipo e alle relazioni. Ognuno ha tre diversi tipi di tipo (ortogonale):

  • Tipo di oggetto : ci sono un totale di 10 di questi. Il primo è il tipo di base, che ha i campi minimi necessari per descrivere un record di contenuto. Gli altri 9 derivano dal tipo di base e contengono campi aggiuntivi per la descrizione di oggetti più complessi.
  • Tipo strutturale : distinguono le rappresentazioni di un'opera e sono elencate in ordine crescente di specificità:
    • Astrazione : utilizzata per oggetti privi di realtà, come un contenitore di serie o il concetto più basilare dell'opera originale. Ciò corrisponde all'International Standard Musical Work Code (ISWC) per le opere musicali, all'International Standard Text Code (ISTC) per le opere testuali o all'International Standard Audiovisual Number (ISAN) per le opere audiovisive.
    • Performance : utilizzato per elementi che sono versioni particolari di un'opera, come l'uscita nelle sale originale o il montaggio del regista di un film o una versione censurata a livello locale di un programma televisivo. Ciò corrisponde approssimativamente all'International Standard Recording Code (ISRC) per le opere musicali e ad alcuni usi della versione ISAN (V-ISAN) per le opere audiovisive.
    • Digitale : una particolare rappresentazione digitale di un'opera, come la codifica MPEG-2 di un film. Ciò corrisponde ad alcuni usi del V-ISAN.
  • Tipo di referente : il tipo di risorsa di contenuto, indipendente da una particolare manifestazione (ad esempio, un film mostrato in TV è ancora un film):
    • Serie : un'astrazione che contiene singoli elementi ordinati o non ordinati.
    • Stagione : un secondo livello di raggruppamento sotto una serie, che di solito copre un intervallo di tempo
    • TV : contenuto apparso per la prima volta tramite trasmissione.
    • Film : contenuti di lunga durata apparsi per la prima volta in un cinema o in un teatro.
    • Breve : Definito in modo approssimativo per coprire un lavoro di 40 minuti o meno, come video musicali , cinegiornali teatrali o cortometraggi di cartoni animati o DTV.
    • Web : contenuto che è apparso per la prima volta sul Web. Questo è diverso dal contenuto di altrove che è stato reso disponibile sul Web.
    • Materiale interattivo : contenuto non strettamente audiovisivo. Copre menu DVD, sovrapposizioni TV interattive, lettori personalizzati, ecc.
    • Compilazione : contenuto composto da più altre risorse che non possono essere descritte in modo più preciso, come un cofanetto di un franchise cinematografico.
    • Supplementare : questo tipo è per contenuto secondario il cui scopo principale è supportare, aumentare o promuovere altri contenuti. Gli esempi includono trailer, outtakes e documentari promozionali ("making of").

Metadati di base

I seguenti campi (presi da un insieme più ampio) comprendono i dati dell'oggetto di base di un record di contenuto:

  • Tipo strutturale : es. Astrazione
  • Modalità : ad es. AudioVisual (per un film o un programma TV); "Audio" per un programma radiofonico; "Visual" per un lavoro silenzioso.
  • Tipo referente : es. Film
  • Titolo : il titolo principale. Titoli e titoli alternativi sono ulteriormente distinti da:
    • Lang : la lingua del titolo espressa come codice ISO 639-1
    • Classe : rilascio o regionale
  • Titolo alternativo 1..N : uno o più titoli alternativi (spesso varianti regionali o linguistiche)
  • Lingua originale : la lingua della versione originale espressa come codice ISO 639-1
  • Associated Org 1..N : ID party del produttore, studio, ecc.
  • Data di rilascio : data in cui il titolo è stato originariamente pubblicato
  • Paese di origine : codice ISO 3166-1 alpha 2 , con estensioni per i paesi defunti
  • Lunghezza approssimativa : espressa come XML Schema xs: duration datatype
  • ID alternativo 1..N : uno o più ID equivalenti espressi in un diverso sistema di ID risorsa (vedere la discussione di seguito).
  • Riconoscimenti : vengono forniti solo titoli scheletrici, generalmente riservati al regista e fino a quattro degli attori principali. Come notato, non è un obiettivo per EIDR competere con sistemi proprietari con metadati ricchi (ad esempio riepiloghi della trama). L'obiettivo principale è aiutare a disambiguare il titolo e aiutare con gli sforzi di convalida e deduplicazione.
  • Registrante : la parte che ha creato questo record di contenuti (ad esempio "10.5237 / superparty")
  • Data di creazione : data di creazione del record del contenuto
  • Stato : normalmente "valido" (ci sono casi speciali per record cancellati)
  • Data ultima modifica : l'ultima volta che questo record di contenuto è stato modificato

Record di contenuto eliminati

Un ID EIDR deve essere sempre risolvibile, quindi in circostanze normali il record del contenuto corrispondente sarà permanente. Sono disponibili due meccanismi per gestire errori o altre circostanze insolite. Quello preferito è l'aliasing, per cui un ID EIDR viene reindirizzato in modo trasparente a un altro record di contenuto. L'aliasing è comunemente impiegato per gestire una risorsa registrata due volte.

L'altro meccanismo è l'uso dei record di lapide. Viene utilizzato quando il record del contenuto è danneggiato o una risorsa altrimenti non valida è stata registrata accidentalmente. In questo caso, l'ID sarà alias di uno speciale record di lapide. La rimozione definitiva può essere riconosciuta dalle applicazioni perché il relativo campo ID EIDR sarà impostato sul valore distinto " 10.5240 / 0000-0000-0000-0000-0000-X ". Tieni presente che "X" indica la 24a lettera dell'alfabeto latino ( ASCII 0x58 o Unicode U + 0058).

ID alternativo

Disporre di un ricco set di ID alternativi per i contenuti è uno degli obiettivi principali di EIDR. Ciò consente agli ID EIDR di essere utilizzati ovunque nei flussi di lavoro dei contenuti; se è necessario un ID alternativo, è possibile trovarlo nei metadati dell'ID EIDR. EIDR supporta l'inclusione di riferimenti ID proprietari e altri standard (ad esempio ISAN). È possibile aggiungere ID alternativi aggiuntivi quando necessario (ad es. Da parti che desiderano supportare nuovi flussi di lavoro). Di seguito è riportato un esempio di ID alternativi per la risorsa EIDR 10.5240 / EA73-79D7-1B2B-B378-3A73-M (il film Blade Runner ). Se un ID alternativo è risolvibile algoritmicamente, ad esempio inserendolo in modo appropriato in un URL modello, EIDR rende disponibile quel collegamento.

ID alternativi per 10.5240 / EA73-79D7-1B2B-B378-3A73-M
ID alternativo 0000-0000-14A9-0000-K-0000-0000-E
Tipo: ISAN
ID alternativo n. 2 89
Tipo: IVA
ID alternativo n. 3 B000SW4DLM
Tipo: dominio proprietario : amazon.com
ID alternativo n. 4 12886
Tipo: dominio proprietario : flixster.com
ID alternativo # 5 15042
Tipo: dominio proprietario : thecinemasource.com
ID alternativo # 6 tt0083658
Tipo: IMDB Relazione: IsSameAs
ID alternativo # 7 E0087486000
Tipo: dominio proprietario : spe.sony.com/MPM
ID alternativo # 8 3929
Tipo: dominio proprietario : spe.sony.com/ProductID
ID alternativo n. 9 2002029
Tipo: dominio proprietario : warnerbros.com/MPM
ID alternativo # 10 389785
Tipo: dominio proprietario veronicamagazine.nl
ID alternativo n. 11 B001EC2J1G
Tipo: dominio proprietario : amazon.com
ID alternativo # 12 150002645
Tipo: dominio proprietario : bfi.org.uk

Gli ID alternativi sono partizionati in non proprietari e proprietari. I primi hanno tipi distinti e predefiniti (ad esempio quelli emessi da ISAN, IMDb e IVA), mentre gli ID proprietari sono tutti di tipo "Proprietario" e sono ulteriormente distinti da un dominio DNS associato. A partire da luglio 2017, sono disponibili oltre 2 milioni di ID alternativi direttamente tramite EIDR.

Relazioni tra oggetti

Gli oggetti contenuto possono essere correlati tra loro in base alla tabella seguente. Queste relazioni sono espresse come campi aggiuntivi nel record di contenuto e sono quindi relative a quell'oggetto. Notare che l'oggetto soggetto è il figlio e l'obiettivo è il genitore (ad esempio, il soggetto è <relation-type> Of parent). Ulteriori vincoli sono indicati nella tabella.

Relazioni di ereditarietà : l'oggetto su cui esiste la relazione può ereditare i campi dei metadati di base dall'oggetto a cui si riferisce la relazione. Su un oggetto può esistere una sola relazione di ereditarietà. Queste relazioni producono una struttura ad albero radicata nell'ID EIDR per un'astrazione.
isSeasonOf Un gruppo di episodi della serie rilasciati in un arco di tempo contiguo (ad es. Anno di trasmissione) ad es. 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Stagione 9") è una stagione di 10.5240 / C272-DA64-E2B5-0A78 -2AC3-Z ("Gli X-Files")
isEpisodeOf es. 10.5240 / E008-224D-0397-0560-6300-8 ("Sunshine Days") è un episodio di 10.5240 / AB95-8734-5D98-A282-2DF0-C ("Stagione 9").
isEditOf Un'istanza di un titolo con caratteristiche uniche che lo differenziano da qualsiasi altra versione. Ad esempio, 10.5240 / 7290-C8AD-12BA-4F93-3B07-7 ("Blade Runner: The Director's Cut") è una modifica di 10.5240 / EA73-79D7-1B2B-B378-3A73-M.
isManifestationOf Una manifestazione è un'istanza più specifica di un'opera che può essere venduta, trasmessa, trasferita o eseguita. Il genitore di una manifestazione dovrebbe essere una modifica. Ad esempio, 10.5240 / 9CE1-DE39-5F3E-073D-4307-7 è l'Ultraviolet Standard CFF (definizione standard, audio e sottotitoli in inglese) per "Blade Runner: The Director's Cut". È una manifestazione dell'opera astratta 10.5240 / EA73-79D7-1B2B-B378-3A73-M .
isClipOf Un (e solo uno) frammento contiguo di una risorsa.
Relazioni di dipendenza : gli oggetti a cui si riferisce la relazione hanno una forte incidenza sulla natura di base dell'oggetto su cui esiste la relazione. Ciò significa che gli oggetti a cui si fa riferimento nella relazione devono essere presi in considerazione durante il controllo dei duplicati quando un oggetto viene creato o modificato. Queste relazioni producono grafici diretti all'interno e attraverso gli alberi.
isCompositeOf Un'unica opera composta da parti di più altri dischi.
isCompilationOf Una raccolta di più opere intere che non è descrivibile più precisamente.
Relazioni leggere : non c'è eredità; gli oggetti a cui si riferiscono non influenzano la natura sottostante dell'oggetto su cui esiste la relazione. Queste relazioni vengono utilizzate principalmente quando ci si sposta all'interno dell'albero degli oggetti e si collegano gli alberi degli oggetti tra loro, producendo un grafico diretto attraverso gli elementi di quegli alberi.
isPackagingOf Per creare una raccolta di risorse che vengono rilasciate insieme, ad esempio 10.5240 / F219-975E-5990-4570-BA75-2 ("Hannah Montana e Miley ...") è un pacchetto di 10.5240 / 9ABE-2BF1-ACE7-EBA2-8E57 -N .
isPromotionOf Oggetti promozionali come un rimorchio.
isSupplementTo Materiale ausiliario che potrebbe essere trovato su un DVD, come un outtake o un dietro le quinte.
isAlternateContentFor Contenuto sincronizzato con la risorsa principale, come l'audio o un'angolazione della telecamera alternativa.

Utilizzo in standard e applicazioni

L'EIDR è stato incorporato in molti standard. Alcuni di quelli più significativi sono elencati qui:

  • SMPTE / AMWA : SMPTE Recommended Practice RP 2079 standardizza l'uso di EIDR nei contenitori multimediali MXF , al centro dei flussi di lavoro dei contenuti professionali, comprese le specifiche AMWA AS-03 e AS-11. La pratica raccomandata SMTPE 2021-5 consente di trasportare un identificatore EIDR ovunque venga utilizzato BXF per lo scambio di dati tra sistemi di trasmissione.
  • European Broadcasting Union (EBU) : EBUCore è un insieme di base comune di metadati descrittivi e tecnici che descrivono le risorse multimediali (audio, video, immagini fisse, sottotitoli, ecc.). Il personale EBU ed EIDR ha prodotto una mappatura di EBUCore per i record di base sugli oggetti radice EIDR: .. EIDR ed EBU stanno lavorando insieme nel gruppo di lavoro SMPTE Core per definire metadati descrittivi per le specifiche ei flussi di lavoro basati su SMPTE. EIDR è uno degli standard supportati da EBU Core.
  • DVB : EIDR è indicato nella bozza delle specifiche DVB per gli schermi complementari (tm-sm-css-0017r14).
  • MPEG : EIDR è stato proposto come identificatore di contenuto nel Multimedia Preservation Application Format che viene definito per uso archivistico.
  • CableLabs (USA) : EIDR fa parte dello standard CableLabs Metadata per la distribuzione di risorse video on demand. EIDR è un identificatore di programma che può essere presente in un descrittore di segmentazione SCTE-35 2013, uno standard utilizzato nella distribuzione IP su cavo. EIDR viene utilizzato anche nei prodotti DAI (Dynamic Ad Insertion) che utilizzano l'architettura standard SCTE 130.
  • EIDR e ID alternativi : al fine di promuovere l'interoperabilità di EIDR con un'ampia varietà di sistemi, EIDR include un campo "AlternateID" per il riferimento incrociato dei sistemi di ID esistenti. Gli ID alternativi possono includere, ad esempio, CRID ( RFC 4078 ), ISAN, ISRC, UPC o URI , nonché sistemi di ID commerciali come Ad-ID , Baseline, IMDb, ecc. Attualmente circa la metà dei record EIDR contiene un ID da almeno un altro sistema.
  • Mappatura da altri metadati e identificatori standard a EIDR : altri sistemi di metadati e identificatori possono essere mappati direttamente in EIDR:
    • EN 15907 e EN 15744 : questi standard sono sotto gli auspici del Comitato europeo di standardizzazione CEN / TC 372 e filmstandards.org. Le migliori pratiche e mappature sono disponibili per gli oggetti radice EN 15907 e EN 15744. L'EIDR sta anche lavorando con gli archivi cinematografici per estendere l'interoperabilità con questi standard a un livello di dettaglio più granulare, compreso un progetto con il British Film Institute (BFI) per registrare i propri record basati su EN 15907 con EIDR.
    • International Standard Audiovisual Number (ISAN) : ISAN è ampiamente utilizzato nei sistemi di gestione e raccolta dei diritti. È disponibile una mappatura completa di una registrazione ISAN in una registrazione EIDR. La UK Audio-Visual Registration Agency, una joint venture tra EIDR e ISAN-UK, fornisce servizi di registrazione congiunta per entrambi gli identificatori. I precursori di questo servizio sono stati utilizzati per ottenere ID EIDR e ISAN per i contenuti trasmessi da ITV (una rete televisiva commerciale nel Regno Unito).

Gli identificatori EIDR hanno trovato la loro strada in un numero crescente di applicazioni commerciali. Di seguito sono illustrati alcuni dei vantaggi dell'utilizzo di EIDR:

  • Integrazione Warner Brothers-Xbox : EIDR è stato utilizzato per migliorare l'implementazione di un sistema di vendita elettronica (EST) per la distribuzione di titoli Warner Theatrical ai clienti Microsoft Xbox Live . Il funzionamento di un negozio elettronico richiede che diversi gruppi all'interno della Warner Brothers coordinino le loro attività con il team Xbox. Il lato in uscita della catena di distribuzione includeva la pubblicazione di "Avail" (titoli disponibili per la vendita) e il monitoraggio dell'evasione degli ordini; il lato in entrata includeva l'immissione di ordini. Altre funzioni come i report si estendevano su entrambi i lati della catena di distribuzione. Il sistema originale richiedeva intervento manuale e supervisione, in particolare ai confini tra le organizzazioni. Un esempio della necessità di un'elaborazione manuale potrebbe essere la verifica che sia stata fornita la versione corretta di una risorsa (che può variare a seconda dei sottotitoli o del contenuto). Nel nuovo sistema Warner Brothers ha creato un nuovo ID EIDR per ogni variante di contenuto, che è stato utilizzato per tutte le fasi di elaborazione successive. Ciò ha eliminato l'ambiguità e facilitato l'automazione delle fasi in entrata e in uscita. Un altro vantaggio era la possibilità di creare report al volo.
  • Swisscom EPG integration : Swisscom gestisce un servizio di Pay TV in Svizzera. Nel 2014 ha completato il lancio di una guida elettronica alla programmazione (EPG) per i suoi clienti basata su EIDR. Si tratta di un sistema end-to-end in cui gli ID EIDR vengono utilizzati per rappresentare le risorse visualizzate nell'EPG. Un elemento chiave del sistema era che gli ID EIDR venivano utilizzati anche nei metadati della guida forniti a Swisscom da media-press.tv. Ciò includeva la configurazione di un sistema per l'assegnazione degli ID EIDR alle risorse che non erano già presenti nel registro. Un vantaggio chiave dell'utilizzo di EIDR è non dover tradurre tra diversi sistemi di identificazione.

Operazioni e amministrazione

EIDR è amministrato dall'associazione EIDR senza scopo di lucro, fondata nell'ottobre 2010 da MovieLabs , CableLabs , Comcast e Rovi . I membri sono cresciuti costantemente da allora: alla fine del 2014 conta 79 membri suddivisi tra i livelli di Promotori di settore e Collaboratore di settore. La categoria in più rapida crescita sono le società non statunitensi, che ora rappresentano circa il 20% dei membri. L'Associazione EIDR gestisce due registri EIDR: Produzione e Sandbox. Il primo è il sito ufficiale e il secondo è riservato al test e allo sviluppo. Entrambi i sistemi sono disponibili pubblicamente online, ma non è garantito che i contenuti della sandbox siano corretti, completi o che facciano riferimento a risorse esistenti. Solo i membri dell'associazione EIDR possono modificare il registro.

Registrazione

La registrazione di nuove risorse può essere eseguita individualmente o in blocco (fino a 100.000 risorse alla volta). In entrambi i casi, il flusso di lavoro comprende una combinazione di processi automatizzati (per eseguire attività ben definite ma noiose) e manuali (in cui è richiesto il giudizio umano). È anche iterativo, poiché il processo di corrispondenza iniziale può identificare una serie di lacune ed errori che devono essere affrontati.

La registrazione di nuove risorse è un processo complesso che richiede una certa preparazione, in particolare nel caso di invio in blocco. I processi automatizzati controlleranno la sintassi, si assicureranno che i metadati di base siano forniti e che tutte le dipendenze (ad esempio i record di serie create prima degli episodi costitutivi) siano rispettate. I passaggi manuali includono la verifica che le parti corrette siano associate alla risorsa. Uno dei passaggi più importanti è garantire che una nuova risorsa non esista già nel registro: questo è trattato nella sezione successiva.

Per poter registrare un nuovo asset un utente deve essere associato a un soggetto a cui è stato concesso il ruolo di "Registrante" dall'operatore EIDR. Un registrante può essere un agente principale, come uno studio o una casa di codifica, ma può anche essere una Parte che effettua la registrazione in blocco degli articoli del catalogo arretrato o una Parte che agisce per conto di qualcun altro. È anche un requisito che un dichiarante sia un membro EIDR. In generale, proprietà del contenuto, autorità dei metadati e capacità di registrazione sono concetti separati e non correlati.

Deduplicazione

Ciò si riferisce alla segnalazione delle risorse inviate al registro come rientranti in una delle seguenti tre categorie:

  • La risorsa candidata è unica (rispetto alle risorse del registro esistenti).
  • La risorsa candidata è un duplicato di un record esistente.
  • La risorsa candidata ha un'alta probabilità di essere un duplicato.

Questa valutazione si basa sull'applicazione di un (ampio) insieme di regole all'asset candidato, che si traduce in un punteggio numerico. Il bucket si verifica come risultato del confronto del punteggio con due soglie:

  • Soglia bassa : qualsiasi risorsa con un punteggio inferiore a questo valore non è considerata un duplicato. Questo è l'unico caso in cui l'aggiunta o la modifica di un record proposta avrà esito positivo.
  • Soglia alta : qualsiasi asset con un punteggio superiore a questo valore è considerato (quasi certamente) un duplicato. L'aggiunta / modifica del record proposta non procederà e verrà restituito uno stato di errore. I dichiaranti generalmente utilizzano l'ID preesistente per l'elemento che hanno tentato di registrare e possono aggiungere informazioni mancanti e ID alternativi al record esistente.

Si ritiene che le attività che rientrano tra la soglia bassa e quella alta abbiano un'elevata possibilità di essere un duplicato: l'aggiunta / la modifica del record proposta non procederà fino a quando non sarà esaminata manualmente dal personale operativo dell'EIDR.

Architettura

Di seguito sono illustrati i componenti del sistema EIDR.

Architettura del registro EIDR

I principali blocchi funzionali sono i seguenti:

  • Registro principale : questo modulo è una personalizzazione e configurazione del repository di oggetti digitali CNRI. Esegue varie funzioni tra cui registrazione, generazione di identificatori univoci, indicizzazione, gestione dell'archiviazione di oggetti e controllo degli accessi.
  • Repository : memorizza e fornisce l'accesso agli oggetti registrati; per EIDR, questi oggetti sono raccolte di metadati, non le risorse multimediali stesse. I metadati includono informazioni standard sugli oggetti, relazioni e impostazioni di controllo dell'accesso.
  • REST AP I: un'interfaccia REST che fornisce l'accesso al set completo di funzionalità di registro non amministrative. I servizi possono effettuare chiamate singole o in batch, che possono essere inviate in modo sincrono o asincrono. Una sintassi di query generale consente il recupero (e in alcuni casi la modifica) dei record del registro che soddisfano una serie di criteri specificati dal chiamante.
    • EIDR SDK : viene fornito agli sviluppatori per facilitare la creazione di applicazioni di terze parti (solitamente a supporto di un flusso di lavoro B2B o intramurale). Comprende un Java SDK, un .NET SDK e programmi di esempio basati sui due SDK. L'utilizzo dell'SDK è consigliato rispetto alle chiamate dirette all'API REST.
    • Strumenti della riga di comando : si tratta di semplici applicazioni Java e .NET, costruite sull'SDK, ognuna delle quali fornisce una singola funzione, come risoluzione, query, corrispondenza e registro.
    • Interfaccia utente Web : un'interfaccia utente basata sul Web principalmente per la ricerca, la ricerca e l'esplorazione della gerarchia degli oggetti. Supporta anche semplici registrazioni.
  • Proxy DOI : utilizzando il prefisso dell'handle, inoltra le richieste di risoluzione DOI EIDR al registro EIDR.
  • Sistema di gestione : fornisce servizi di ricerca e risoluzione distribuiti

Relazione con DOI e sistema di manipolazione

Un ID EIDR è un esempio specializzato di un identificatore di oggetti digitali (DOI), che a sua volta è costruito sopra il sistema di manipolazione sviluppato dalla Corporation for National Research Initiatives (CNRI). Gli aspetti specifici dell'EIDR degli strati inferiori sono descritti più dettagliatamente di seguito.

Identificatore di oggetti digitali (aspetti EIDR)

Un identificatore di oggetti digitali, standardizzato come ISO 26324, cerca di identificare in modo univoco un'ampia gamma di artefatti digitali tra cui libri, registrazioni, dati di ricerca e altri contenuti digitali. L'obiettivo non è solo che gli ID siano unici, ma persistenti e immutabili. A differenza degli URL, gli identificatori DOI rimangono gli stessi anche se gli oggetti si spostano in un'altra posizione o diventano di proprietà di un'altra organizzazione. Ecco alcune delle caratteristiche del DOI:

  • La Fondazione Internazionale DOI (IDF) applica le regole concordate in precedenza sulle agenzie di registrazione costituenti (ad esempio EIDR) per garantire la continuità. In particolare, se una RA cessa di operare, i nomi che ospita saranno rilevati da un'altra RA.
  • L'IDF definisce le regole a cui devono aderire tutti i nomi DOI (quali tipi di oggetto possono essere nominati da una RA specifica)
  • Il sistema DOI fornisce un modello di dati, basato su un dizionario di dati, per abilitare un mezzo strutturato per esprimere i metadati (e le relazioni tra oggetti).
  • Il sistema DOI dispone di un proprio set distribuito e altamente ridondante di handle e server proxy.
  • Tutti i prefissi DOI hanno la forma "10.NNNN" dove 10 è un indicatore di directory e "NNNN" è un codice registrante nell'intervallo 1-65535 (ad esempio, l'uso dei record di contenuto EIDR è 10.5240)

Il modello di dati DOI fornisce i mezzi per associare i metadati a ciascun oggetto, nonché le politiche che ne regolano l'uso. Nelle parole del Manuale DOI, i metadati possono includere "nomi, identificatori, descrizioni, tipi, classificazioni, posizioni, tempi, misurazioni, relazioni e qualsiasi altro tipo di informazione relativa a [un oggetto]". I metadati fluiscono tra le seguenti entità:

  • Fornitore di risorse : solitamente il proprietario della risorsa multimediale, che è responsabile dell'inserimento dei metadati nel sistema.
  • Agenzia di registrazione : le entità che fungono da repository delle risorse (e dei metadati associati). Come notato, DOI supporta una federazione di RA indipendenti, ciascuna responsabile di una serie di risorse. EIDR è uno di questi RA. Altri includono CrossRef per articoli accademici, DataCite per dati di ricerca e OPOCE per pubblicazioni ufficiali dell'Unione europea.
  • Utente del servizio : le entità che eseguono query sui metadati di RA recuperano i metadati associati alle risorse. Il framework di risoluzione DOI è responsabile dell'invio di una query alla RA appropriata (l'utente del servizio non ha bisogno di saperlo).

Per favorire l'interoperabilità tra RA, DOI ha il concetto di un kernel di metadati. Questo è un set base di metadati che dovrebbero avere tutti gli oggetti archiviati nel framework DOI. Il set completo può essere trovato nel manuale DOI. L'interoperabilità è un argomento ampio che va oltre l'ambito dell'EIDR, ma il seguente sottoinsieme è particolarmente rilevante per le risorse EIDR:

  • referente : un oggetto mantenuto nel sistema DOI.
  • referentName : il nome del referente (es. il titolo di un film)
  • primaryReferentType : per EIDR, questo include la creazione (ad es. risorse di intrattenimento) e la festa (ad es. il suo creatore).
  • StructuralType : si tratta di categorie che si escludono a vicenda che identificano la forma di un asset. Due risorse particolarmente rilevanti per le risorse EIDR sono un'astrazione (un oggetto come un film che può esistere in più forme) e una performance (un'istanza specifica di un oggetto come Director's Cut).
  • principalAgent : per le creazioni, l'entità principale responsabile della sua esistenza.
  • registrationAuthorityCode : denota l'agenzia che ha emesso il DOI. Questa sarebbe la RA EIDR per le risorse EIDR.

I metadati EIDR sono disponibili nel formato standard dei metadati del kernel DOI e nei formati specifici EIDR. Il DOI per lo schema dei metadati DOI è doi: 10.1000 / 276 .

Sistema di manipolazione (aspetti EIDR)

DOI è a sua volta implementato su Handle System, un servizio di risoluzione dei nomi distribuito, altamente scalabile. Una maniglia è definita come:

<Handle> :: = <Handle Naming Authority> "/" <Handle Local Name>

La Naming Authority è globalmente univoca e definisce sia uno spazio amministrativo che la sintassi del nome locale dell'handle. Per EIDR nella definizione precedente, "10.5240" è l'autorità di denominazione EIDR ed è responsabile della risoluzione del suffisso (incluso il fatto che è conforme alla sintassi prevista per una risorsa EIDR). La gamma di autorità di denominazione consentite è più generale di quella impiegata da DOI (o EIDR).

La natura distribuita del sistema Handle consente a ogni spazio dei nomi locale di essere ospitato su più siti di servizio distribuiti geograficamente. Si tratta di un modello federato in cui ogni spazio dei nomi locale ha il controllo completo sul posizionamento e sul funzionamento dei propri siti di servizio. Inoltre, ogni sito di servizio può contenere più server di risoluzione: le richieste dirette a un particolare sito di servizio verranno inviate in modo uniforme tra i server che lo costituiscono.

Il modello dati del sistema di impugnatura è semplice ma flessibile. Un numero arbitrario di valori può essere associato a ciascun handle. Nel tempo, questi valori possono essere creati, modificati e distrutti. Ciascuno di questi dati ha i seguenti attributi:

  • indice : un numero intero senza segno che identifica un valore di dati dagli altri che possono esistere per questo handle.
  • tipo : una stringa UTF-8 che identifica il tipo. Il sistema di tipi è estensibile e i tipi comuni vengono mantenuti come handle nell'autorizzazione di denominazione "0.TYPE". Non ci sono restrizioni sulla creazione di nuovi tipi, sebbene l'utilizzo di handle risolvibili come nomi di tipo sia la best practice consigliata. I tipi comuni includono URL per un singolo riferimento indiretto, "10320 / loc" per un set di alternative di risoluzione basate sul contesto e vari tipi amministrativi per la gestione del sistema di gestione, tutti basati sulla risoluzione di handle.
  • dato : il valore stesso, rappresentato come una sequenza di ottetti che vengono interpretati nel contesto della tipologia associata
  • permesso : diritti di accesso a questo particolare valore. Si noti che diversi valori di dati di un handle possono avere autorizzazioni diverse
  • TTL : un numero intero che specifica per quanto tempo un valore può essere memorizzato nella cache
  • timestamp : un numero intero (espresso come millisecondi dall'epoca Unix) che registra l'ultima volta che il valore è stato aggiornato
  • riferimento : un elenco di riferimenti ad altri valori di handle. Di solito vengono utilizzati per aggiungere credenziali (ad esempio una firma digitale).

L'accesso al sistema di manipolazione avviene tramite un protocollo di cablaggio definito in RFC 3652 ; Le applicazioni EIDR non devono preoccuparsi di questo a causa della stratificazione dei protocolli.

Guarda anche

Ulteriore lettura

  1. R. Kroon, R. Drewry, A. Leigh, S. McConnachie. "Identificazione dei contenuti per archivi audiovisivi". International Association of Sound and Audiovisual Archives Journal, estate 2015 (n. 45).
  2. R. Kroon. "Portare ordine agli identificatori digitali". Media and Entertainment Journal Winter 2014-2015: 148-150.
  3. R. Drewry, D. Dulchinos. "Trasformare l'intrattenimento attraverso la tecnologia". Media and Entertainment Journal Winter 2013-2014: 81-88.
  4. D. Agranoff, W. Michel, T. Wakai. "Integrazione e gestione ottimizzate dei metadati dei contenuti mediante Entertainment ID Registry (EIDR)". SCTE Cable-Tec Expo 2012.

link esterno

Riferimenti

  1. ^ ISO / IEC 7064: 2003 : Tecnologia dell'informazione - Tecniche di sicurezza - Verifica dei sistemi di caratteri. 2002
  2. ^ Schema XML W3C parte 2: tipi di dati seconda edizione
  3. ^ SMPTE RP 2079 . Nome DOI e rappresentazione dell'identificatore EIDR.
  4. ^ Specifiche di consegna del programma MXF AS-03 Advanced Media Workflow Association .
  5. ^ Advanced Media Workflow Association AS-11 MFX per la specifica del contributo .
  6. ^ SMPTE RP 2021-5: 2013 . Utilizzo di ID annuncio ed EIDR come identificatori alternativi in ​​SMPTE BXF e ATSC PMCP.
  7. ^ EBU TECH 3293 . EBU CORE METADATA SET Versione 1.5.
  8. ^ Documento DVB A167-2. Trasmissione video digitale (DVB); Schermi e stream associati; Parte 2: Identificazione dei contenuti e sincronizzazione dei media, luglio 2014. p. 52.
  9. ^ ISO / IEC CD 23000-15 . Tecnologia dell'informazione - Formato dell'applicazione multimediale (MPEG-A) - Parte 15: Formato dell'applicazione per la conservazione multimediale.
  10. ^ MD-SP-AMIv3.0-I02-121210 archiviati 2015/04/02 alla Wayback Machine . Specifiche di CableLabs Asset Management Interface 3.0.
  11. ^ ANSI / SCTE 35 2013 . Messaggio di avviso di inserimento del programma digitale per cavo.
  12. ^ SCTE 130-10 2013 . Inserimento di programmi digitali - Interfacce per sistemi pubblicitari, parte 10.
  13. ^ TC 372 Workshop Compendium . Come sono nate le EN 15744 e EN 15907.
  14. ^ Comunicato stampa . Swisscom completa la prima implementazione europea di Entertainment ID Registry con media-press.tv.
  15. ^ ISO 26324: 2012 : Informazioni e documentazione - Sistema di identificazione degli oggetti digitali, 2012.