CASP - CASP

Una struttura di destinazione (nastri) e 354 previsioni basate su modelli sovrapposte (spine Calpha grigie); da CASP8

La valutazione critica della previsione della struttura delle proteine ( CASP ) è un esperimento a livello comunitario e mondiale per la previsione della struttura delle proteine che si svolge ogni due anni dal 1994. Il CASP offre ai gruppi di ricerca l'opportunità di testare oggettivamente i propri metodi di previsione della struttura e fornisce una valutazione indipendente del stato dell'arte nella modellazione della struttura proteica per la comunità di ricerca e gli utenti del software. Anche se l'obiettivo principale del CASP è quello di aiutare a far progredire i metodi per identificare la struttura tridimensionale della proteina dalla sua sequenza di amminoacidi, molti vedono l'esperimento più come un "campionato mondiale" in questo campo della scienza. Più di 100 gruppi di ricerca da tutto il mondo partecipano regolarmente al CASP e non è raro che interi gruppi sospendano le altre ricerche per mesi mentre si concentrano sulla preparazione dei server per l'esperimento e sull'esecuzione delle previsioni dettagliate.

Selezione delle proteine ​​bersaglio

Al fine di garantire che nessun predittore possa avere informazioni preliminari sulla struttura di una proteina che lo avvantaggerebbero, è importante che l'esperimento sia condotto in doppio cieco: né i predittori né gli organizzatori e i valutatori conoscono le strutture delle proteine ​​bersaglio nel momento in cui vengono fatte le previsioni. Gli obiettivi per la previsione della struttura sono strutture che saranno presto risolte mediante cristallografia a raggi X o spettroscopia NMR, o strutture che sono state appena risolte (principalmente da uno dei centri di genomica strutturale ) e sono mantenute in attesa dalla Protein Data Bank . Se si scopre che la sequenza data è correlata per discendenza comune a una sequenza proteica di struttura nota (chiamata modello), è possibile utilizzare un modello proteico comparativo per prevedere la struttura terziaria . I modelli possono essere trovati utilizzando metodi di allineamento della sequenza (ad esempio BLAST o HHsearch ) o metodi di filettatura proteica , che sono migliori nel trovare modelli lontani tra loro. In caso contrario, deve essere applicata la previsione de novo della struttura proteica (ad es. Rosetta), che è molto meno affidabile ma a volte può fornire modelli con la piega corretta (di solito, per proteine ​​inferiori a 100-150 amminoacidi). Le pieghe veramente nuove stanno diventando piuttosto rare tra i bersagli, rendendo quella categoria più piccola di quanto desiderabile.

Valutazione

Il metodo principale di valutazione è un confronto delle posizioni previste del modello α-carbonio con quelle nella struttura target. Il confronto è mostrato visivamente da grafici cumulativi delle distanze tra coppie di equivalenti α-carbonio nell'allineamento del modello e della struttura, come mostrato in figura (un modello perfetto rimarrebbe a zero per tutto il percorso), ed è assegnato un punteggio numerico GDT-TS (Global Distance Test—Total Score) che descrive la percentuale di residui ben modellati nel modello rispetto al target. Anche la modellazione libera (template-free, o de novo ) viene valutata visivamente dai valutatori, poiché i punteggi numerici non funzionano altrettanto bene per trovare somiglianze allentate nei casi più difficili. Le previsioni basate su modelli ad alta precisione sono state valutate in CASP7 in base al fatto che abbiano funzionato per la sostituzione molecolare in fasi della struttura cristallina target con successi seguiti in seguito e dalla qualità del modello completo (non solo α-carbonio ) e dalla corrispondenza del modello completo all'obiettivo in CASP8.

La valutazione dei risultati viene effettuata nelle seguenti categorie di previsione:

  • previsione della struttura terziaria (tutti i CASP)
  • previsione della struttura secondaria (eliminata dopo CASP5)
  • predizione di complessi di strutture (solo CASP2; un esperimento separato, CAPRI, porta avanti questo argomento)
  • previsione contatto residuo-residuo (a partire da CASP4)
  • previsione delle regioni disordinate (a partire da CASP5)
  • previsione del confine di dominio (CASP6-CASP8)
  • previsione della funzione (a partire da CASP6)
  • valutazione della qualità del modello (a partire da CASP7)
  • perfezionamento del modello (a partire da CASP7)
  • previsione basata su modelli ad alta precisione (a partire da CASP7)

La categoria di previsione della struttura terziaria è stata ulteriormente suddivisa in:

  • modellazione dell'omologia
  • riconoscimento delle pieghe (chiamato anche threading proteico ; Nota, questo non è corretto poiché il threading è un metodo)
  • predizione de novo della struttura, ora denominata "New Fold" poiché molti metodi applicano funzioni di valutazione, o punteggio, che sono influenzate dalla conoscenza delle strutture proteiche native, come una rete neurale artificiale.

A partire da CASP7, le categorie sono state ridefinite per riflettere gli sviluppi nei metodi. La categoria "Modellazione basata su modelli" include tutti i precedenti modelli comparativi, modelli basati su piegatura omologa e alcuni modelli basati su piegatura analoghi. La categoria "modellazione libera da modelli (FM)" comprende modelli di proteine ​​con pieghe mai viste in precedenza e modelli basati su pieghe analoghe rigide. A causa del numero limitato di target liberi da template (sono piuttosto rari), nel 2011 è stato introdotto il cosiddetto CASP ROLL. Questo esperimento CASP continuo (a rotazione) mira a una valutazione più rigorosa dei metodi di previsione senza modelli attraverso la valutazione di un numero maggiore di obiettivi al di fuori della normale stagione di previsione CASP. A differenza di LiveBench ed EVA , questo esperimento è nello spirito di previsione cieca di CASP, cioè tutte le previsioni sono fatte su strutture ancora sconosciute.

I risultati del CASP sono pubblicati in speciali numeri di supplemento della rivista scientifica Proteins , tutti accessibili attraverso il sito web del CASP. Un articolo principale in ciascuno di questi supplementi descrive le specifiche dell'esperimento mentre un articolo di chiusura valuta i progressi sul campo.

Nel dicembre 2018, CASP13 ha fatto notizia quando è stato vinto da AlphaFold , un programma di intelligenza artificiale creato da DeepMind . A novembre 2020, una versione migliorata 2 di AlphaFold ha vinto CASP14. Secondo uno dei co-fondatori del CASP, John Moult, AlphaFold ha ottenuto un punteggio di circa 90 su una scala di 100 punti di accuratezza di previsione per obiettivi proteici moderatamente difficili.

Guarda anche

Riferimenti

link esterno

Classifica dei risultati

Valutazioni automatizzate per CASP13 (2018)

Valutazioni automatizzate per CASP12 (2016)

Valutazioni automatizzate per CASP11 (2014)

Valutazioni automatizzate per CASP10 (2012)

Valutazioni automatizzate per CASP9 (2010)

Valutazioni automatizzate per CASP8 (2008)

Valutazioni automatizzate per CASP7 (2006)