Progetto internazionale HapMap - International HapMap Project

L' International HapMap Project era un'organizzazione che mirava a sviluppare una mappa aplotipo ( HapMap ) del genoma umano , per descrivere i modelli comuni di variazione genetica umana . HapMap viene utilizzato per trovare varianti genetiche che influenzano la salute, le malattie e le risposte a farmaci e fattori ambientali. Le informazioni prodotte dal progetto sono rese disponibili gratuitamente per la ricerca.

L'International HapMap Project è una collaborazione tra ricercatori di centri accademici, gruppi di ricerca biomedica senza scopo di lucro e aziende private in Canada , Cina (inclusa Hong Kong ), Giappone , Nigeria , Regno Unito e Stati Uniti . È iniziato ufficialmente con un incontro dal 27 al 29 ottobre 2002 e si prevedeva che sarebbe durato circa tre anni. Comprende due fasi; i dati completi ottenuti nella Fase I sono stati pubblicati il ​​27 ottobre 2005. L'analisi del dataset della Fase II è stata pubblicata nell'ottobre 2007. Il dataset della Fase III è stato rilasciato nella primavera del 2009 e la pubblicazione che presenta i risultati finali è stata pubblicata nel settembre 2010.

sfondo

A differenza delle più rare malattie mendeliane , le combinazioni di diversi geni e l'ambiente giocano un ruolo nello sviluppo e nella progressione di malattie comuni (come diabete , cancro , malattie cardiache , ictus , depressione e asma ) o nella risposta individuale a farmaci agenti. Per trovare i fattori genetici coinvolti in queste malattie, si potrebbe in linea di principio fare uno studio di associazione a livello di genoma : ottenere la sequenza genetica completa di diversi individui, alcuni con la malattia e altri senza, e quindi cercare le differenze tra i due gruppi di genomi . A quel tempo, questo approccio non era fattibile a causa del costo del sequenziamento completo del genoma . Il progetto HapMap ha proposto una scorciatoia.

Sebbene due persone non imparentate condividano circa il 99,5% della loro sequenza di DNA , i loro genomi differiscono in posizioni specifiche dei nucleotidi . Tali siti sono noti come polimorfismi a singolo nucleotide (SNP) e ciascuna delle possibili forme geniche risultanti è chiamata allele . Il progetto HapMap si concentra solo sugli SNP comuni, quelli in cui ogni allele si trova in almeno l'1% della popolazione.

Ogni persona ha due copie di tutti i cromosomi , tranne i cromosomi sessuali nei maschi . Per ogni SNP, la combinazione di alleli di una persona è chiamata genotipo . La genotipizzazione si riferisce alla scoperta del genotipo di una persona in un determinato sito. Il progetto HapMap ha scelto un campione di 269 individui e ha selezionato diversi milioni di SNP ben definiti, ha genotipizzato gli individui per questi SNP e ha pubblicato i risultati.

Gli alleli degli SNP vicini su un singolo cromosoma sono correlati. In particolare, se è noto l'allele di un SNP per un dato individuo, è spesso possibile prevedere gli alleli degli SNP vicini. Questo perché ogni SNP è sorto nella storia evolutiva come una singola mutazione puntiforme , ed è stato poi trasmesso sul cromosoma circondato da altre mutazioni puntiformi precedenti. Gli SNP separati da una grande distanza sul cromosoma sono tipicamente non molto ben correlati, perché la ricombinazione avviene in ogni generazione e mescola le sequenze alleliche dei due cromosomi. Una sequenza di alleli consecutivi su un particolare cromosoma è nota come aplotipo .

Per trovare i fattori genetici coinvolti in una particolare malattia, si può procedere come segue. Per prima cosa viene identificata una certa regione di interesse nel genoma, forse da precedenti studi sull'ereditarietà. In questa regione si individua un insieme di tag SNP dai dati HapMap; questi sono SNP che sono molto ben correlati con tutti gli altri SNP nella regione. Pertanto, l'apprendimento degli alleli dei tag SNP in un individuo determinerà l'aplotipo dell'individuo con alta probabilità. Successivamente, si determina il genotipo di questi tag SNP in diversi individui, alcuni con la malattia e altri senza. Confrontando i due gruppi, si determina le posizioni probabili e gli aplotipi coinvolti nella malattia.

Campioni utilizzati

Gli aplotipi sono generalmente condivisi tra le popolazioni, ma la loro frequenza può differire notevolmente. Quattro popolazioni sono state selezionate per l'inclusione in HapMap: 30 trii Yoruba adulti ed entrambi i genitori di Ibadan , Nigeria (YRI), 30 trii di residenti nello Utah di discendenza dell'Europa settentrionale e occidentale (CEU), 44 individui giapponesi non imparentati da Tokyo , Giappone (JPT) e 45 persone cinesi Han non imparentate da Pechino , Cina (CHB). Sebbene gli aplotipi rilevati da queste popolazioni dovrebbero essere utili per lo studio di molte altre popolazioni, studi paralleli stanno attualmente esaminando l'utilità di includere ulteriori popolazioni nel progetto.

Tutti i campioni sono stati raccolti attraverso un processo di coinvolgimento della comunità con appropriato consenso informato. Il processo di coinvolgimento della comunità è stato progettato per identificare e tentare di rispondere a preoccupazioni culturalmente specifiche e fornire alle comunità partecipanti un input nel consenso informato e nei processi di raccolta dei campioni.

Nella fase III, sono stati assemblati 11 gruppi di discendenza globale: ASW (ascendenza africana nel sud-ovest degli Stati Uniti); CEU (residenti nello Utah con ascendenza dell'Europa settentrionale e occidentale dalla collezione CEPH); CHB (cinese Han a Pechino, Cina); CHD (cinese a Metropolitan Denver, Colorado); GIH (Indiani Gujarati a Houston, Texas); JPT (giapponese a Tokyo, Giappone); LWK (Luhya a Webuye, Kenya); MEX (ascendenza messicana a Los Angeles, California); MKK (Maasai a Kinyawa, Kenya); TSI (Toscani in Italia); YRI (Yoruba a Ibadan, Nigeria).

Fase ID Posto Popolazione Dettaglio
I / II CEU stati Uniti Residenti dello Utah con discendenza dell'Europa settentrionale e occidentale dalla collezione CEPH Dettaglio
I / II CHB Cina Cinese Han a Pechino , Cina Dettaglio
I / II JPT Giappone Giapponese a Tokyo , Giappone Dettaglio
I / II YRI Nigeria Yoruba a Ibadan , Nigeria Dettaglio
III ASW stati Uniti Ascendenza africana negli Stati Uniti sudoccidentali Dettaglio
III CHD stati Uniti Cinese nella metropolitana di Denver , CO , Stati Uniti Dettaglio
III GIH stati Uniti Indiani Gujarati a Houston , TX , Stati Uniti Dettaglio
III LWK Kenya Luhya a Webuye , in Kenya Dettaglio
III MKK Kenya Maasai a Kinyawa , in Kenya Dettaglio
III MXL stati Uniti Ascendenza messicana a Los Angeles , CA , Stati Uniti Dettaglio
III STI Italia Toscani in Italia Dettaglio

Sono stati inoltre creati tre pannelli combinati, che consentono una migliore identificazione degli SNP in gruppi al di fuori dei nove campioni omogenei: CEU + TSI (pannello combinato di residenti nello Utah con ascendenza dell'Europa settentrionale e occidentale dalla collezione CEPH e toscani in Italia); JPT + CHB (pannello combinato di giapponese a Tokyo, Giappone e cinese Han a Pechino, Cina) e JPT + CHB + CHD (pannello combinato di giapponese a Tokyo, Giappone, cinese Han a Pechino, Cina e cinese a Denver, Colorado) . CEU + TSI, ad esempio, è un modello migliore di individui britannici britannici rispetto al solo CEU.

Strategia scientifica

Negli anni '90 era costoso sequenziare l'intero genoma dei pazienti. Quindi il National Institutes of Health ha abbracciato l'idea di una "scorciatoia", che consisteva nel guardare solo i siti sul genoma in cui molte persone hanno un'unità di DNA variante. La teoria alla base della scorciatoia era che, poiché le principali malattie sono comuni, lo sarebbero anche le varianti genetiche che le hanno causate. La selezione naturale mantiene il genoma umano libero da varianti che danneggiano la salute prima che i bambini crescano, la teoria sostiene, ma fallisce contro le varianti che colpiscono più tardi nella vita, consentendo loro di diventare abbastanza comuni (Nel 2002 il National Institutes of Health ha avviato un progetto da 138 milioni di dollari chiamato HapMap per catalogare le varianti comuni nei genomi europei, asiatici e africani).

Per la Fase I, è stato genotipizzato un SNP comune ogni 5.000 basi. Complessivamente, sono stati genotipizzati più di un milione di SNP. La genotipizzazione è stata eseguita da 10 centri utilizzando cinque diverse tecnologie di genotipizzazione. La qualità della genotipizzazione è stata valutata utilizzando campioni duplicati o correlati e effettuando controlli periodici di qualità in cui i centri dovevano genotipizzare insiemi comuni di SNP.

Il team canadese è stato guidato da Thomas J. Hudson presso la McGill University di Montreal e si è concentrato sui cromosomi 2 e 4p. Il team cinese è stato guidato da Huanming Yang a Pechino e Shanghai e Lap-Chee Tsui a Hong Kong e si è concentrato sui cromosomi 3, 8p e 21. Il team giapponese è stato guidato da Yusuke Nakamura presso l' Università di Tokyo e si è concentrato sui cromosomi 5, 11, 14, 15, 16, 17 e 19. Il team britannico era guidato da David R. Bentley al Sanger Institute e si concentrava sui cromosomi 1, 6, 10, 13 e 20. C'erano quattro centri di genotipizzazione degli Stati Uniti: a team guidato da Mark Chee e Arnold Oliphant presso Illumina Inc. a San Diego (studiando i cromosomi 8q, 9, 18q, 22 e X), un team guidato da David Altshuler e Mark Daly presso il Broad Institute di Cambridge, USA (cromosomi 4q, 7q, 18p, Y e mitocondrio ), un team guidato da Richard Gibbs al Baylor College of Medicine di Houston (cromosoma 12) e un team guidato da Pui-Yan Kwok presso l' Università della California, San Francisco (cromosoma 7p).

Per ottenere abbastanza SNP per creare la mappa, il consorzio ha finanziato un grande progetto di ri-sequenziamento per scoprire milioni di SNP aggiuntivi. Questi sono stati inviati al database pubblico dbSNP . Di conseguenza, nell'agosto 2006, il database includeva più di dieci milioni di SNP e oltre il 40% di essi era noto per essere polimorfico . In confronto, all'inizio del progetto, sono stati identificati meno di 3 milioni di SNP e non più del 10% di essi era noto per essere polimorfici.

Durante la fase II, più di due milioni di SNP aggiuntivi sono stati genotipizzati in tutto il genoma da David R. Cox, Kelly A. Frazer e altri presso Perlegen Sciences e 500.000 dalla società Affymetrix .

Accesso ai dati

Tutti i dati generati dal progetto, comprese le frequenze SNP, i genotipi e gli aplotipi , sono stati inseriti nel pubblico dominio e sono disponibili per il download. Questo sito contiene anche un browser genoma che permette di trovare SNP in qualsiasi regione di interesse, le loro frequenze alleliche e la loro associazione a SNP vicini. Viene inoltre fornito uno strumento in grado di determinare gli SNP dei tag per una determinata regione di interesse. È inoltre possibile accedere a questi dati direttamente dal programma Haploview ampiamente utilizzato .

Pubblicazioni

Guarda anche

Riferimenti

link esterno