11/1/13
Bioinformá)ca y bio/sica aplicada a la inmunología y al desarrollo de vacunas
Mirko Zimic, PhD. MSc. MHS. Unidad de Bioinformá
1
Bioinformatics Key Question
2
1
11/1/13
Antigen Presentation Pathways
3
Methods to Identify Epitopes 1. Immunochemical methods (e.g. ELISA)
2. X-‐ray crystallography: Ag-‐Ab complex is crystallized. The contact residues on the Ag are considered as the epitope.
3. Predic)on methods:
• Based on the data of experimentally established epitopes to find common sequence and/or structure paXern(s). • Develop computer algorithms that can predict if a given anonymous protein sequence has similar paXerns.
Epitope
4
2
11/1/13
Sequence-Based Approaches to Predict HLA Binding Specificity Simple Motifs
• Allowed/non allowed amino acids
Scoring Matrices
• Amino acid preferences based on multiple epitope alignment
Hidden Markov models
• Peptide statistics from sequence alignment
SVMs and neural networks
• Can take sequence correlations into account 5
Types of Epitopes 1. Sequential / Continuous epitopes:
• • •
Recognized by both B & T cells Linear peptide fragments Amphipathic helical 8-12 mer
2. Conformational / Discontinuous epitopes:
• • • •
Recognized by B cells Non-linear discrete amino acid sequences, Come together due to folding Exposed 15-22 mer 6
3
11/1/13
MHC 3D-Strucure
• Polymorphic • Bind short pep
• Polymorphic • Bind pep13 A.A • Open ends
7
MHC class I Binding Groove • 2 anchor posi
8
4
11/1/13
MHC class II Binding Groove • α-‐chain is shown in dark-‐blue, and the β-‐chain in light blue. • The pep
9
Predic
10
5
11/1/13
Contact Residues Define Pocket Profile
6
1 4
VGFT
9
FLEQRAY WCSVDYW LFECLRA 11
Pocket profile MHC-‐II P1, P2, P3: (cadena alfa): monomórficos (excepción: P1 VàG )
P5, P8: cadenas laterales de los epítopes ´no ´ interactúan con el ´groove´ P4, P6, P7, P9: (cadena beta): polimórficos: dan la especificidad
Sturniolo et. Al. NATURE BIOTECHNOLOGY VOL 17 JUNE 1999 h"p://biotech.nature.com
12
6
11/1/13
13
Subs
Fig. 1
A
B Unknown Target Allele
A
B Human DRB*0101 Allele
“Subs
14
7
11/1/13
Composite Method Fig. 2
A
B Target MHC Allele
A
C Human DRB*1301
D
B Human DRB*0801
“Composite” Method -‐ For each pocket profile within the submiXed target allele, best matching pocket profiles within the human database would be iden<fied. The best matches would then be combined to form the best possible “composite” alleles
15
Anne de Groot -‐ EPIVAX
Determine Best Subs
Allele TARGET DRB1*0101 DRB1*0301 DRB1*0401 . .
P1 VVFT
Iden)ty P4 -RFDQAAY
Iden)ty P6 -PRDYIAA
Iden)ty --
P9 WYSVDYW
Iden)ty --
VGFT
75%
FLEQRAY
42.85% LFECLRA
14.29%
WCSVDYW
85.71%
VVFT
100%
SYDQKRY
42.85% SSDYLKR
42.85%
EYNVDYW
71.42%
VGVT . .
75% . .
HFDQKAY . .
71.42% VHDYLKA . . . .
42.85% . .
EYYVDYW . .
71.42% . .
Best Subs
Best Composite Pocket 1 -‐ DRB1*0301 (100%) Pocket 4 -‐ DRB1*0401 (71.42%) Pocket 6 -‐ DRB1*0401 (42.85%) Pocket 9 -‐ DRB1*0101 (85.71%) = 74.99 % iden)ty 16
8
11/1/13
Predic
17
18
9
11/1/13
IEDB Database
19
SYFPEITHI Database
20
10
11/1/13
Weight Matrix
Morten Nielsen -‐ CBS
21
%Rank score
Morten Nielsen -‐ CBS
22
11
11/1/13
Ra
23
Metodología para predicción de vacunas multiepitópicas Allele Frequency Net Database (AFND)
Se determinarán los alelos más frecuentes para MHC-I y MHC-II de un área geográfica o grupo étnico específico, analizando los secuenciamientos de dichos genes en una muestreo aleatorio provenientes de diversas regiones del país.
1. Determinación de alelos más frecuentes Búsqueda del mejor alelo MHC humano sustituto
MHC-II Predicción de proteinas transmembrana y secretorias y la estructura
MHC Cluster
MHC-I
Filtros
SignalP-4
Predicción de Lipo-proteínas 2. Predicción de epítopes netMHCcons para MHC-I
NetMHCpan
Herramientas del Center for Biological Sequence Analysis (CBS)
netMHCIIpan para MHC-II
NetMHC 24
12
11/1/13
MHC-I y MHC-II
En este filtro se buscará seleccionar los epítopes promiscuos, es decir epítopes que son reactivos con el mayor número de alelos MHC representativos de la población peruana.
3. Buscar epítopes promiscuos para múltiples alelos
4. Buscar epítopes conservados
Se procederá a filtrar solo aquellos epítopes que estén conservados en todos los genomas en estudio, para lo cual se usará la herramienta BLAST.
5. Filtrado del proteoma del individuo a inmunizar Los epítopes seleccionados serán filtrados del proteoma, para que de esta manera, la vacuna multiepitópica no incluya epítopes tolerantes.
Proteína Multiepitópica
6. Epitope-Sorting para Construir la proteina multiepitópica
Epitope 1 Epitope 2 Epitope 3 SB SB SB KNLLITDPPKPIKVK IKYIIEDQNIPLSYQ SQPLLADLPNIVLPF A continuación serán agrupados para formar una proteína multiepitópica de 12–16 epítopes con la condición que no se aparezcan epítopes 'artefactos' en las uniones de los pares de epítopes. Una vez diseñada la proteína multiepitópica, se sintetizará un gen en el plásmido pet28a el cual codificará para la proteína mencionada. La proteína será expresada en E. coli y purificada como proteína recombinante por medio de una cromatografía por afinidad.
PIKVKIKYIIEDQN
* SB = strong binding
SB Epítope artefacto 25
26
13
11/1/13
• Algunos ejemplos de diseño de vacunas: • ¿Vacunas humanas? Costoso, largo
27
Cys
(Definitive host) Ingestion of infected pork, poorly cooked: Taeniasis
Ingestion of T. solium eggs by fecal contamination: Human cysticercosis
Pig
(Intermediate host)
Ingestion of T. solium eggs or proglottids: Porcine cysticercosis
28
14
11/1/13
Epidemiology – Life Cycle Human
(Definitive host) Ingestion of infected pork, poorly cooked: Taeniasis
Ingestion of T. solium eggs by fecal contamination: Human cysticercosis
Pig
(Intermediate host)
Ingestion of T. solium eggs or proglottids: Porcine cysticercosis
29
Epidemiology – Life Cycle Human
(Definitive host) Ingestion of infected pork, poorly cooked: Taeniasis
Ingestion of T. solium eggs by fecal contamination: Human cysticercosis
Pig
(Intermediate host)
Ingestion of T. solium eggs or proglottids: Porcine cysticercosis
30
15
11/1/13
Epidemiology – Life Cycle Human
(Definitive host) Ingestion of infected pork, poorly cooked: Taeniasis
Ingestion of T. solium eggs by fecal contamination: Human cysticercosis
Pig
(Intermediate host)
Ingestion of T. solium eggs or proglottids: Porcine cysticercosis
31
Epidemiology – Life Cycle Human
(Definitive host) Ingestion of infected pork, poorly cooked: Taeniasis
Ingestion of T. solium eggs by fecal contamination: Human cysticercosis
Pig
(Intermediate host)
Ingestion of T. solium eggs or proglottids: Porcine cysticercosis
32
16
11/1/13
Single cyst infec
33
Purifica
Cyst iden<fica
Cyst fluid
Ethanol concentra
Size exclusion chromatography
Ion exchange chromatography
34
17
11/1/13
Tsol18 a good vaccine
-‐A secretory protein -‐Fibronec
35
MHC class I profile: Tsol18
Immunogenicity
0.6 0.5 0.4 0.3 0.2 0.1 0 1
9
17
25
33
41
49
57
65
73
81
89
97 105
Residue
Tsol18
IFVPYLRCFAL EEIKVKVEK VIIRDL
EEIKVKVEKIFVPYLRCFALVIIRDL 36
18
11/1/13
Placebo Vacuna 1
0
200
400
600
800
0
mean of healthy mean of petequias
mean of degenerated mean of cicatriz
Gra phs by Group
37
Análisis del genoma completo de Taenia solium • Genomas de 2 regiones del Perú, Huancayo y Puno. • Los genomas fueron secuenciados en colaboración con el NIH – Na
38
19
11/1/13
Secuenciamiento y ensamblaje 454 Sequencing
Illumina Sequencing
39
Development of a ´Pig Matrix´
40
20
11/1/13
41
42
21
11/1/13
Equipo de trabajo EQUIPO BIOINFORMÁTICO David Requena, MSc(c) Hugo Valdivia, BSc Manuel Ramirez, BSc Andrés Gutierrez, PhD(c) Ana Dávila, E.E. Basilio Cieza, BSc(c) Sebastián Carrasco, BSc(c) Vladimir Espinoza, BSc(c) Eduardo Gushiken, BSc(c) Carlos Bueno, BSc(c)
COLABORADORES Robert Gilman, MD, Dr.TropMed (Johns Hopkins University) Manolo Fernandez, MV, PhD (FARVET) Patricia Sheen, PhD (UPCH) Manuela Verástegui, PhD (UPCH) Héctor García, MD, PhD (UPCH) Armando Gonzales, MV, PhD (UNMSM) Annie De Groot, MD, PhD (Univ. Rhode Island, EPIVAX) Morten Nielsen, PhD (CBS – Center of Biological Sequence Analysis)
EQUIPO MOLECULAR Mónica Pajuelo, PhD(c) Manuel Mendoza, MSc(c) Nancy León, MSc(c) Isidro Antitupa, MSc(c) Reynaldo Ponce, MSc(c) Katherine Lozano, MSc(c) Jose Luis Roldán, BSc
43
22