4. aplicaţia vector nti – programul align x · În panoul “text” daţi dublu click pe o...

11
1 4. Aplicaţia Vector NTI – programul Align X 4.1. Obiectivele lucrării de laborator sunt: - compararea secvenţelor ADN şi a secvenţelor proteice - descrierea generală a unei proteine, determinarea numărului de aminoacizi din care e formată, funcţia ei, greutatea moleculară şi încărcarea electrică - alinierea proteinelor - vizualizarea arborelui filogenetic - afişarea aliniamentului folosind matricile de scor. Align X este un program, parte componentă din Vector NTI care poate fi folosit pentru a compara secvenţe de ADN sau de proteine. Pentru a instala programul Vector NTI suite 8 vom accesa urmatoarea adresă: http://www.bioinformatics.uthscsa.edu/www/genomics/windows.html De asemenea se pot descărca şi tutorialele. După ce lansăm în execuţie programul VectorNTI, dăm click pe butonul “Local Database” (figura 4.1.a). Vom parcurge această lucrare prin intermediul a 3 exemple. Figura 4.1.a. Modul de descărcare al programului Vector NTI

Upload: others

Post on 09-Sep-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

1

4. Aplicaţia Vector NTI – programul

Align X

4.1. Obiectivele lucrării de laborator sunt:

- compararea secvenţelor ADN şi a secvenţelor proteice

- descrierea generală a unei proteine, determinarea numărului de aminoacizi din care

e formată, funcţia ei, greutatea moleculară şi încărcarea electrică - alinierea proteinelor

- vizualizarea arborelui filogenetic

- afişarea aliniamentului folosind matricile de scor.

Align X este un program, parte componentă din Vector NTI care poate fi folosit

pentru a compara secvenţe de ADN sau de proteine.

Pentru a instala programul Vector NTI suite 8 vom accesa urmatoarea adresă:

http://www.bioinformatics.uthscsa.edu/www/genomics/windows.html

De asemenea se pot descărca şi tutorialele. După ce lansăm în execuţie programul

VectorNTI, dăm click pe butonul “Local Database” (figura 4.1.a). Vom parcurge

această lucrare prin intermediul a 3 exemple.

Figura 4.1.a. Modul de descărcare al programului Vector NTI

Page 2: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

2

4.2. Exemplul 1 – Ne propunem să creăm o secvenţă

de nucleotide pentru care să vizualizăm matricea DotMatrix

Dacă dorim să vizualizăm componentele bazei de date trebuie să alegem opţiunea

„Exploring” din meniul principal al programului (figura 4.2.a).

Figura 4.2.a. Afişarea fişierelor cu molecule ADN/ARN din BD a programului

Selectăm DNA/RNA molecules, facem click dreapta şi selectăm “New Item”

pentru a crea o nouă moleculă, căreia îi dăm numele “test”.

Figura 4.2.b. Exemlu de creare a unei noi molecule

Page 3: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

3

Se va deschide o fereastră în care vom putea crea o moleculă test pentru care vom

afişa alinierea vizuală a nucleotidelor din exemplul de la curs (Dot Matrix) - vom numi

noua moleculă creată “Test” (figura 4.2.c).

Figura 4.2.c. Denumirea noii molecule

Pentru a completa cu informaţie noua moleculă daţi click pe tab-ul Sequence and

Maps, iar după aceea click pe butonul Edit Sequence şi introduceţi următoarea secvenţă

de nucleotide ACCTGAGCTCACCTGAGTTA (figura 4.2.d).

Figura 4.2.d. Introducerea secvenţei de nucleotide în fereastra de editare a programului

Page 4: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

4

Apoi apăsaţi tasta OK, după care faceţi click dreapta pe molecula Test apoi alegeţi

opţiunea Align X şi Align Selected Molecules.

Figura 4.2.e. Opţiunile de aliniere a secvenţelor

Se va deschide fereastra Align X iar pentru a afişa alinierea vizuala (Dot Matrix)

pentru secvenţa “test” vom alege această opţiune (figura 4.2.e).

Figura 4.2.e. Alinierea secvenţei “test” cu ea însăşi

Se va afişa fereastra cu Dot Matrix . Observăm că pe orizontală vor fi afişate

nucleotidele moleculei Test . Vom alege astfel încât şi pe verticală să fie afişate

nucleotidele moelculei Test.

Page 5: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

5

Figura 4.2.f. Conţinutul matricei Dot Matrix

Observăm că atât pe orizontală cât şi pe verticală se află doar 16 nucleotide din cele

20 introduse. Pentru aceasta vom alege din meniul Matrix =>Matrix setup => window

iar în caseta window vom introduce valoarea 1.

Figura 4.2.g. Reprezentare finală a Dot Matrix

Page 6: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

6

4.3. Exemplu 2 – Compararea a două proteine cu

programul Vector Align X

Din secţiunea Database explorer selectăm protein.

Figura 4.3.a. Selecţia proteinelor

Apoi selectăm 2 molecule: 41BB_HUMAN şi 4F2_HUMAN (figura 4.3.b).

Pentru alinierea lor facem click dreapta şi apoi tastăm Align => Align selected

molecules.

Figura 4.3.b. Cele două molecule alese spre comparare, în fereastra AlignX

Se va deschide subprogramul alignX. Daca vom da click pe “+” vom putea obţine

următoarele informaţii despre proteine: descrierea generală a proteinei, numărul de

aminoacizi din care e formată, funcţia, greutatea moleculară şi încărcarea electrică.

Page 7: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

7

Vom selecta apoi DotMatrix , unde vom vedea secvenţele de proteine comparate

(figura 4.3.c).

Figura 4.3.c. DotMatrix pentru alinierea celor două secvenţe

4.4. Exemplul 3

La fel ca în exemplul 2, după ce deschidem programul Vector NTI, din secţiunea

Database explorer alegem opţiunea “protein” după care vom selecta următoarele

proteine: 41BB_HUMAN, 5H1A_HUMAN, 5H1A_MOUSE şi 5H1A_RAT.

Executăm click dreapta => Align X => Align selected molecules pentru a alinia

secvenţele proteinelor de tip 5H1A. Va apărea următorul ecran care conţine următoarele

panouri ca în figura 4.4.a:

Panoul cu text (Text Pane)

Panoul care conţine arborele filogenetic (phylogenetic Pane)

Panoul care conţine aliniamentul (alignament Pane)

Panoul care conţine analiza (Analisys Pane) sau panoul grafic.

Selectăm moleculele şi apăsăm butonul Align.

Page 8: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

8

Figura 4.4.a. Panouri cu vizualizarea secvenţelor aliniate

În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta.

Aceste informaţii conţin tipul moleculei, forma moleculei, comentarii, referinţe şi date

în format GenBank.

Panoul implicit de analiză conţine trei reprezentări grafice ale rezultatelor

aliniamentului.

Primul grafic conţine profilulul calităţii aliniamentului. Se analizează dacă

secvenţa este identică, similară sau slab similară cu secvenţa de comparat.

Al doilea grafic conţine semnificaţia statistică a profilului (complexitatea

absolută a unui aliniament). Este suma tuturor scorurilor calculate conform

matricii de subsituţie.

Al treilea grafic prezintă semnificaţia statistică a aliniamentului pentru o moleculă selectată în raport cu molecula de comparat (figura 4.4.a).

Putem adăuga analize adiţionale prin tastarea butonului “Graphics Pane”. Apoi

vom apăsa pe “View” => list of analyses.

Figura 4.4.b. Lista analizelor adiţionale

Page 9: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

9

Sunt afişate toate analizele disponibile pentru ADN sau proteine, depinzând de tipul

moleculelor de aliniat.

Analiza filogenetică este o metodă de studiere a presupuselor relaţii evolutive ale

proteinelor. Panoul care conţine arborele filogenetic îl va afişa doar dacă sunt

comparate cel puţin 4 molecule (proteine) – figura 4.4.c.

Figura 4.4.c. Arborele filogenetic pentru cele 4 molecule selectate iniţial

Arborele filogenetic este creat folosind metoda Neighbor Joining (NJ) of Saitou

and Nei.

Setarea parametrilor aliniamentului se obţine prin intermediul butonului

“alignament setup”. Aici vom putea seta parametrii pentru Pairwise Alignment,

Multiple sequence alignment, precum şi Score Matrix (matricea de scor) – figura 4.4.d.

Figura 4.4.d. Afişarea elementelor matricei de scoruri BLOSUM62

Din tab-ul score matrix vom apăsa pe butonul select matrix şi vom selecta matricea

de scor pe care vrem să o folosim. Matricea de scor se prezinta ca un fisier text (figura

4.4.d).

Putem selecta matrici de tipul BLOSUM, PAM, DAYHOFF sau cu ajutorul

utilitarului matrix editor, putem crea propria noastră matrice de scor.

Page 10: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

10

Editarea aliniamentului se realizează prin butonul Edit alignment. Aici vom putea

selecta o secvenţă de aminoacizi şi o vom putea muta în cadrul aliniamentului (figura

4.4.e).

Figura 4.4.e. Exemplu de editare în cadrul aliniamentului secvenţelor seletate

4.5. Exerciţii propuse

1. Să se selecteze cele 3 proteine de tipul 5H1D şi proteina 5H1E, să se alinieze

aceste proteine, după care să se vizualizeze arborele filogenetic. Afişaţi aliniamentul

folosind matricile de scor PAM 120, PAM 50 şi BLOSSUM 55.

2. Selectaţi proteinele de tipul _ECOLI (escheria coli), aliniaţi-le şi vizualizaţi arborele filogenetic. Să se afişeze aliniamentul folosind matricile de scor PAM10,

PAM20, PAM40, BLOSUM 100, BLOSUM 85.

3. Să se selecteze proteinele de tipul YLR şi să se alinieze aceste proteine.

Vizualizaţi arborele filogenetic şi afişaţi aliniamentul folosind matricile de scor PAM

120, PAM 50 si BLOSSUM 55.

4. Afişaţi DOT MATRIX pentru proteinele din exerciţiile de mai sus (2 câte 2).

5. Cu ajutorul algoritmului Needleman-Wunsch din fişierul excel calculaţi

matricea de scoruri asociată alinierii celor două secvenţe de nucleotide :

GAATTCAGTTA şi GGATCGA.

Page 11: 4. Aplicaţia Vector NTI – programul Align X · În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta. Aceste informaţii conţin tipul moleculei,

11

R:

6. Aceeaşi aliniere realizaţi-o cu algoritmul Smith-Waterman.

R: