4. aplicaţia vector nti – programul align x · În panoul “text” daţi dublu click pe o...
TRANSCRIPT
1
4. Aplicaţia Vector NTI – programul
Align X
4.1. Obiectivele lucrării de laborator sunt:
- compararea secvenţelor ADN şi a secvenţelor proteice
- descrierea generală a unei proteine, determinarea numărului de aminoacizi din care
e formată, funcţia ei, greutatea moleculară şi încărcarea electrică - alinierea proteinelor
- vizualizarea arborelui filogenetic
- afişarea aliniamentului folosind matricile de scor.
Align X este un program, parte componentă din Vector NTI care poate fi folosit
pentru a compara secvenţe de ADN sau de proteine.
Pentru a instala programul Vector NTI suite 8 vom accesa urmatoarea adresă:
http://www.bioinformatics.uthscsa.edu/www/genomics/windows.html
De asemenea se pot descărca şi tutorialele. După ce lansăm în execuţie programul
VectorNTI, dăm click pe butonul “Local Database” (figura 4.1.a). Vom parcurge
această lucrare prin intermediul a 3 exemple.
Figura 4.1.a. Modul de descărcare al programului Vector NTI
2
4.2. Exemplul 1 – Ne propunem să creăm o secvenţă
de nucleotide pentru care să vizualizăm matricea DotMatrix
Dacă dorim să vizualizăm componentele bazei de date trebuie să alegem opţiunea
„Exploring” din meniul principal al programului (figura 4.2.a).
Figura 4.2.a. Afişarea fişierelor cu molecule ADN/ARN din BD a programului
Selectăm DNA/RNA molecules, facem click dreapta şi selectăm “New Item”
pentru a crea o nouă moleculă, căreia îi dăm numele “test”.
Figura 4.2.b. Exemlu de creare a unei noi molecule
3
Se va deschide o fereastră în care vom putea crea o moleculă test pentru care vom
afişa alinierea vizuală a nucleotidelor din exemplul de la curs (Dot Matrix) - vom numi
noua moleculă creată “Test” (figura 4.2.c).
Figura 4.2.c. Denumirea noii molecule
Pentru a completa cu informaţie noua moleculă daţi click pe tab-ul Sequence and
Maps, iar după aceea click pe butonul Edit Sequence şi introduceţi următoarea secvenţă
de nucleotide ACCTGAGCTCACCTGAGTTA (figura 4.2.d).
Figura 4.2.d. Introducerea secvenţei de nucleotide în fereastra de editare a programului
4
Apoi apăsaţi tasta OK, după care faceţi click dreapta pe molecula Test apoi alegeţi
opţiunea Align X şi Align Selected Molecules.
Figura 4.2.e. Opţiunile de aliniere a secvenţelor
Se va deschide fereastra Align X iar pentru a afişa alinierea vizuala (Dot Matrix)
pentru secvenţa “test” vom alege această opţiune (figura 4.2.e).
Figura 4.2.e. Alinierea secvenţei “test” cu ea însăşi
Se va afişa fereastra cu Dot Matrix . Observăm că pe orizontală vor fi afişate
nucleotidele moleculei Test . Vom alege astfel încât şi pe verticală să fie afişate
nucleotidele moelculei Test.
5
Figura 4.2.f. Conţinutul matricei Dot Matrix
Observăm că atât pe orizontală cât şi pe verticală se află doar 16 nucleotide din cele
20 introduse. Pentru aceasta vom alege din meniul Matrix =>Matrix setup => window
iar în caseta window vom introduce valoarea 1.
Figura 4.2.g. Reprezentare finală a Dot Matrix
6
4.3. Exemplu 2 – Compararea a două proteine cu
programul Vector Align X
Din secţiunea Database explorer selectăm protein.
Figura 4.3.a. Selecţia proteinelor
Apoi selectăm 2 molecule: 41BB_HUMAN şi 4F2_HUMAN (figura 4.3.b).
Pentru alinierea lor facem click dreapta şi apoi tastăm Align => Align selected
molecules.
Figura 4.3.b. Cele două molecule alese spre comparare, în fereastra AlignX
Se va deschide subprogramul alignX. Daca vom da click pe “+” vom putea obţine
următoarele informaţii despre proteine: descrierea generală a proteinei, numărul de
aminoacizi din care e formată, funcţia, greutatea moleculară şi încărcarea electrică.
7
Vom selecta apoi DotMatrix , unde vom vedea secvenţele de proteine comparate
(figura 4.3.c).
Figura 4.3.c. DotMatrix pentru alinierea celor două secvenţe
4.4. Exemplul 3
La fel ca în exemplul 2, după ce deschidem programul Vector NTI, din secţiunea
Database explorer alegem opţiunea “protein” după care vom selecta următoarele
proteine: 41BB_HUMAN, 5H1A_HUMAN, 5H1A_MOUSE şi 5H1A_RAT.
Executăm click dreapta => Align X => Align selected molecules pentru a alinia
secvenţele proteinelor de tip 5H1A. Va apărea următorul ecran care conţine următoarele
panouri ca în figura 4.4.a:
Panoul cu text (Text Pane)
Panoul care conţine arborele filogenetic (phylogenetic Pane)
Panoul care conţine aliniamentul (alignament Pane)
Panoul care conţine analiza (Analisys Pane) sau panoul grafic.
Selectăm moleculele şi apăsăm butonul Align.
8
Figura 4.4.a. Panouri cu vizualizarea secvenţelor aliniate
În panoul “Text” daţi dublu click pe o moleculă şi vizualizaţi datele despre aceasta.
Aceste informaţii conţin tipul moleculei, forma moleculei, comentarii, referinţe şi date
în format GenBank.
Panoul implicit de analiză conţine trei reprezentări grafice ale rezultatelor
aliniamentului.
Primul grafic conţine profilulul calităţii aliniamentului. Se analizează dacă
secvenţa este identică, similară sau slab similară cu secvenţa de comparat.
Al doilea grafic conţine semnificaţia statistică a profilului (complexitatea
absolută a unui aliniament). Este suma tuturor scorurilor calculate conform
matricii de subsituţie.
Al treilea grafic prezintă semnificaţia statistică a aliniamentului pentru o moleculă selectată în raport cu molecula de comparat (figura 4.4.a).
Putem adăuga analize adiţionale prin tastarea butonului “Graphics Pane”. Apoi
vom apăsa pe “View” => list of analyses.
Figura 4.4.b. Lista analizelor adiţionale
9
Sunt afişate toate analizele disponibile pentru ADN sau proteine, depinzând de tipul
moleculelor de aliniat.
Analiza filogenetică este o metodă de studiere a presupuselor relaţii evolutive ale
proteinelor. Panoul care conţine arborele filogenetic îl va afişa doar dacă sunt
comparate cel puţin 4 molecule (proteine) – figura 4.4.c.
Figura 4.4.c. Arborele filogenetic pentru cele 4 molecule selectate iniţial
Arborele filogenetic este creat folosind metoda Neighbor Joining (NJ) of Saitou
and Nei.
Setarea parametrilor aliniamentului se obţine prin intermediul butonului
“alignament setup”. Aici vom putea seta parametrii pentru Pairwise Alignment,
Multiple sequence alignment, precum şi Score Matrix (matricea de scor) – figura 4.4.d.
Figura 4.4.d. Afişarea elementelor matricei de scoruri BLOSUM62
Din tab-ul score matrix vom apăsa pe butonul select matrix şi vom selecta matricea
de scor pe care vrem să o folosim. Matricea de scor se prezinta ca un fisier text (figura
4.4.d).
Putem selecta matrici de tipul BLOSUM, PAM, DAYHOFF sau cu ajutorul
utilitarului matrix editor, putem crea propria noastră matrice de scor.
10
Editarea aliniamentului se realizează prin butonul Edit alignment. Aici vom putea
selecta o secvenţă de aminoacizi şi o vom putea muta în cadrul aliniamentului (figura
4.4.e).
Figura 4.4.e. Exemplu de editare în cadrul aliniamentului secvenţelor seletate
4.5. Exerciţii propuse
1. Să se selecteze cele 3 proteine de tipul 5H1D şi proteina 5H1E, să se alinieze
aceste proteine, după care să se vizualizeze arborele filogenetic. Afişaţi aliniamentul
folosind matricile de scor PAM 120, PAM 50 şi BLOSSUM 55.
2. Selectaţi proteinele de tipul _ECOLI (escheria coli), aliniaţi-le şi vizualizaţi arborele filogenetic. Să se afişeze aliniamentul folosind matricile de scor PAM10,
PAM20, PAM40, BLOSUM 100, BLOSUM 85.
3. Să se selecteze proteinele de tipul YLR şi să se alinieze aceste proteine.
Vizualizaţi arborele filogenetic şi afişaţi aliniamentul folosind matricile de scor PAM
120, PAM 50 si BLOSSUM 55.
4. Afişaţi DOT MATRIX pentru proteinele din exerciţiile de mai sus (2 câte 2).
5. Cu ajutorul algoritmului Needleman-Wunsch din fişierul excel calculaţi
matricea de scoruri asociată alinierii celor două secvenţe de nucleotide :
GAATTCAGTTA şi GGATCGA.
11
R:
6. Aceeaşi aliniere realizaţi-o cu algoritmul Smith-Waterman.
R: