filogenie gorgan

Upload: alina-antoci

Post on 15-Jul-2015

417 views

Category:

Documents


2 download

TRANSCRIPT

Drago Lucian Gorgan INTRODUCERE N STUDIUL FILOGENIEIIFILOGEOGRAFIEI MOLECULARE BIOFLUX CLUJ-NAPOCA, 2008 Autor: Drago Lucian Gorgan Refereni tiinifici: Prof. univ. dr. Vlad Artenie Cercettor dr. Ioan Valentin Petrescu-Mag Director editur:Dr. Ioan Valentin Petrescu-Mag Consilier editorial:Dr. Ruxandra Mlina Petrescu-Mag Editura: Bioflux, Cluj-Napoca, 2008 ISBN 978-973-88929-9-6 1 CUPRINS INTRODUCERE.............................................................................................................4 1.DEFINIIA I CARACTERISTICILE POPULAIEI.................................................6 1.1.Metode utilizate n studiul genetic al populaiilor............................................13 2.ASPECTE PRIVIND FILIAIA I DIVERSITATEA MOLECULAR......................15 2.1.Importana biologiei molecular n indicarea direciilor evolutive...15 2.2.Rolul ADN mitocondrial (ADNmt)......16 2.3.Aspecte ale evoluiei moleculare...16 2.3.1. Evoluia secvenelor nucleotidice i proteice..16 2.3.2. Metodedededucereadireciilordefiliaie,porninddeladate moleculare17 2.3.3. Evoluia secvenelor de aminoacizi..18 2.3.4. Mutaiile i rata de substituie a aminoacizilor22 2.4.Tipuri de modificri la nivelul macromoleculei de ADN.24 2.4.1. Diferene nucleotidice ntre secvene...25 2.4.2. Modele de evoluie ale secvenelor nucleotidice26 2.4.3. Estimarea numrului de substituii nucleotidice.30 2.4.3.1.Modelul Jukes-Cantor..30 2.4.3.2.Modelul Kimura cu 2 parametri..31 2.4.3.3.Modelul Tajima-Nei..31 2.4.3.4.Modelul Tamura-Nei.32 2.4.3.5.Madelul Tamura32 2.4.3.6.Distane Gamma...34 2.4.4. Estimarea numeric a distanelor evolutive34 2.5.Arbori filogenetici.35 2.5.1. Arbori ai genelor i arbori ai speciilor...36 2.5.2. Metode de reconstruire a arborilor filogenetici...38 2.5.2.1.Metode bazate pe distane..38 2.5.2.2.Metoda evoluiei minime (ME)41 2.5.2.3.Metoda Neighbor-Joining (NJ)41 2.5.2.4.Alegerea tipului de distan evolutiv folosit n reconstruciile filogenetice.46 2.5.2.5.Metoda Maximum Parsimony (MP)...47 2.5.2.6.Variana i covariana bootstrap (replicrilor repetate)..48 2.6.Situsuri informative i homoplazia.49 2.7.Strategii de cutare a filogeniei MP..51 2.8.Metode ML (Maximum Likelihood)52 3.METODOLOGIA DE OBINERE A SECVENELOR NUCLEOTIDICE.55 3.1.Determinare unor parametri i indici fenotipici...55 3.2.Protocolul de extracie al ADN total din esut muscular57 3.2.1. Prelucrarea statistic a datelor obinute din extracia ADN..59 3.2.1.1.Estimareavalorilormediialepopulaiiloristabilirea intervalelor de variabilitate...59 2 3.2.1.2.Compararea mai multor probe60 3.3.Reacia de amplificare genic prin polimerizare n lan (PCR).61 3.3.1. Principii generale.61 3.3.2. Ciclurile de replicare...63 3.3.2.1.Denaturarea..63 3.3.2.2.Alinierea primerilor...64 3.3.2.3.Extensia.64 3.3.2.4.Condiiile de reacie.65 3.3.3. Componentele PCR65 3.3.4. Amplificarea genic la reprezentani ai familiei Cyprinidae.65 3.3.4.1.Amplificarea genei care determin sinteza citocromului B66 3.3.4.2.Amplificarea regiunii de control mitocondrial68 3.3.4.3.Amplificareageneicarecodificsubunitatea4La dehidrogenazei (ND4L)69 3.4.Testarea produilor PCR prin electroforez70 3.5.Purificarea produilor PCR71 3.6.Cuantificarea produilor PCR72 3.6.1. Prepararea gelului de cuantificare72 3.6.2. Pregtirea probelor pentru cuantificare...72 3.6.3. Cuantificarea probelor72 3.7.Reacia de secveniere73 3.7.1. Reacia de secveniere a citocromului B.74 3.7.2. Reacia de secveniere a regiunii de control mitocondrial75 3.7.3. Reacia de secveniere a ND4L75 3.8.Precipitarea in etanol a probelor pentru secveniere.75 3.9.Analiza secvenelor.76 4.Studiul relaiilor filogenetice77 4.1.Evaluarea uniformitii populaiilor77 4.2.TestareaobineriiproduilorPCRprinelectroforezorizontalngelde agaroz.82 4.3.Cuantificarea produilor PCR87 4.4.Secvenierea genelor utilizate n studiile de filogenie95 4.5.ComparareasecvenelornucleotidicealecitocromuluiBprovenitedela indivizi aparinnd genului Cyprinus.96 4.5.1. Caracterizarea haplotipului CY01I99 4.5.1.1.Frecvenele tipurilor de asocieri nucleotidice..99 4.5.1.2.Translaia i caracterizarea catenei polipeptidice...99 4.5.2. Caracterizarea haplotipului CY04I.102 4.5.2.1.Frecvenele tipurilor de asocieri nucleotidice102 4.5.2.2.Translaia i caracterizarea catenei polipeptidice.102 4.5.3. Caracterizarea haplotipului CY0104N...103 4.5.3.1.Frecvenele tipurilor de asocieri nucleotidice103 4.5.3.2.Translaia i caracterizarea catenei polipeptidice.104 4.5.4. Caracterizarea haplotipului CY03M...105 4.5.4.1.Frecvenele tipurilor de asocieri nucleotidice105 4.5.4.2.Translaia i caracterizarea catenei polipeptidice.106 4.5.5. Caracterizarea haplotipului CY06M...107 4.5.5.1.Frecvenele tipurilor de asocieri nucleotidice107 4.5.5.2.Translaia i caracterizarea catenei polipeptidice.107 3 4.5.6. Rela iifilogeneticencadrulgenuluiCyprinusstabilitepebaza secvenelor citocromului B..110 4.6.Comparareasecvenelornucleotidicealeregiuniidecontrolmitocondrial provenite de la indivizi aparinnd genului Cyprinus113 4.6.1. Caracterizarea haplotipului general al celor dou populaii...115 4.6.1.1.Frecvenele tipurilor de asocieri nucleotidice115 4.6.2. Caracterizarea haplotipului CY01N116 4.6.2.1.Frecvenele tipurilor de asocieri nucleotidice.116 4.6.2.2.Modelarea structurii secundare a ARNm116 4.6.3. Caracterizarea haplotipului CY05M...117 4.6.3.1.Frecvenele tipurilor de asocieri nucleotidice.117 4.6.4. Caracterizarea haplotipului CY06MD117 4.6.4.1.Frecvenele tipurilor de asocieri nucleotidice.117 4.6.5. RelaiifilogeneticencadrulgenuluiCyprinusbazatepedifereneale secvenelor D-LOOP118 4.7.AnalizasecvenelornucleotidicealeND4Ldehidrogenazeiprovenitedela indivizi apar innd genului Cyprinus.121 4.7.1. Caracterizarea haplotipului CY01IM..124 4.7.1.1.Frecvenele tipurilor de asocieri nucleotidice.124 4.7.1.2.Translaia i caracterizarea catenei polipeptidice.124 4.7.2. RelaiifilogeneticencadrulgenuluiCyprinusbazatepedifereneale secvenelor ND4L.127 4.8.AnalizasecvenelornucleotidicealecitocromuluiBprovenitedelaindivizi aparinnd genului Carassius..129 4.8.1. Caracterizarea haplotipului CAGIMY.133 4.8.1.1.Frecvenele tipurilor de asocieri nucleotidice.133 4.8.1.2.Translaia i caracterizarea catenei polipeptidice.134 4.8.2. Caracterizarea haplotipului CAG137IM.137 4.8.2.1.Frecvenele tipurilor de asocieri nucleotidice.137 4.8.2.2.Modelarea structurii secundare a ARNm137 4.8.2.3.Translaia i caracterizarea catenei polipeptidice.137 4.8.3. RelaiifilogeneticencadrulgenuluiCarassiusstabiliteprinanaliza secvenelor citocromului B..138 4.9.Analiza secvenelor nucleotidice ale d-loop, provenite de la indivizi aparinnd genului Carassius..142 4.9.1. Caracterizarea haplotipului CAGIMD.145 4.9.1.1.Frecvenele tipurilor de asocieri nucleotidice.145 4.9.2. Caracterizarea haplotipului CAG25ID146 4.9.2.1.Frecvenele tipurilor de asocieri nucleotidice.146 4.9.3. RelaiifilogeneticencadrulgenuluiCarassius,bazatepedifereneale secvenelor d-loop.146 4.10. ComparareasecvenelornucleotidicealeND4Ldehidrogenazei,provenite de la indivizi aparinnd genului Carassius..150 4.10.1.Caracterizarea haplotipului CAGIMN153 4.10.1.1.Frecvenele tipurilor de asocieri nucleotidice.153 4.10.1.2.Translaia i caracterizarea catenei polipeptidice.153 4.10.2.RelaiifilogeneticencadrulgenuluiCarassiusobinuteprinanaliza secvenelor genei ND4L..155 4.11. Direcii evolutive n cadrul Familiei Cyprinidae158 BIBLIOGRAFIE..169 4 INTRODUCERE Bazelegeneticiipopulaiilor,pusenperioada1920-1930,aupermis descoperireafaptuluicproceseleevolutiveafecteazinivelulinfraspecific populaional. Studiul genetic al populaiilor se realizeaz optim cu ajutorul matematicii, prin intermediul creia putem calcula frecvena genelor n succesiunea de generaii i putem cuantifica factorii care contribuie la modificarea acestei frecvene. nc Ch. Darvin a considerat evoluia ca proces statistic, pornind de la observaia cavariaiileereditareaucaracterntmpltor,iarselecianatural,realizatprin supravieuireaireproducereadifereniataindivizilormaiapi,reprezintfactorul major al procesului. F.Galton(1822-1911),afostprimulcareafolositmetodestatistico-matematice nstudiulpopulaiilor.nlucrrilesaleTypicallawsofheredityinman(1877)i Natural inheritance (1889) red consideraii asupra fenomenului ereditii, pornind de la cunoaterea corelaiilor i regresiilor existente la prini i descendeni. K.Pearson(1857-1936)acontinuatcercetrileluiF.Galtoniaelaborat metodeledestudiuapopulaiilormari,adezvoltatmetodacorelaiiloriaelaborat testul 2. Astfel a aprut biometria, disciplin care are ca obiect de studiu variabilitatea organismelor, interpretat cu ajutorul metodelor matematice.n1900,cndaufostredescoperitelegileluiMnedel,s-aconstatat,unanim,c acesteasuntnesenlegiprobabilistice,fenotipizareadiferitelorcaracterela descendeni avnd un caracter aleatoriu dar determinist. MatematicianulG.H.HardyimediculW.Weinberg,audescoperitc,ncazul unigrupdeindiviziizolaireproductiv,ntrecareserealizeazpanmixia,frecvena genelor, respectiv a genotipurilor, se menine constant att timp ct nu intervin factori externi care pot modifica acest echilibru. Astfel a fost elaborat cunoscuta lege Hardy-Weinberg.n deceniul trei al secolului trecut, ilutrii cercettori H. Nilson-Ehle, E.M.East i R.A. Emerson au demonstrat c i caracterele cantitative au o determinare poligenic i se transmit mendelian. Astfel a luat natere Genetica cantitativ, disciplin n cadrul creiasestudiazereditateacaracterelorcantitativealeuneipopulaiiprinmetode statistice. R.A.FisherprinlucrareasaTeoriageneticaselecieinaturale(1930),S. Wright prin lucrarea Evoluia n populaiile mendeliene (1931) i H.B.S. Haldane prin lucrarea Teoria matematic a seleciei naturale i artificiale (1932) aduc o contribuie important la fundamentarea geneticii populaiilor. Trebuiemenionatcgeneticapopulaiilorestestrnslegatdegenetica cantitativ, deoarece frecvena genelor, factorii care modific aceast frecven ct i ereditatea caracterelor cantitive se pot studia numai la nivelul populaional. 5 Apariia geneticii populaiilor prezint o mare importan n ameliorarea plantelor ianimalelor.nprezentcuajutorulgeneticiipopulaiilors-apututdaoexplicaie tiinificdinamiciispeciilor,fenomencaresepetrecenulanivelindividualcilacel populaional.Totcuajutorulacesteidisciplines-auevideniatfactoriicaremodific frecvenagenelornpopulaiilepanmictice,rorlulmecanismelordeizolare reproductivnspeciaie,importanamrimiipopulaiilornprocesulhazardului reprezentat de deriva genetic a populaiilor mici. 6 CAPITOLUL 1 DEFINIIA I CARACTERISTICILE POPULAIEI Populaiareprezintunniveldeorganizareiintegrarealumiiviicarese caracterizeaz prin anumite trsturi specifice i este subordonat aciunii unor legiti caracteristice. Pentru a specifica i analiza aceste caracteristici trebuie de precizat c populaiapoatefiabordatattcaunitatestructuralifuncionalnierarhia organizriiiintegrriisistemicealumiivii,cticaentitatestricttaxonomic,n cadrul unitilor sistematice infraspecifice. Populaiilesecaracterizeazdinpunctdevederealrateinaterilor,ratei mortalitii,rateidifuziei.a.Toiacetiparametrireprezintvalorimediiderivatedin comportamentulunuianumitgrupdeindivizi.Aliparametricadeexemplu supravieuirea,reproducereasuntcaracteristiciindividuale.nmodcutotul convenional,ngeneticapopulaiilor,seutilizeazosimplificareextrem,lundu-se ncalculcaracteristicileindividuluilaunmomentdat,pentrudelimitriarbitrarentre populaii. Dac caracterele luate n considerare sunt determinate genetic, se pot defini cu o oarecare exactitate urmtorii termeni: a) populaia reprezint o unitate interncruciabil, din cadrul speciei. n cazul n care n populaie sunt indivizi de dou sexe i fiecare individ are anse egale de a se ntlni cu oricare alt individ de sex opus, populaia este considerat panmictic; b)migraiilereprezinttrecereaindivizilor,delaopopulaielaalta.nlocde migraie, se mai folosete termenul de flux genic; c) frecvena genelor ntr-o populaie care reprezint frecvena unui tip de alel, la un locus dat, raportat la frecvena tuturor alelelor la respectivul locus. n ceea ce privete gena, trebuie menionat faptul c aceasta a fost caracterizat prininvestigaiileefectuatelatreiniveluri:npedigreesaunexperimentelede hibridare,lacelalcoziieichimiceialimplicaiilornproducereafenotipului.Genele majore,caredeterminsegregareacaracterelor,suntdiferitedegeneleasociate (funcional) n poligene, care controleaz caracterele cu variabilitate continu. Lundnconsideraienumruldespecii,diversitateadeformeigradede evoluie,sepoateafirmacpetiiformeazolumeaparte(Taisescu,1979),n lumea vertebratelor. Clasificarea lor complex n 32 ordine, 80 subordine i peste 400 de familii (Greenwood et al., 1996, citat de Taisescu, 1979) este o expresie elocvent a marii diversiti care caracterizeaz clasa Pisces. Chiardacnuseianconsiderarenumrulmaredeindivizicareaparinunei specii, clasa petilor numr mai multe specii dect toate celelalte clase de vertebrate la un loc. Astfel, numai speciile de teleosteeni sunt estimate la peste 20.000, ceea ce nseamnaproximativ60%dintotalulvertebrateloractuale(lacareseadaug amfibienii,aproximativ2.500specii,reptilele6.000specii,psri8.600speciii mamifere 4.500 specii). 7 Pelngavantajuluneiimensevariabilitipecareoofernumrulmarede specii, petii sunt nzestrai cu cel mai bun material (cel puin dintre vertebrate), pentru studiicitogenetice.Deoareceprezintavantajulncruciriiartificialeintra-i interspecifice,lacareseadaugifaptulcsuntfoarteuordentreinut,petii constituie pentru cercetrile de genetic un material comparabil i din unele puncte de vedere chiar superior Drosophilei. Avnd n vedere c diferitele speciile de peti prezint anumite particulariti care ledifereniazsubaspectulritmuluidecretere,rezisteneilaboli,moduluide valorificareahraneietc.estenecesarobinereaunorformecucaracteristici bioproductive superioare acestora, care s mbine caracterele lor pozitive. Ciprinidelereprezintuna dintre celemairspnditefamiliidepeti,cumaimult de2.000speciigrupatenaproximativ340genuri(BnrescuiCoad,1991).Petii dinaceastfamilieauatrasateniaevoluionitilor,datoritarealelormaripecarele prezintpetoatecontinenteleiprezeneilornmajoritateaecosistemelordeap dulce.Cutoateacestea,decndCuvier(1817)astabilitaceastfamilie,relaiile sistematicedincadrulsu,aufostpermanentdiscutate.Primeleclasificriale ciprinidelorsebazaunprincipalpecaractereexterne(ex.prezena,tipulinumrul mustilor), precum i structura i aranjarea dinilor faringieni (Howes, 1991). Recent, caractereleosteologiceaufostdeasemeneafolositendeterminarearelaiilor filogeneticencadruldiferitelorgrupedeciprinide(ex.genulBarbus;Doadrio1990). Dar, liniile monofiletice i relaiile de nrudire dintre subfamiliile familiei Cyprinidae (ex. Cyprininae,LeuciscinaeiRasborinae)trebuiescstabilitecuexactitate(Howes, 1991). Uurinacucarepotfimanevraigameii,fecundaiaexterniposibilitateade control a dezvoltrii zigotului dup fertilizare, fac ca tehnici de o deosebit importan practiccumarfimanipulareacromosomilorsauaseturilordecromosomi,frecvent folosite n genetica plantelor, s se poat aplica la petii de cultur n vederea creterii productivitii.Ginogenezareprezintoformrardenmuliresexual.ncazulginogenezei, fecundarea este necesar (prin fecundare nelegnd ptrunderea spermatozoidului n oosfer), dar cromosomii spermatozoidului nu se transmit descendenei. Deaceea,dezvoltareadescendenelorginogeneticedecurgenumaipebaza ereditii materne. n funcie de particularitile citologice, descendenele ginogenetice fiecrepetnntregimeformamatern(ginogenezaameiotic),fiec,datorit desbinrii,sedeosebescdeformamaternprinanumitecriterii(ginogeneza meiotic). Ginogenezaestecunoscutnnaturipoatefiprovocatexperimental. Ginogenezanatural(deregulameiotic)esteasiguratdectrenitemecanisme biologice,carerealizeazinactivareacromosomilorspermatozoiduluicareaptruns n oosfer i elimin reducerea cromosomilor femeli n cadrul procesului de maturare aoosferei.Datoritacestuifapt,icrelefemelelorcaresenmulescpringinogenez coninunsetcompletdecromosomimaterniiunulreduslajumtate(aacumse ntmpl n cazul nmulirii sexuale obinuite). ncazulginogenezeiinduse,ambeleparticularitiremarcatemaisus,adic inactivareageneticacromosomilormasculiieliminareareduceriicromosomilor femeli,suntasigurateprininterveniiexperimentale(ncazurirarediploidizarea cromosomilor femeli apare i n mod spontan). Prioritateanelaborareametodelordeobinereaginogenezeiinduselapeti aparinecercettorilorsovieticiD.D.Romaev,K.A.ColovinscaiaiV.N.Beliaeva, carenanii19501960audemonstratexperimentalposibilitateaginogenezei 8 diploideinduselacrapiipariauobinutprimeledatereferitoarelaproprietile descendenelor ginogenetice. n prezent, ginogeneza meiotic indus este realizat la multespeciidepeti,darprocentulcelmaimarelconstituieceainduslaspecii aparinnd Familiei Cyprinidae.Dinpunctdevedereteoretic,extindereastudiilorprivindnprincipal,ginogeneza ihibridarea,consangvinizareaiheterozisul,apermisnelegereamaiprofunda ereditiiorganismelor,amodalitilordetransmitereacaracterelorereditarede-a lungulgeneraiilor.S-apututdaastfelexplicaiatiinificaimportaneihibridrii combinatecusporireanumruluidecromosomi,nprocesulnaturaldeapariiea noilor specii. Deasemenea,hibridareaadusladescoperireacelormaieficientemodalitide modificare a ereditii n sensul dorit de om. Astfel, n ultimii ani s-a acordat o atenie deosebit studiului mecanismului genetic al heterozisului i s-au elaborat metode noi de obinere a organismelor ce manifest heterozis pe baz de linii consangvinizate. Ameliorarea petilor, neleas ca proces de modificare a potenialului productiv, a caracterelorereditare,agenofonduluipopulaiilorndireciadoritdeom,esteo preocuparemairecent.Seleciaicretereaformelordepetiamelioratenscopul producerii de puiet i a loturilor de reproductori cu caliti superioare, reprezint una dintre problemele majore ale cercetrii i produciei piscicole. Bazaereditaraindividului,totalitateagenelordiseminatennucleeletuturor celulelordincorpulsuicareicontroleazmorfogenezaifuncionarea organismuluipetotparcursulvieiieste,deocamdat,imposibildeafidirijatdup formareazigotului.Singurasoluiepracticdeacreaobazereditardoriteste aceeadeainterveninprocesulformriizigotului,alreproducerii;omodificaren acestmomentserefernslapopulaie,nulaindivid,semodificgeneraia urmtoareinuceaactual.Cufiecaregeneraienousuntposibileschimbri genetice i este bine ca acestea s fie dirijate i nu lsate n voia hazardului. n ultimele decenii cercetarea legat de creterea animalelor a fost confruntat cu omultitudinedesolicitriexpreseimpusedenecesitateaadaptriitehnologiilorde cretere i ameliorare la nevoia de a produce mai mult, mai bun i mai ieftin (Granciu etal.,1973).Ritmuldezvoltriiiindustrializriicreteriianimalelorreclam introducereanpracticaunormetodemodernedeinvestigaieapotenialului productiv,reproductiviastriidesntateaefectivelorexistenteiameliorarea acestora ntr-un timp scurt. Seleciapracticatdupschemaclasicncepesfiedepitattsubraportul mijloacelor de investigaie folosite, ct i n raport cu factorul timp. Metodele clasice de apreciereavaloriideameliorareaunuireproductornecesittimpndelungat,dela natere i pn cnd intr n producie primii si descendeni. Practica ameliorrii cere ometodrapiddeselecie,aadarctmaieconomic,pentruapermiteo preselecieaanimalelorlaovrsttnr,urmndcaulteriorsfiefolositeialte criterii de selecie. Dezvoltareametodelordeinvestigaiebiochimiciprogreselerealizatede genetic au determinat orientarea cercetrii tiinifice n direcia descifrrii intimitilor procesuluimetabolic,nspecialalsistemelorbiochimicecarelcompun(Cazacu, 1971). Acumularea datelor din acest domeniu tiinific a condus totodat i la naterea uneiadintrecelemainoidisciplinebiologicegeneticabiochimicdisciplinde granicarenmnuncheaztehnicideinvestigaieiconcepteoperaionaledin domeniul biochimiei, geneticii, biofizicii, fiziologiei. Progresele nregistrate au contribuit la conturarea unor noi concepii i puncte de vederenabordareaiinvestigareaproceselorbiologice.nacestcontext, 9 problematica major a biochimiei se circumscrie unor aspecte fundamentale cum sunt studiulbiomoleculelorpedeoparteistudiulbiochimicalsistemelorbiologice. Obiectiveleesenialecarederivdinacesteaspectesereferlaorganizarea biochimicaorganismelorviisubaspectulstructurii,funcieiiproprietii biomoleculelor,lanaturaimecanismelereaciilorbiocataliticeasociatestructurii celulareiinfracelulare,laproceselebiochimicealemetabolismului,lareglareai controlul biochimic al activitii celulare, la bazele moleculare ale proceselor biologice moleculare i patologice (Dumitru, 1980; Tma et al., 1981). nultimeledecenii,cercetriles-auorientattotmaipregnantndireciastudiului amnunit al metabolismului, n special al sistemelor biochimice care stau la baza lui, pornindu-sedelaideeacnivelullacaresedesfoarproceselebiochimice, influeneaz n mod direct capacitatea productiv, reproductiv, de adaptare la mediu saustareadesntateaanimalelor(Cazacu,1971).Desigur,estepuinprobabilc sevaputeaizolaoanumitgencaredeterminunprocesfiziologiccomplex.Este ns posibil ca printr-o serie de metode biochimice, genetice sau imunoserologice s seidentificeaa-numitelegenemarkeriisseurmreascevoluialorncursul selecieiideasemeneassestabileascncemsursuntsaunucorelatecu unelecaracterecantitativeicalitativeimportante,dinpunctdevedereeconomic (Kirpicinicov, 1987; Paaver, 1983). Caracteristicile biochimice ale animalelor de ferm sunt folosite pentru studierea i aprofundarea unui numr de probleme teoretice ca i pentru rezolvarea unor aspecte practicelegatedecreterea,ameliorarea,adaptareaisntateaanimalelor.Privite din acest punct de vedere, sistemele biochimice reprezint un exemplu elocvent cum un domeniu considerat ca o cercetare teoretic fundamental exclusiv a putut s se implice n ameliorarea i selecia petilor i s-i dovedeasc aplicabilitatea. Pentrugeneticabiochimiciimplicitpracticaameliorriiiselecieipetilor sistemelebiochimiceprezintimportanprinpolimorfismullor,adicprinexistena maimultorformedistinctealefiecruisistemnparte(Bnrscu,1975,Maximilian, 1984).Polimorfismulsemanifestdelanaterei,cuuneleexcepii,constndn virarea ctre monomorfism ca urmare a eliminrii unor alele sub influena factorilor de mediu combinat cu cea afactorilortehnologici, se menine constanttottimpulvieii. Deaicirezultiposibilitateafolosiriiluicauninstrumentdeselecietimpuriea reproductorilor de mare valoare. Avantajul de selecie conferit de un tip sau altul din cadrulunuisistembiochimicestesuficientcasatragateniaasuprasa,n dependen cu formele sale de manifestare. innd seama de faptul c petii reprezint clasa de vertebrate superioare aflat pe treapta cea mai de jos a evoluiei acesteia, c sistemele lor de organe din punct de vedere anatomic i fiziologic sunt nc primitive, abia anunnd evoluia din treapt n treaptinaltaspecializaredelamamifere,trebuiesacceptmideeaci metabolismulloriimplicitsistemelebiochimicecarecompunacestmetabolism,se caracterizeazprinaceleaitrsturi. Dacadugmlaacesteafaptul cfecundaia extern i oviparitatea este regula, iar viviparitatea excepia, c dezvoltarea de la larv la adult este, n general, caracteristic unor specii sau unui grup restrns de specii, n timpcealtelenutrecprinstadiuldelarv(petiivivipari),cunelespeciidepeti reprezintdinpunctdevedereevolutivadevratepuncteterminusinunultimul rndnumrulimpresionantdespecii,nevomputeaexplicainelegemarea diversitateasituaiiloriaparenteleparadoxurifadecunotineleacumulaten diferitele domenii ale ihtiologiei. Chenetal.(1984)aufurnizatprimaanalizcladisticclarainterrelaiilordin cadrulfamilieiCyprinidae.CavenderiCoburn(1992)aureanalizatdatelefurnizate 10 de Chen i colaboratorii n 1984 i au prezentat cea mai complet analiz filogenetic afamilieiCyprinidaedinaceaperioad.nanalizalorasuprarelaiilorfilogenetice asupra ciprinidelor din America de Nord, Cavender i Coburn (1992) au concluzionat existenaadousubfamilii:Cyprininaecareconinebarbinele,ciprininelei labeonineleiSubfamiliaLeuscinaecareincludeticine,gobionine,rasborine, leuciscine, cultrine xenocyprine, acheilognathine i phoxinine. Totui, n ciuda acestor eforturi,interpretareadatelormorfologices-adoveditafidificil.Verigilelipsale caracterelormorfologicevalidecaredefinescdiferitegrupesistematiceaucondusla stabilirea unor direcii sistematice n cadrul Familiei Cyprinidae (Nelson, 1994; Fink i Fink, 1996). Recent, s-au introdus alozime drept markeri pentru studiul proceselor de hibridare, structurapopulaiilorirelaiilorfilogeneticedeniveltaxonomicmaimicncadrul ciprinideloreuropene(Coelho,1992;Berrebietal.,1995;Coelhoetal.,1995; Karakousis et al., 1995; Carmona et al., 1997; Alves et al., 1997a). Cu toate acestea, aprecierea relaiilor filogenetice la nivele taxonomice superioare necesit utilizarea de markerimolecularidiferii.Dinacestpunctdevedere,secveniereaADNnscopul analizrii principalelor linii filogenetice ale ciprinidelor este pe deplin necesar (Berrebi et al. 1996). Distribuia mare a ciprinidelor duce la apariia unor ntrebri de ordin biogeografic ievoluionistreferitoarelaevoluiairadiaiaviitoareaacestorspecii.Deexemplu, ciprinidele din interiorul Europei prezint un interes particular n ce privete distribuia cunumeroasespeciiendemicenPeninsulaIbericisudulGrecieiigenuricu destuldepuinespeciinCentrulEuropei(Bnrescu1973).Aceastdistribuie caracteristicafostexplicatprinizolareaPeninsuleiIbericeisuduluiGrecieide restulcontinentului,faptceaconduslalimitareanumruluigenurilorcapabiles colonizeze ambele regiuni. Oricum, scenariul exact care a condus la actuala distribuie biogeografic nu este nc stabilit. Unele dintre cele mai vechi ciprinide fosile au fost descoperite n straturile din Oligocen din Europa Central (Obrhelova 1971), dar este general acceptat c ciprinidele din Europa au origine asiatic (Bnrescu 1989, 1992). DispersiaciprinidelorasiaticenEuropaafostposibilnumaintimpulOligocenului (Bnrescu1989),anceputodatcuformareaMunilorUrali(RgliSteininger 1983)desfurndu-senparalelcuformareaacestora.Estencneclardac ntreaga Europ a fost colonizat n timpul migraiei ce traversa Uralii n formare sau dacauneleciprinide(nspecialgenulBarbus)auajunsnPeninsulaIbericprin nordul Africii (Doadrio 1990; Zardoya i Doadrio; 1998). Primelencercrideevideniereinumrareacromosomilorlapeti,aparin cercettorilorMoore(1890),VanderStrict(1895)iSobota(1897),(citaide Taisescu,1979)darcercetrileprivindcitogeneticaifilogeniapetilor,aparin secolului nostru i s-au dezvoltat preponderent, dup 1960. Cetimdespremecanismeleereditiilapeti,sebazeaznprincipalpe cercetri efectuate pe foarte puini membri ai ordinului Cyprinodontiformes Lebistes reticulatus,Xiphophorussp.ispeciimexicanealegenuluiPoeciliopsis.Mainou, cunotinelenacest domeniu s-aulrgitodat cu efectuareadecercetri pecrap i caras(Cyprinidae),pstrv(Salmonidae)ialtespeciireprezentativeaparinndla grupe diferite. nceprivetedeterminismulsexelor,aproapetoatetipuriledereproducere sexuatcunoscutelaanimalepotfintlnitelapeti.Oricum,mecanismul determinismului sexual la majoritatea petilor osoi, nu este nc elucidat. Cromosomii sexului sunt att de puin difereniai fa de autosomi, nct foarte rar pot fi evideniai. Sepresupunecdeterminismulsexelorpoateficontrolat,parialdacnuchiar 11 complet,degenedispersatenlungulautosomilor.Determinismulsexelorpoatefi diferitlaspeciidiferite,precumincazulncrucirilor,ntremasculiputernicii femele debilitate, rezultatul fiind un sex-ratio neechilibrat, n favoarea masculilor. Dateleexistentenlegturcudeterminismulsexelornpopulaiislbaticede petiipopulaiidelaborator,relevmecanismemaiampledectncazulaltor vertebrate.Pecndlamamiferefemelelesunthomogametice(XX)imasculii heterogametici (XY) i la psri tipul opus (femele, WY; masculi, YY), la peti ambele mecanisme sunt prezente. nceprivetenumruldecromosomi,ultimelecercetriaratcnumruldiploid decromosomilapetivariazntre18i104.Numrulcromosomilordeterminatpe metafazeaparinnddiviziuniimitotice,poatediferiradicalpeparcursuldiviziunilor repetate ale celulei-ou, deci n cadrul aceleiai specii i aceluiai individ. Observaiile asupra numrului de cromosomi la peti sunt mult mai puine fa de oricarealtgrupdeanimale.Cretereainteresuluiasupranumruluidecromosomii morfologieiacestorapromiteimportantecontribuiilafundamentareaanumitorteorii privind evoluia i filogenia petilor. Cunoaterea unor elemente de genetic la crap prezint o mare importan pentru aciuniledeameliorare,datoritfaptuluiclaunreproductorseobineunnumr foartemarededescendeni(deordinulzecilorsauchiarsutelordemii),iar particularitile genetice trebuiesc cunoscute n amnunt. Lucrriledeseleciesuntgreudeabordat,deoarecefecundaia,evoluia embrionului i a larvei, precum i desfurarea proceselor de cretere i de dezvoltare au loc n ap, unde urmrirea acestora este mai greoaie. Pe lng aceasta, mediul de via acvatic are o influen pregnant asupra creterii i dezvoltrii descendenei, fa dealtespeciideanimale(maialesfademamifere),toateacesteafcndca rezultatele ameliorrii s fie mai puin spectaculoase. Importanacunoateriielementelorgeneticelacrapesteaccentuatide manifestarea unor fenomene caracteristice, cum ar fi letalitatea total (Stan i Psrin 1996) ntlnit la indivizii homozigoi de crap oglind, pentru a crei nelegere se dau urmtoarele explicaii: nprimulrnd,seapreciazcdenveliulsolzoslacrapsuntrspunztoare dou gene cu alelele lor i anume: -gena S i alela sa s determin acoperirea total a corpului cu solzi; -gena N i alela sa n determin neacoperirea cu solzi (sau tipul nud). Dup unii autori, la crap se deosebesc 4 fenotipuri ale nveliului solzos i anume: crap cu solzi pe toat suprafaa corpului; crap cu solzi numai pe linia lateral; crapoglind(cupuinisolzirspndiineuniform,maialessubformde ram); crap gola (fr solzi sau puini solzi i rzlei); crap fr solzi; Cu privire la transmiterea n descenden a tipului de nveli solzos se apreciaz caceastadepindedeschemeledencruciareaplicate,respectivdecombinarea genelor rspunztoare de nsuirile respective. Rezultatelencruciriifenotipurilordecrap,nfunciedenveliulsolzos,sunt conformeculegilemendeliene.Aadeexemplu,prinncruciareaindivizilor homozigoi de crapi cu solzi (cu genotipul SSnn) cu cei oglind (cu genotipul ssnn) se obinproduiheterozigoi(cugenotipulSsnn).Dacacetiindivizisuntncruciain continuarecuindivizidecrapoglind(ssnn),seobinproduicugenotipurileSsnn (heterozigoi) i ssnn (homozigoi oglind) (Figura 2). 12 Trebuie menionat c indivizii homozigoi de crap oglind cu genotipul NN, nu sunt viabili, deoarece sunt incompatibili cu procesele vitale (fenomenul de letalitate total), aa cum se poate observa n Tabelul 1. Tabel 1. Genotipurile caracteristice celor patru tipuri de crap SpecificareCrap cu solziCrap oglind Crapcusolzin linie Crap gola n celule somatice 1. SSnn 2. Ssnn ssnn 1. SSNn 2. SsNn ssNn n gamei 1. numai Ss 2. Ss sau sn numai sn 1. SSNn 2. SsNn sN sau sn ncadrulfamilieiCyprinidaes-auidentificatdoucategoriidespeciiprimacu complementuldiploidvariindnjurulcifrei100(Cyprinuscarpio2n=100,Carassius auratus2n=104)icealaltcuprinzndspeciiavnd2nvariindnjurulcifrei50 (Baarbus tetrazona 2n=50, Barbus fasciatus 2n=52) (Minciu i Bra, 1985). nanul1979,Taisescua stabilitnumruldiploidde cromosomiicariotipulla 10 speciideCyprinidae(Gobiogobio,Gobiouranoscopus,Gobioalbipinnatus,Gobio kessleri,Pseudorasboraparva,Cyprinuscarpio,Carassiuscarrasius,Carassius auratus, Scardinius erythrophthalmus i Phoxinus phoxinus), iar la specia Gobio gobio s-a ntocmit idiograma. SpredeosebiredealiautoricareraporteazlaCarassiuscarassiusnumrul diploid identic cu cel al speciei Carassius auratus (2n=94, 100, 102, 104), cercetrile prezente (Taisescu, 1979), stabilesc la caracud 2n=50 (Figura 3) iar la carasul auriu 2n=98.Deoarecenliteraturadespecialitatefoarteadeseaestecitatlegtura filogeneticntreceledouspecii,s-ancercatstabilireauneirelaiinsensevolutiv ntre complementele lor cromosomiale. Studiulcomplementuluicromosomialefectuatlapatruliniiidoihibrizidecrap (Cyprinus carpio), evideniaz n toate cazurile 2n=100 dintre care 24 sunt cromosomi metacentrici,24submetacenticiisubtelocentricii52suntcromosomiacrocentrici. Neconcordanarezultatelordinliteraturadespecialitates-arputeadatoratehnicilor diferitefolositenevideniereacromosomilorsauexaminriiunorliniisaupopulaii diferite de crap care prezint, probabil, un alt complement cromosomial. Lacarasulauriu(Carassiusauratus),afoststabilit(Taisescu,1979)numrul diploiddecromosomi2n=98,iarncomplementulcromosomialaufostidentificai48 de cromosomi cu dou brae i 50 de cromosomi acrocentrici, totaliznd un numr de braecromosomialeNF=146.Rezultateleparsmreascscaravariabilitii numerelor de cromosomi publicate pentru aceast specie (2n=94, 100, 102, 104). Lanoinar,carasulesteospecieginogenetic(ceeacepresupunepentru perpetuareexistenaunoricrediploide,pentruameninelaurmainumrulde cromosomicaracteristicspeciei),careprezintovariabilitatefenotipicfoarte pronunat ca o consecin a participrii diferitelor specii de Cyprinidae la fecundaie i populeaz condiii de mediu extrem de variate. Faptulcseadapteazilacondiiidemediumaiproastedemonstreazc speciasecomportcaunpoliploidcuansemaimaridesupravieuireiarvariaia numruluidecromosomindiferitelepopulaiianalizates-arputeadatoraunor rearanjamente cromosomiale secundare interaciunii genotip condiii de mediu. StudiulcomplementuluicromosomiallaCarassiuscarassiusstabiletenumrul diploid 2n=50 cromosomi, care se dispun n cariotip n 21 perechi de cromosomi cu 2 brae (10 perechi metacentrici, 6 perechi submetacentrici, 5 perechi subterminali) i 4 13 perechidecromosomiacrocentricirealizndunnumrfundamentaldebrae cromosomiale,NF=92.nfelulacesta,cercetrileefectuate(Taisescu,1979)suntn discordan cu cercetrile lui S. Makino (1941) care raporteaz 2n=94 i n=47 la fel ca ilacarasul auriu; cu celealeluiH.Kobayasi (1977)care raporteaz2n=94fr s facodescrieremorfologicacomplementuluicromosomialicucercetrileluiU. Wolficolab.,(1969),(citaideTaisescu,1979),careraporteaz2n=100104, afirmaie nensoit de material ilustrativ sau descrierea morfologic a complementului cromosomial. Este posibil ca autorii citai anterior s fi analizat citogenetic o ras geografic de carasauriu (speciecuovariabilitateindividual remarcabil) care,datoritcondiiilor dinmediulpecarelpopuleazseaseamnfoartemult,camorfologieextern,cu caracuda. DacadmitemcceledouspeciisuntattdenruditenctspeciaCarassius carassiusconstituietipulslbaticalspecieiCarassiusauratus,ceadinurm,fiind tetraploid,numruldecromosomistabilitlaCarassiuscarassius(2n=50)susine aceast evoluie prin poliploidizare nsoit de alte rearanjamente cromosomiale. Analizndcomparativcomplementulcromosomialalmaimultorspeciide Cyprinidae, se pot trage dou concluzii mai importante: -n ceea ce privete numrul de cromosomi, se contureaz dou grupe de specii. Primagrupcuprindespeciicu2n=4850(Scardiniuserythrophthalmus, Phoxinus phoxinus, Carassius carassius, Pseudorasbora parva i toate speciile genuluiGobio)iargrupaadouareunetespeciicu2n~100(Cyprinuscarpio, carassiusauratus)ntreceledougrupearputeafiorelaiedetipdiploid- tetraploid; -submprireafamilieiCyprinidaensubfamiliiestejustificatcitogenetic.Astfel, nsubfamiliaCyprininaesuntcuprinseattspeciidiploidectispecii tetraploide indicnd modul i direcia de apariie a unor specii. Gobioninaele au uncomplementcromosomialformatdin5052decromosomi,lipsitsaucu foartepuinicromosomiacrocentrici.Leuciscinaele,maipuinevoluate,autot 2n=5052darncomplementullorcromosomialseobservmaimuli cromosomi acrocentrici (caracter de primitivitate). 1.1. METODE UTILIZATE N STUDIUL GENETIC AL POPULAIILOR Populaiile pot fi studiate din punct de vedere genetic cu ajutorul a dou metode: metoda descriptiv i metoda genetica. Metodadescriptivsebazeazpecaracterizareafenotipicaindivizilorunei populaii,considerndu-secfenotipulbiotipurilordinpopulaiereprezintexpresia genotipuluiindivizilornstrnsrelaiecumediulnconjurator.Studiindfenotipul organismelorsepotstabiliuneleraporturidedependenexistententreindivizii aceleiaicolectiviti.Deoarecentr-opopulaieexistindiviziasemntorifenotipic, dardesoebiidinpuncdevederegenotipic,nseamncanalizapopulaieiprin metoda descriptiv nu ofer o imagine real n ceea ca privete structura genetic a acesteia.Metodageneticdestudiereapopulaiilorafstposibilnumaidup redescoperirealegilorluiG.Mendeldesegregareacaracterelorindescendenele hibride.Analizahibridologicpermitestudiereaformelorrezultatenurmasegregrii organismelorheterozigote.Cuajutorulmetodeigeneticeesteposibilevidenierea, 14 dindiversitateagenotipuriloruneipopulaii,aacelorgenotipuricarecorespundmai bine obiectivelor propuse de realizat n procesul de ameliorare. nanalizageneticapopulaiilorhibridesefolosetemetodabiometric, completatcucalcululstatisticaldatelor,obinnd,astfel,modelulteoretical populaiei,porninddelaoanumitsituaiedatiurmrindinfluenaexercitatde diferii factori care acioneaza asupra acesteia.Astfeldestudiigeneticeasuprapopulaiilor,bazatepembinareametodei biometricecucalcululstatistic,aefectuatW.Johansen(1903),careadefinitatt populaia,ctigruprilecomponentedeindivizidincadrulpopulaiei,adicliniile pure. Populaiileautogame,precumisoiurileautogame,potfidescompusenlinii pureprinalegereadescendenilorpeparcursulmaimultorgeneraiiiprin consangvinizare. De asemenea, n analiza genetic a populaiilor se studiaz frecvena genelor i agenotipurilordinpopulaiilenaturale,dupmetodaelaboratdeG.HardziW. Weinberg(1908),careaudemonstratcaracterullegicalechilibrulgenetical populaiilor. 15 CAPITOLUL 2 ASPECTE PRIVIND FILIAIA I DIVERSITATEA MOLECULAR 2.1. IMPORTANA BIOLOGIEI MOLECULARE N INDICAREA DIRECIILOR EVOLUTIVE Metodelecomparativemorfologicefolositenstabilirealiniilorfilogeneticeaufost foarteutilenstudiiasupraevoluiei,atuncicndnuexistauverigidelegturntre fosilele descoperite. Oricum, aceste metode nu pot furniza o scal a evoluiei corelat cutimpul.Progresulbiologieimolecularedinultimeledeceniiaufurnizatnoimetode de studiu asupra evoluiei. Baza acestor metode o constituie gradul mare de stabilitate alsecvenelordeADN.ModificrileevolutivenstructurasecvenelordeADNsunt att de lente, nct pot furniza informaii detaliate asupra originii i istoriei evoluiei lor. Dinmomentulncare,secveneleceintrnstructurageneloraufosttranslaten secvenedeaminoacizialeproteinelorcuajutorulcoduluigenetic,modificrile evolutivealeaminoacizilorncadrulproteinelor,deasemenea,potfurnizainformaii referitoarela proceselei scalaaproximativatimpuluievolutiv.Defapt,majoritatea rezultatelorobinutecuajutorulstudiilorlanivelmolecularprovindinanalizeale secvenelordeaminoacizialeanumitorproteine.Estimareatimpuluievolutivprin acestemetodesebazeazpedescoperireapotrivitcreia,ratadesubstituiea aminoacizilorpeanpesitentr-oanumitproteinseproduceconstantpentrutoate organismele. Estecunoscutexistenaa20deaminoacizidiferiicareintrncompoziia proteinelor. Numele i modul de prescurtare sunt prezentate n Tabelul 2. Tabel 2 Cei 20 de aminoacizi i modul de prescurtare al numelor (Dayhoff, 1978) Nr. crt. Nume AbrevieriNr. crt. Nume Abrevieri trei litereo litertrei litereo liter 1.AlaninAlaA11.LeucinLeuL 2.ArgininArgR12.LizinLzsK 3.AsparaginAsnN13.MetioninMetM 4.Acid asparticAspD14.FenilalaninPheF 5.CisteinCysC15.ProlinProP 6.GlutaminGlnQ16.SerinSerS 7.Acid glutamicGluE17.TreoninThrT 8.GlicinGlyG18.TriptofanTrpW 9.HistidinHisH19.TirozinTyrZ 10.IzoleucinIleI20.ValinValV 16 2.2. ROLUL ADN MITOCONDRIAL (ADNmt) Numrulmaredepolimorfismealesecvenelordenucleotidedindouzonecu hipervariabilitatealeregiuniidecontrolmitocondrialnecodificatoarepotpermite discriminarea ntre indivizi sau probe biologice. Probabilitatea recuperrii ADNmt din probe biologice foarte mici sau degradate este mai mare dect n cazul ADN nuclear deoarece moleculele de ADNmt sunt prezente n mii de copii per celul, comparativ cu ADNnuclear care segsetendou copiipercelul.nplus,ADNmtestemotenit numaipeliniematern,astfelnct,ncazulncareunindividnuestedisponibil pentru o comparaie direct cu o prob biologic, orice prob provenit de la genitorul matern, poate constitui o prob de referin. Datorit recombinrii meiotice i motenirii diploide a ADN nuclear, reconstituirea unuiprofilpebazaADNnuclearchiarincazulrudelordegradulIestedestulde greu de realizat. De asemenea, modelul motenirii pe linie matern a ADNmt poate fi deasemeni,consideratcaavnduneledeficiene.Deoarecetoiindivizii,pelinie maternprezintaceeaisecvendeADNmt,aceastanupoateficonsideratun identificatorunic.Defapt,indivizinenrudiiaparent,potaveaooriginecomuni necunoscut, pe linie matern. Majoritateaanimalelorauoreproduceresexuat,ntimpulcreia,genelese transmitdelaambiiprininurmarecombinriiprincrossing-overiasegregrii independente a cromosomilor din timpul meiozei I. Dar, genele din organite provenind dindiferiteliniidefiliaieniciodatnusepotrecombinaiaceastatocmaidatorit faptului c genomul organitelor (cum este i cazul ADNmt) se transmite uniparental i chiardacas-artransmitebiparental,organiteleprovenitedelaceidoigenitorinuar putea fuziona astfel nct s se ajung la o fuzionare a genomurilor. Dac dou celule parentale fuzioneaz, genotipurile recombinante nu se pot regsi la nivel mitocondrial (Birky, 2001). 2.3. ASPECTE ALE EVOLUIEI MOLECULARE 2.3.1. EVOLUIA SECVENELOR NUCLEOTIDICE I PROTEICE DelaCharlesDarwinncoacereconstruireaistorieievolutiveavieiiiredarea acesteiasubformaunuiarborefilogeneticafostunvispentrumulibiologi,Haeckel (1866)fiindprimulcareancercatsarealizezeacestlucru.Modulidealpentru realizareaacesteisarciniimenseesteutilizarearegistruluifosil,darntructacesta estefragmentarmulicercettoriauncercatsfoloseascmorfologiaifiziologia comparat.Folosindacestedoumetodes-areuitdeducereamultoraspecte importantedinistoriavieii.nsschimbrilemorfologice ifiziologicefiind extremde complexe, iar aprecierea importanei evolutive a unui caracter fiind de cele mai multe orisubiectivearboriifilogeneticiconstruiiaufostntotdeaunasubiectpentru controverse. nultimultimpdatoritrealizrilorbiologieimolecularesituaias-aschimbat drastic. Dac n anul 1982 n GenBank erau doar 606 secvene (680.338 pb) aceast bazdedatefiindlanceputurilesale,iarn1997seajunsesedup15aniabiala 1.765.847 de secvene (1,160,300,687pb) astzi baza de date numr 46 947 388 de secvene cu un total de aproximativ 51 674 486 881 pb de la peste 165 000 de specii 17 (Benson, 2005). Aceast explozie se datoreaz n primul rnd perfecionrii metodelor de secveniere i a dus la apariia unui mare numr de studii de evoluie molecular. Planul structurii tuturor organismelor fiind nscris n ADN(sau ARN n cazul unor virusuri)apareposibilitateadeastudiarelaiileevolutivedintreorganisme comparndu-le ADN-ul. Acest mod de a privi lucrurile are cteva avantaje fa de cele clasice ce utilizeaz caractere morfologice i fiziologice. (1)MacromoleculadeADNesteformatdinpatrutipuridenucleotide:adenina (A), timina (T), citozina (C) i guanina (G) n ntreaga lume vie putnd fi folosit astfel pentruacomparaoricegrupedeorganisme,plante,bacterii,arhebacterii,animale, fungi. n metodele tradiionale aceasta este pur i simplu imposibil. (2)ntructmodificrileevolutivealeADNurmeazunmodelmaimultsaumai puinregulatesteposibilutilizareamodelelormatematicepentruaformula modificrileicomparaADN-uldelaorganismefoartendeprtatedinpunctde vedere filogenetic. Schimbrile morfologice sau fiziologice urmeaz modele extrem de complexechiardacanalizmperioadescurtedetimpnefiindclardacdiferitele aproximri necesare pentru realizarea unor filogenii sunt reale sau nu. (3) Genomurile diferitelor organisme constau din lungi secvene de nucleotide (de exemplugenomulumanare91012pb)coninndastfelcantitimultmaimaride caractere cu importan filogenetic spre deosebire de alte tipuri de date. Sistematica este una dintre cele mai controversate ramuri din biologie, definiiile speciilor,genurilorfamiliiloretc.fiindadeseasubiectiv,dezacorduldintrespecialiti privitoarelastatutulunuianumittaxonfiindcevaobinuit.Filogenezaestemaipuin controversat dect sistematica, ea dorind n primul rnd s rezolve problema relaiilor dintreorganisme,iarstatutulsistematicalorganismelorareoimportansecundar. Celedoudomeniisuntnsstrictcorelate,clasificareaorganismelortrebuinds reflecte istoria lor evolutiv (Ax, 1987). n acest sens filogenetica molecular joac un rol important n dezvoltarea bazelor tiinifice ale sistematicii, ns nu trebuie privit ca atotputernic existnd cazuri cnd unele probleme din sistematic nu pot fi rezolvate pe aceast cale. Unexempluinteresantdeutilizareaadatelormolecularenstabilirearelaiilor filogeneticedintrediveritaxonilconstituiecetaceeleacrorlegturicucelelalte ordine de mamifere au fost mult discutate. Prin analiza evoluiei genei fibrinogenului ct i prin datele referitoare la inseria n genom a SINE (short interspersed repetitive elements) ce pot fi privite ca caractere sinapomorfe (Nei & Kumar, 2000) s-a ajuns la concluziacprintremamifereleactuale,celemainruditecucetaceelesunt hipopotamii.Pelngfaptulclaacealeairezultates-aajunsprindoumetode absolut diferite, ipoteza este susinut i de datele paleontologice care indic nrudirea cetaceelorcumezonichidele,ungrupdeungulatecarnivoredinoligocen(Benton, 1997). 2.3.2. METODE DE DEDUCERE A DIRECIILOR DE FILIAIE PORNIND DE LA DATE MOLECULARE Deducereainformaiilorfilogeneticedindatelemolecularenecesitalegerea metodei potrivite din multele disponibile. Construirea unei ipoteze filogenetice este un procedeu de estimare, adic se face o estimare optim a unei filogenii bazndu-ne pe informaiaincompletconinutndateledisponibile.ncontextulsistematicii molecularedeobiceinuaveminformaiidirectedespretrecutavemaccesdoarla organismeimoleculeactuale.Deoareceputemgsiunscenariuevolutivprincare 18 oricefilogeniepoatefiexplicatenevoiedeuncriteriupentruaselectaunasau ctevafilogeniipreferatedintr-unsetdefilogeniiposibile.Metodeledededucere filogeneticncearcsrealizezeacestscopnunuldindoumoduri:(1)definindo secven specific de pai (un algoritm) ce duce la obinerea unui arbore filogenetic ; sau(2)defininduncriteriupentruacomparafilogeniilealternativentreelei deciznd care e mai bun. Metodelepuralgoritmicecombindeducereaarboreluifilogeneticidefiniia arboreluipreferatntr-osingursupoziie.Acestemetodeincludtoateformelede analiz a grupelor perechi (cum ar fi UPMGA) i alte metode bazate pe distane cum arfiNJ(neighborjoining).Elesuntdeobiceimairapidedeoarecemergdirectspre arborele final fr a necesita evaluarea unui numr mare de soluii. Adouagrupdemetodepresupunedoipailogici.Primulestedefinireaunui criteriudeoptimalitate(descrisformaldeprintr-ofuncieobiectiv)cuajutorulcruia fiecruiarboreiseacordunpunctajfolositpentrucomparareaarborilorunulcu cellalt.Aldoileapasesteutilizareaunuialgoritmspecificpentrucalculareavalorii funcieiobiectiveigsireaarboreluicucelmaibunpunctaj.Astfelsupoziiile evolutivefcutenprimulpassuntdecuplatedefolosireacalculatoruluinpasulal doilea.Preulacesteiclaritilogiceestevitezalentdelucruacalculatorului,iar pentruseturidatececoninmaimultde20detaxoniarboreleoptimnupoatefi ntotdeauna gsit din cauza numrului mare de posibile soluii. Folosireaalgoritmiloresteradicaldiferitntreceledoumetode.ncazul metodelorpuralgoritmice,algoritmulestecelcaredefinetecriteriuldeselecieal arboriloriaredeciovaloarecrucial.nmetodelebazatepeuncriteriualgoritmul estedoarunealtpentruevaluareavaloriifuncieiobiectiveicutareaarborilorce optimizeazaceastvaloare.Deoarecemetodelebazatepecriteriiacordfiecrui arboreanalizatunpunctaj,filogeniilepotfiaranjatenordineapreferinelor.Aceasta reprezintunavantajenormnfaametodelorpuralgoritmice.Dacunsetdedate poatefiexplicategaldebinedectevamiidearborifilogenetici,folosindmetode bazatepecriteriinuvomfiduineroarecunanumitarboreexplicdatelefoarte bine.Ometodalgoritmicdunsingurarbore,neputndtictconfidenputem aveanacesta.Uniiautori(Hedgesetal.,1992)ausugeratutilizareametodelor statisticecumarfibootstrapping-ulpentrudeterminareagraduluideconfidenpe care l putem avea ntr-un arbore gsit prin metode pur algoritmice. 2.3.3. EVOLUIA SECVENELOR DE AMINOACIZI nainte de inventarea metodelor rapide de secveniere n 1977 (Maxam & Gilbert, 1977;Sangeretal.,1977)majoritateastudiilordeevoluiemolecularsebazaupe secvene proteice. Astzi secvenierea ADN-ului este mult mai simpl i rapid dect secveniereaproteinelorimajoritateasecvenelorproteicesuntobinuteprin transcrierefolosindcodulgenetic.Totuisecveneleproteicei-aupstrat utilitatea pentrustudiilefilogenetice :elesuntmultmaiconservate,dectsecvenele de ADN i pot oferi informaii utile n cazul comparriigrupelor ndeprtate din punct devederefilogenetic.nplus,modelelematematicealeschimbriievolutivea aminoacizilor sunt mult mai simple dect cele pentru secvene de acizi nucleici, motiv pentru care facem mai nti o prezentare a evoluiei secvenelor proteice i doar apoi a celor nucleotidice.Studiul schimbrilor evolutive al secvenelor polipeptidice ncepe prin compararea adousaumaimultesecvene.Celmaisimpluindiceestenumruldeaminoacizi 19 diferii(nd).Dacasecvenelealiniateconininseriisaudeleiiacesteatrebuiesc eliminatenaintedecalculareand.Unaltindicesimpluestedistanapcereprezint proporiadeaminoaciziprincaredousecvenedeaminoacizidifer.Secalculeaz mprind numrul de aminoacizi diferii la numrul total de situsuri comparate. p=nnd ; V(p)=n p p ) 1 ( Acestindicenufaceniciocoreciepentrusubstituiimultiplencadrulaceluiai situs sau pentru diferenele n ratele de evoluie ntre situsuri. UrmtorulindiceestedistanacucoreciePoisson(PC)deoarecenrealitaten cadrul aceluiai situs pot avea loc substituii multiple ceea ce duce la o relaie neliniar ntre p i timpul t. Odat cu trecerea timpului discrepana dintre nd i numrul real de substituii crete (Figura 1) Dac r este rata de substituie per an i per situs (pentru simplitate se presupune c e acelai pentru toate situsurile) numrul mediu de substituii per situs ntr-o perioada de timp t este rt, iar probabilitatea a k substituii (k = 1, 2, 3, ) este dat de distribuia Poisson : P(k;t)=!) (krt ek rt Deci probabilitatea ca ntr-un anumit situs s nu aib loc nici o substituie (k =0) este P(0;t)=e-rt. Pentru un numr de n aminoacizi, numrul de aminoacizi neschimbai este de ne-rt. distana p distana PC Numrul de substituii per situs Timpul n milioane de ani Figura1.RelaiadintredistanaPCidistanapodatcutrecereatimpului.Ratadesubstituie a aminoacizilor este de 10-8 per situs per an. (Dup Nei & Kumar, 2000) 20 Deobiceins,secvenaancestralnefiindcunoscutecuaiademaisusnueste aplicabil, trebuind s comparm dou secvene actuale divergena crora a nceput t timpnurm.Probabilitatea(q)caniciunuldinsitusurileomoloagealecelordou secvene s nu se fi schimbat este: q = (e-rt)2 = e-2rt Ea poate fi estimat ca 1 - ^p, deoarece q = 1 p, de unde 1- p = e-2rt. Daca d = 2rtestenumrultotaldesubstituiipersituspentrudousecveneatuncielpoatefi calculat ca : d = -ln (1 p) O estimare a lui d ( d) poate fi obinut nlocuind n ecuaia de mai sus p cup , iar variana luideste dat de V( d) = p / [(1 - p) n]. Pe de alt parte aceleai formule de mai sus pot servi pentru calcularea ratei de substituie a aminoacizilor r = d / (2t), darpentruaceastatrebuiescunoatemmomentulnceperiidivergeneidintrecele dou secvene. Daca cunoatem rata de substituie aaminoacizilorputemfolosi formula de mai sus pentru a estima timpul evolutiv t=d / (2r). nmoduldecalculareadistaneidescrismaisussepresupunecratade substituieaminoaciziloresteidenticpentrutoatesitusurile.Aceastaproximarede cele mai multe ori nu este valabil, rata substituiei fiind mai ridicat pentru situsurile mai puin importante din punct de vedere funcional, iar aminoacizii din centrul activ al uneiproteinepotficonservaipentruperioadedetimpfoartemari(Kimura,1983). Uzzel& Corbin (1971) au artat c de fapt distribuia numrului de substituii per situs kareovarianmaimaredectceaadistribuieiPoissoniurmretedefapto distribuienegativbinomial,iardistribuialuirpersitusurmreteodistribuie gamma. f(r)= ) (abaIe-brra-1undea=, ) ( / r V r ) ( / r V r b = ,iar) (a I estefuncia gamma definit: } = I01) ( dt t e aa t 21 Forma distribuiei f(r) este dat de a care se mai numete i parametru de form sauparametrugamma.Distribuiagammaestefoarteflexibiliiadiverseformen dependendea.Pentru = a resteacelaipentrutoatesitusurile,pentrua=1r urmeaz o distribuie exponenial indicnd c rata de substituie variaz mult de la un situslaaltul,iarpentrua 0,2 iar a < 0,2, deci cnd p < 0,2 nu este necesar utilizarea distanei dG. 2.3.4. MUTAIILE I RATA DE SUBSTITUIE A AMINOACIZILOR GenelesausecvenealemoleculelordeADNcarefuncioneazcamodele structuralepentruARNmsuntnumitegenestructurale.Decndsecvenelede aminoacizi din structura unui lan polipeptidic se pot determina cu ajutorul secvenelor nucleotidicedingenelestructurale,oriceschimbarensecvenadeaminoacizieste cauzat de mutaiile produse la nivelul ADN. De asemenea, o mutaie care produce o modificarenstructuraADNnuestenecesarssereflectenmodificareasecvenei aminoacizilor, fapt datorat degenerrii codului genetic. nainteainventriimetodelorrapidedesecveniereaADNn1977(Maxami Gilbert,1977;Sangeretal.,1977),ceamaimareparteastudiilordeevoluie molecularauavutlabazutilizareasecvenelordeaminoacizi.Uneleprincipii importante ale evoluiei moleculare, cum ar fi: evoluia prin duplicarea genelor (Ingram 1963;Ohno,1970)iceasulevoluieimoleculare(ZuckerkandliPauling,1962; Margoliash,1963),aufostdescoperiteprinstudiulsecvenelordeaminoacizi.n prezent,secveniereaADNestemultmaisimpldectsecveniereaaminoacizilor careestedeobiceidedusdinsecveniereanucleotidelorprinutilizareacodului genetic (Nei i Kumar, 2000). Nuesteadevratfaptulcoricemutaiepoatefincorporatntr-osecven, deoarecespeciilesuntalctuitedinpopulaiicunumeroiindivizi,iaromutaienou aprutntr-unindivid,poatedisparedinpopulaieprinanssauprinaciunea selecieipurificatoare.Numaincazulncaremutaiasurvinelanivelulntregii populaii,atunciaceastapoatefiinclusngenomulspeciei.Acestprocespoart numeledefixareamutaieinpopulaie.Odatfixatomutaiencadrulunei populaii, orice individ aparinnd acelei populaii va avea aceeai mutaie. Cnd sunt comparatedousecvenedeaminoaciziprovenitedeladouspeciidiferite,sunt urmrii iniial, noii aminoacizi care au fost ncorporai.Cndapareomutaiencadrulpopulaiei,supravieuireaalelelordepinden principaldeans,dacestesaunuavantajoasdinpunctdevedereselectivide mrimeapopulaiei.Deexemplu,considerndA1genaslbaticiA2alela.ntr-un organismdiploid,genamutantapareiniialnstareheterozigot(A1A2).nurma ncruciriiA1A2xA1A1,dacnurezultdescendeni(generaiaF1)dindiferite cauzebiologice(deexemplusterilitateahomozigotuluiA1A1),genamutantva disparengeneraiaurmtoare.Supravieuireageneialele,nuestesigurnicichiar dacnurmancruciriiA1A2xA1A1seproducurmai,deoarecedescendeniicu genotipulA1A2aparcuoprobabilitatede0,5.nplus,existioansde0,25ca descendenii cu aceste genom s nu apar (Nei i Kumar, 2000). Cndomutaieesteneutrsaunuafecteazfitness-ulindividuluipurttor, frecvenarelativamutanteipoatecretesaudescreteprinansncadrul populaiei (Nei i Kumar, 2000). Pn acum n toate modelele descrise s-a vorbit despre substituiile aminoacizilor de parc fiecare substituie este fixat n secvena considerat. De fapt secvenele de aminoacizinusuntindependente,fiecarespecieconstnddinpopulaii,iarmutaiile aulocnindivideleputnddispareprinderivgeneticsauprinselecie 23 stabilizatoare.Doarcndmutaiaserspndetenntreagapopulaieputemspune ceaestefixat.Cndcomparmdousecvenedeaminoacizideladouspecii observmdoarschimbrileceaufostfixatengenofondulspeciei.Cndomutaie esteneutrinuafecteazfitnesulindivizilorfrecvenarelativ(x)aaleleimutante poatecretesaudescretelantmplareninteriorulpopulaiei.Launorganismcu generaiidiscrete(cumarfiinsectelesauplanteleanuale)inumrNdeindivizi adulifrecvenauneialelemutanteeste) 2 /( 1 N x = ,unde2Nestenumrulde locusuri. Soarta alelei e determinat doar de ans, x crescnd i descrescnd pn cndalelaepierdutsaufixat.Probabilitateafixriiestede) 2 /( 1 N u = iar probabilitateapierderiide1-1/(2N).Dacaratadeapariieamutaieiestedevper locus i per generaie atunci numrul de mutaii ce au loc n ntreaga populaie este de 2Nv per locus i per generaie. Cum probabilitatea fixrii mutaiei este de 1/(2N) rata de substituie per locus i per generaie (a) este de : vNNv a = =212 Deciratadesubstituieperlocusipergeneraieesteegalcuratamutaiei. Aceasta regul simpl a fost descoperit n 1968 de ctre Kimura. n cazul mutaiilor avantajoase selective situaia este alta, fitnesul indivizilor fiind de 1 n cazul genotipului AA, 1+s n cazul genotipului Aa i 1+2s n cazul genotipului aa(sestenumitcoeficientdeselecieiestepozitivpentrumutaiilefolositoarei negativpentruceleduntoare.Probabilitateafixriimutaiiloravantajoaseu s 2 ~pentru populaii mari unde1 > Ns , deci rata de fixare a mutaiilor avantajoase este Nsv s Nv a 4 2 2 = = S presupunem c v = 10-9, N = 105 iar s = 0,01. n acest caz a devine 610 4careestede4000deorimaimarecancazulmutaieineutre(undea=v=10-9). Acest exemplu este totui un pic exagerat deoarece odat ce o protein are o funcie stabilitmajoritateamutaiilorvorfiduntoaresauneutreifoartepuinevor amplifica activitatea proteinei. Mai multe studii au artat c rata mutaiilor pozitive este mult mai mic ca a celor neutre.Mareamajoritateamutaiilorsuntnsduntoare,elefiindrapideliminatedin populaie,elenecontribuinddecilasubstituiiledeaminoacizinefiindfixate.Mutaiile puinduntoaresecomportaltfelns.Elepotfitotuifixatentr-opopulaiecuo micprobabilitatenspecialnpopulaiimici.Totui oacumulare continu de mutaii puinduntoarei-arputeadeteriorastructuraifuncia.Decicamutaiileuor duntoaresfiefixatetrebuiesseacumulezeimutaiiuorbeneficepentruca proteinas-ipstrezefuncia.nacestcazratamediedeacumulareamutaiilor poate deveni mai mult sau mai puin (constant pe termen lung bineneles). n unele cazuri heterozigoii (Aa) pentru o nou mutaie pot avea un fitnes crescut fadeoricaredintrehomozigoi(AAsauaa)acestfenomenfiindcunoscutsub denumireadeselecesupradominant.nacestcazfitnesulindivizilorAA,Aaiaa poatefiexprimatca1-s1,1i1-s2respectivcalculeleprobabilitiifixriisuntprea complicate pentru a fi redate aici, ns cnd 2 1s s ~probabilitatea este de cteva ori mai mare ca cea pentru mutaiile neutre. 24 2.4. TIPURI DE MODIFICRI LA NIVELUL MACROMOLECULEI DE ADN Exist patru tipuri principale de modificri care au loc n macromolecula de ADN: nlocuirea nucleotidelor, deleia, adiia i inversia acestora. Adiia, deleia i inversia se potproducepentruunasaumaimultenucleotide.Adiiaideleiapotmodifica secvenele cadrelor deschise de citire, poriuni numite ORF (open reading frame), caz ncare,suntnumiteframeshiftmutations(Figura3).nlocuireanucleotidelorpoatefi mpritndouclase:tranziiiitransversii(Figura4).Tranziiilereprezint nlocuirea unei baze azotate purinice (adenin sau guanin) cu alt baz purinic sau auneibazeazotatepirimidinice(timinsaucitozin)cuoaltpirimidin.Substituia nucleotidelorpurinicecunucleotidepirimidinicesauinvers,poartnumelede transversii.nmajoritateasecvenelordeADN,s-aconstatatcsubstituia nucleotidelorprintranziii,intervinemaifrecventdectsubstituiaprintransversii (Fitch, 1967; Gojobori et al., 1982; Kocher et al., 1991). Figura 3 Modul de apariie al frameshift mutaiilor Figura 4 Cele dou modaliti de substituie a nucleotidelor (dup, Nei i Kumar, 2000) Modificrile evolutive de la nivelul macromoleculelor de ADN sunt mai complicate dect cele din secvenele proteice, deoarece exist mai multe tipuri de ADN cum ar fi regiunile codificatoare, regiuni necodificatoare, exoni, introni, regiuni terminale, regiuni T CA GTranziii Transversii 25 repetitiveisecvenedeinserie.ModificrileprodusedemutaiilanivelulADN; variaznfunciedezonancareapar.Chiardaclumnconsiderareosingur regiunecodificatoare,modelulsubstituieinucleotidelornprima,adouaiatreia poziie a unui codon, este diferit. Mai mult, unele regiuni se afl sub aciunea seleciei naturale,maimultdectaltele,acestfaptcontribuindlavariaiialemodeluluide evoluie ale diferitelor regiuni ale ADN. 2.4.1 DIFERENE NUCLEOTIDICE NTRE SECVENE

Cnd dou secvene de ADN provin din aceeai secven ancestral, evolueaz divergentgradual,datoritsubstituieinucleotidice.Ceamaisimplmsura divergenei dintre secvene, este proporia siturilor nucleotidice care difer ntre dou nucleotide sau distana p pentru secvenele nucleotidice. ncazulsubstituieiaminoacizilor,distanapnedoestimareanumruluide nucleotidesubstituitepersite,cndsecveneleauorigineapropiat.Cndpare valoaremare,nedosubestimarenumeric,deoarecenuinecontdemutaiile napoi i de cele paralele.Pentruaestimanumrulsubstituiilornucleotidice,estenecesarsfolosimun modelmatematicalsubstituiilornucleotidice.Dinacestmotiv,afostconstituito matri a ratei substituiilor nucleotidice (Tabelul 3) (Nei i Kumar, 2000). ncontinuare,vorfiprezentatedoarmodeleleutilizatenprelucrareadatelordin prezenta lucrare, modele alese pe baza numrului de nucleotide implicate precum i a numrului de mutaii aprute n cadrul secvenei unei gene. Tabel 3 Modele ale substituiei nucleotidice (Nei i Kumar, 2000) ATCGATCG Jukes Cantor modelHKY model A--gTgCgG T-gA-gCgG C-gAgT-gG G-gAgTgC- Kimura modelTamura Nei model A--gTgC1gG T-gA-2gCgG C-gA2gT-gG G-1gAgTgC- Equal input modelGeneral reversible model A-gTgCgG-agTbgCcgG TgA-gCgGagA-dgCegG CgAgT-gGbgAdgT-fgG GgAgTgC-cgAegTfgC- Tamura modelUnrestricted model A-211-a12a13a14 T2-11a21-a23a24 C22-1a31a32-a34 G221-a41a42a43- Not:unelement(eij)careintrnunadinmatricileanterioaredesubstituienucleotidicva nlocui nucleotida din rndul i cu nucleotida din coloanaj. gA, gT, gC i gG sunt frecvenele nucleotidelor. 1 = gG + gC; 2 = gA + gT. 26 n n pd/ = undendinsuntnumruldenucleotidediferiteinumrultotaldesitusuri, variana lui p este aceiai ca pentru secvenele de aminoacizi. Pe lng acest indice adesestenecesarscunoatemfrecvenelediferitelorperechidenucleotidedintre dousecvene,XiY.Existndpatrunucleotide,A,T,GiCnfiecaresecven exist16perechidiferitedenucleotide.Patruperechisuntformatedinnucleotide identice (AA, TT, CC i GG), patru sunt perechi de tipul tranziiilor (AG, GA, TC i CT) ioptsuntperechidetipultransversiilor(restulperechilor).Frecveneletotaleale perechilordenucleotideidentice,perechilordetipultranziiilor,iperechilordetipul transversiilor pot fi notate cu O, P i Q respectiv, deci p = P + Q. Dac substituiile de nucleotide ar avea loc aleatoriu Qar trebui s fie de dou ori mai mare caP (8 : 4) pentru un p mic. De fapt tranziiile au loc mai frecvent ca transversiile i deci P poate fi maimaredectQ.RaportulRdintretranziiiitransversiipoateficalculatdup formulaQ P R/ = undePiQsuntvalorileobservatealeluiPiQ.Restede obicei de 0,5 2 pentru multe gene nucleare, iar pentru genele mitocondriale poate fi pnla15.Restesupusuneimarieroricndnumruldenucleotidestudiateeste mic i variana este dat de : ||.|

\|+ =nQ nPR R V1 1)(2 fapt ce indic c dac nP i nQ nu sunt mari, variana luiR poate fi foarte mare. n calculele lui)(R V , R din ecuaia de mai sus este nlocuit cuR. Caincazulsecvenelordeaminoacizidistanapdoestimarecorecta numruluidesubstituiipersitusnumaidacsecvenelesuntdestuldeapropiate., dacpestemareapareosubestimareanumruluidesubstituiideoarecenusunt luatencalculsubstituiileparaleleiceleceaulocnapoi.ncazulsecvenelor nucleotidice aceasta este mult mai grav deoarece exist doar patru stri posibile n loc de 20. 2.4.2 MODELE DE EVOLUIE ALE SECVENELOR NUCLEOTIDICE Pentruaputeaestimanumruldesubstituiinucleotidiceestenecesar utilizarea unor modele matematice care s corecteze substituiile multiple. Din aceast cauzaufostdezvoltateunnumrmaredemodele.Expresiamatematicaunui modeldesubstituieesteuntabelalratelordesubstituiepersitusiperunitatede distan evolutiv. Pentru secvenele de ADN aceste rate pot fi exprimate ca o matrice Ode44ncarefiecareelement ijO reprezintrataschimbriidelabazaila bazajntimpuluneiperioadedetimpdtinfinitdemic.Ceamaigeneralforma acestei matrici este: 27 |||||.|

\|+ ++ + + + + + = O) () () () (G C A G C AT T C A C AT G T G A AT G C T G Cl k i l k if f j h j he d e d g gc b a c b a t t t t t tt t t t t tt t t t t tt t t t t t rndurileicoloanelecorespunzndcelorpatruperechidebaze(A,C,GiT). Factorulestedatderatamedieinstantaneedesubstituiecareestemodificatde parametriirelativia,b,c.l,carecorespundcteunulpentrufiecaretransformare posibildintr-obazntr-altadiferit.Produsuldintreiparametriirelativieste parametrul ratei de substituie. Ceilali parametri, G C At t t , ,i T sunt parametri de frecven i corespund frecvenelor bazelor A, C, G i T respectiv. Pentru a simplifica modelulseadmitecfrecvenelermnconstantentimp,aflndu-sedecin echilibru,iarratadeschimbarespreoricaredintrebazeesteproporionalcu frecvena de echilibru i este independent de baza de la care se pornete. n matrice elementeledindiagonalsuntaleseastfelnctnsumtoateelementeledepeun rnd dau 0. O matrice analoag poate fi construit i pentru aminoacizi, n acest caz ea ar fi de2020 i nu de 44. Aproapetoatemodeleledesubstituiepropusepnlaoraactualsuntcazuri particulare ale matricei de mai sus (motiv pentru care am i prezentat-o). De obicei se admite c rata total a schimbrii de la o baz i la altaj pentru o perioad mai lung detimpesteaceiaicurataschimbriidelajlai.ntermenimatematiciaceasta corespunde cu afirmaia c g = a, h = b, i = c,j = d, k = e i l = f. Asemenea modele se numesc cu timp reversibil . Cel mai generalizat model cu timp reversibil (GTR) este reprezentat prin matricea simetric : |||||.|

\|+ ++ + + + + + = O) () () () (G C A G C AT T C A C AT G T G A AT G C T G Cl k i f e cf f j h d be d e d g ac b a c b a t t t t t tt t t t t tt t t t t tt t t t t t Majoritateaaltormodelefolositefiepentrudeducereaarborilorfilogeneticipe bazamaximeiverosimilitudini(maximumlikelihood)saupentruestimareadistanelor evolutiveperechipotfiobinuterestrngndaliparametricaimodeluluiGTR.Spreexemplu dac substituiile sunt mprite n transversii, tranziii ntre bazele purinice i tranziii ntre bazele pirimidinice (adic a = c = d = f) obinem modelul lui Tamura i Nei din 1993 (TrN). La fel putem obine modelul lui Kimura cu 3 tipuri de substituii (K3ST) cerndcatoatebazelesaibaceiaifrecven( 4 1 = = = =T G C At t t t )i mprindsubstituiilentranziii(b=e),transversiidetipulA-TsauC-G(c=d)i transversii de tipul A-C sau G-T (a = f). Alte restricii duc la modele mai simple i mai desutilizate.Dacadmitemcfrecvenadeechilibruabazeloresteaceiai(4 1 = = = =T G C At t t t ), iar toate substituiile au aceiai rat (a = b = c = d = e = f = 1) modelul se reduce la cel al lui Jukes i Cantor din 1969 (JC). 28 |||||||||.|

\|= O 43414141414341414141434141414143 iardaccombinmfrecvenabazeloriratadesubstituientr-unsingurparametru 4 / = o seobineoformmaisimpl.Acestparametrureprezintprobabilitatea schimbrii unui nucleotid n oricare altul : |||||.|

\|= Oo o o oo o o oo o o oo o o o3333 Un alt model utilizat frecvent este cel al lui Kimura cu 2 parametri propus n 1980 (K2P). El ia n calcul observaia c tranziiile i transversiile au loc cu rate diferite, ns ncontinuareadmiteofrecvenegalabazelor.Decia=c=d=f=1ib=e=k obinndu-se: |||||||||.|

\|+ + + + = O) 2 (4141414141) 2 (4141414141) 2 (4141414141) 2 (41k k k kk k k k Dacavemratatranziiilorde4 / k = o iceaatransversiilorde4 / = |matricea de mai sus poate fi rescris ca : |||||.|

\| = O| o | o || | o | oo | | o || o | | o2222 nmatriceademaisus| o / = k reprezintunindicecearatpredominana tranziiilor asupra transversiilor. Dac k = 1, adic| o = modelul K2P se reduce la cel JC. 29 Modelul K2P poate fi generalizat pentru a permite o frecven de echilibru inegal (aa numitul model HKY85, propus de Hasegawa et al. n 1985). Matricea ratelor de substituie a acestui model este dat de |||||.|

\|++ + + = O) () () () (R C G C AT Y A C AT G R T AT G C Y Gk k k k t t t t tt t t t tt t t t tt t t t t unde T C Y G A Rk t t t t t t | o + = + = = = , , , .Aceastacorespundemodelului GTR cu constrngerea ca a = c = d = f =1 i b = e = k. Modelul JC poate de asemeni fi transformat pentru a permite frecvena inegal a bazelor azotate (modelul F81, propus de Felsenstein n 1981). Acest lucru se poate face punnd k = 1 n matricea modelului HKY85 de mai sus : |||||.|

\|++ + + = O) () () () (R C G C AT Y A C AT G R T AT G C Y G t t t t tt t t t tt t t t tt t t t t Felsensteinamaipropusulterior(n1984)oaltmetodceinecontde frecvenainegalabazelorntr-unmodelcu2parametri.Acestmodelmparte substituiilendoucomponente :oratgeneraldesubstituieceproducetoate tipurile de substituii, i o rat n grup ce produce doar tranziii. Matricea acestui model poate fi obinut din cea a modelului GTR dac a = c = d = f = 1, b = (RK t / 1+ ), iar e=(YK t / 1+ ),undeKesteparametrulcearatraportultranziii :transversii, T C Y G A Rt t t t t t + = + = , ,iarelementeledindiagonalsuntcalculateastfel nct s reprezinte suma negativ a celorlalte elemente de pe rndul respectiv. |||||.|

\| + ++ + = OG Y C AT C R AY T G AT R G C K K K K t t t tt t t tt t t tt t t t) / 1 () / 1 () / 1 () / 1 ( Elementeledinmatriceademaisuscecorespundtranziiiloraufiecarectedou componente, deoarece tranziiile au loc fie ratei generale fie ratei din grup. Cnd K = 0 acest model se rezum la cel F81, cnd K crete peste 0, tranziiile au loc din ce n ce maifrecventfadetransversii.Acestmodelesteimplimentatnpachetulde programe PHYLIP 2.6 i toate versiunile ulterioare (Felsenstein, 2004). Aceste matrice ne dau doar rata instantanee a substituiilor ntr-un moment de timpdt,nsncazulconstrucieiarborilorfilogeneticidupmetodamaximei 30 verosimilitudini(ML)avemnevoiedeprobabilitileschimbriioricruicaractern oricare altul nt-un ram de lungime t. Matricea probabilitii substituiilor se calculeaz ca: Qte t P = ) ( Aceleai modele de mai sus pot fi folosite i pentru a calcula distana dintre dou secvenenucleotidiceXiYcares-audifereniatdintr-unstrmocomunttimpn urm. 2.4.3. ESTIMAREA NUMRULUI DE SUBSTITUII NUCLEOTIDICE 2.4.3.1. MODELUL JUKES CANTOR CelmaisimplumodeldesubstituienucleotidicestecelpropusdeJukesi Cantorn1969.Acestmodelpresupunecsubstituianucleotidicintervinenorice site cu frecven egal, astfel nct, o nucleotid este nlocuit cu una din celelalte trei nucleotidermasecuoprobabilitatepean(sauoaltunitatedetimp).Maimult, probabilitateadenlocuireauneinucleotidecuoricaredincelelaltetrei,ester=3, unde r reprezint probabilitatea de nlocuire pe site pe an. Dac lum n considerare dou secvene X i Y care au evoluat divergent dintr-o secven comun ancestral, cu t ani n urm. Dac notm cu qt nucleotidele comune dintre cele dou secvene i cupt(pt=1qt)proporianucleotidelordiferite,procentulnucleotidelorcomuneqt+1 ntimpult+1(msuratnani),poatefiobinutastfelnprimulrnd,trebuies precizmcacestsitecareprezintnucleotidecomunepentruXiYntimpult,va rmne neschimbatntimp,adicnt+1,cuoprobabilitate(1-r)2 sauaproximativ1-2r, deoarece r reprezint o cantitate foarte mic astfel nct r2 poate fi neglijat. n plus, unsitecareprezintnucleotidediferitentimpult,vaaveaaceleainucleotiden timpult+1cuoprobabilitate2r/3.Aceastprobabilitateesteobinutinndcontde faptul c n momentul n care secvenele X i Z au nucleotidele i respectiv j, n timpul t, eledevinidenticedacinXseschimbcuj,darjdinYrmneneschimbatsau dacjdinYestenlocuitcui,iaridinXrmneneschimbat.Probabilitateade apariieaprimuluievenimentestede(1-r)=r(1-r)/3,deoareceiinXtrebuiesfie nlocuitcunucleotidaj(cuoprobabilitatemaimaredectcazulcelorlaltedou nucleotide),iarnucleotidajdinYtrebuiesrmnneschimbat.Probabilitateade apariieaceluide-aldoileaevenimentestedeasemenear(1-r)/3.Maimult, probabilitateatotaleste2r(1-r)/3,caredevineaproximativ2r/3dacnuseinecont de valoarea lui r2. Dac:( ) ( )t t tq r q r q + =+1322 11, care poate fi scris ca: t t tqr rq q38321 = + Dac notm diferena t tq q +1 cu dq/dt, atunci vom abine: qr rdtdq3832 =; innd cont de condiia iniial q=1 la t=0, atunci: 31 ( )3 / 81431rte q =. n cazul prezentului model, numrul ateptat de substituii nucleotidice pe site (d) pentru dou secvene este 2rt. Din acest motiv, valoarea lui d este dat de: ( ) ( ) | | p d 3 / 4 1 ln 4 / 3 = ,unde:p=1-qesteprocentulnucleotidelordiferite dintre X i Y (Jukes i Cantor, 1969).Oestimareavalorii( ) dpoatefiobinutprinnlocuirealuipcuvaloarea observat( ) p ; n acest caz, variana este: ( )( )( ) n p p pd V24 31 9 =, (Kimura i Ohta, 1972). ncadrulacestuimodel,sepresupunecratasubstituieinucleotideloreste aceeaipentrufiecareperechedenucleotide,astfelnctfrecveneleateptateale celorpatrubazeazotateA,T,CiGsuntegalecu0,25.Oricum,nefcndnicio precizare referitoare la frecvena iniial, valoarea lui d rmne aceeai; altfel spus, nu este necesar o constan a valorii frecvenelor nucleotidice, pentru ca ecuaia ce d valoarea diferenei (d) s fie aplicabil (Rzhetsky i Nei, 1995). 2.4.3.2. MODELUL KIMURA CU 2 PARAMETRI ncazulmodeluluiluiKimura cu2 parametri seea nconsiderarefrecvena mai mare a tranziiilor fa de cea a translaiilor, rata de substituie r fiind astfel| o 2 + i nu 3o . Conform acestui model ) 1 )( 2 / 1 () 2 1 )( 4 / 1 (88 ) ( 4tt te Qe e P|| | o + =+ = iar) 2 1 ln( ) 4 / 1 ( ) 2 1 ln( ) 2 / 1 ( 4 2 2 Q Q P t t rt d = + = | ocu variana| |23 12321) (1)( Q c P c Q c P cnd V + + = unde 2 / ) ( ,2 11,2 112 1 3 2 1c c cQcQ Pc + == = 2.4.3.3. MODELUL TAJIMA - NEI n modelul lui Tajima i Nei frecvena n echilibru a nucleotidelor este considerat identic, iar ((

+ ==412 2/ 1 ) 2 / 1 (iic p g dunde = + ==314122i i jj iijg gxccu xij (i < j) fiind frecvena relativ a perechii de nucleotide ij din dou secvene de ADN comparate. n acest caz variana luideste dat de 32 n p bp p bd V22) () 1 () ( =Dacratadesubstituieanucleotideloresteaceiaipentrutoateperechilede nucleotide atunci b = n echilibru i ecuaia lui d se reduce la cea a metodei Jukes Cantor,nsnpracticb, pn la d = 0,5 modelul lui Tamura dnd rezultate practic identice cu cel Tamura Nei. Modelele Tamura, Kimura2P i Jukes Cantor dau aproape acelai rezultatcumodelulTamuraNeipentrud=0,25,chiaridistanapdevinefoarte similar cu celelalte dac p 1 , 0 s . Deci n cazul analizrii unor specii apropiate sau a unorgenefoarteconservatecumarficitocromoxidazaI(COI)nuestenecesar utilizareametodelorpreacomplexe.nacestcazestemaiindicatutilizareaunei metodesimplepentrucareovarianmaimic.Deasemenicaincazul secvenelordeaminoaciziincazulcelordeacizinucleicipoatefiutilizatdistana gammapentrucazurilencareratasubstituiilordifersubstanialncadrulaceleiai secvene.MaiuzualesuntdistanelegammapentrumodeleleJukes-Kantor,Kimura 2P i Tamura-Nei. Distanele gamma sunt mai realiste dar au o varian mai mare, din aceast cauz rezultatele obinute nu produc n mod obligatoriu rezultate mai bune n analizele filogenetice (doar dac numrul de nucleotide folosite nu este foarte mare). Pentruestimarealungimiiramificaiilorunuiarborefilogeneticdistanelegammadau de obicei rezultate mai bune. Numrul ateptat de substituii per situs (d) Numrul estimat de substituii per situs calculat cu diverse modele Figura 5 Numrul de substituii nucleotidice estimate folosind diferite metode (modelul actual al substituiilor urmeaz modelul Tamura-Nei). Frecvenele nucleotidelor sunt gA = 0,3; gT =0,4; gC = 0,2; gG =0,1. Rata tranziii/transversii este 1/ = 4 i 2/ = 8. (dup Nei & Kumar, 2000) 34 2.4.3.6. DISTANE GAMMA n cadrul distanelor evolutive, rata de substituie a nucleotidelor, se presupune a fi aceeai pentru toate siturile nucleotidice. n realitate, aceast presupunere nu este pe deplin valabil, deoarece rata substituiei este diferit n situri diferite. n cazul genelor carecodificproteine,acestfaptesteevident,deoareceprima,adouaiatreia poziieaunuicodonprezintdiferiteratedesubstituie.Existenazonelorpliaten zoneleactivealeproteinei,determindeasemenearatediferitedesubstituiede-a lungul siturilor nucleotidice. Variaia ratei de substituie poate fi observat i n genele codificatoare din macromolecula deARN, deoareceARNsprezintforede plierei adeseaformeazbucleiporiunibicatenarelabazabuclelor,careprezintdiferite ratedesubstituie.Analizestatisticealerateidesubstituie(r)ndiferitesitusuri nucleotidice,ausugeratcaceastavariazurmndaproximativdistribuiagamma dat de ecuaia: ( )( )1 I=a brar eabr f,unde( ) r V r a /2= i( ) r V r b /2= ,r i( ) r V fiind mediairespectivvarianarateidesubstituier(JohnsoniKotz,1970).( ) a I este funcia gamma, definit de formula: ( ) } = I01dt t e aa t.Formadistribuiei( ) r f estedatdevaloarealuia"care esteadeseanumitconformaiegammasauparametrugammaidevaloarealuib careestefactordemrime(KocheriWilson,1991;TamuraiNei,1993;Wakeley, 1993, 1994). Dinacestmotiv,uniiautoridezvoltdistanelegammacorespunztoare,pentru substituianucleotidelor.Distanelegammapotfiderivatealeaceleiaimetode matematice,caiceleutilizatepentrucalculareadistanelorncazulsecvenelorde aminoacizi. 2.4.4. ESTIMAREA NUMERIC A DISTANELOR EVOLUTIVE Formuleleanaliticeprezentatemaisussuntbazatepemodelematematicede substituie a nucleotidelor relativ simple, iar estimrile sunt aceleai cu estimrile prin metodamaximeiverosimilitudinipentruacelaimodel.Dacsedoretens efectuareaestimrilorpebazaunuimodelmaicomplicatcumarfiTamura-Nei gammasauGTRestemaiutilestimareanumericadistanelorfolosindmetoda maximeiverosimilitudini.Spreexemplu,formulaanaliticpentruestimareadistanei Tamura-Neigammanecesitinformaiiprivindfrecvenanucleotideloria parametruluia.FrecvenanucleotideloresteestimatdindousecvenedeADN comparate, iar valoarea lui a este obinut utiliznd secvene adiionale.Dac utilizm metode numerice este posibil estimarea frecvenei nucleotidelor i valoarea parametrului a din setul de date. Altfel spus putem estima att toi parametrii ctidistanelemaximizndverosimilitudineapentrusetuldedateitopologia 35 corespunztoare.Deasemeniesteposibilseleciaceluimaiapropriatmodelal substituiilorfolosindtestulLRT(likelihoodratiotest).Metodanumericdrezultate bune atta timp ct numrul de nucleotide examinate n este foarte mare, iar topologia folositestemaimultsaumaipuincorect.Cndnestemicdistaneleestimate obinute astfel nu dau o estimare bun a topologiei arborelui. 2.5. ARBORI FILOGENETICI AnalizelefilogeneticealesecvenelordeADNsauproteine,audevenitunmijloc important pentru studiul istoriei evolutive a organismelor, de la bacterii la om. De cnd s-aconstatatcratadeevoluieaADNvariazextensivcugenasausegmentulde ADN(Wilsonetal.,1977;Dayhoffetal.,1978),sepotstudiarelaiilefilogenetice existententretoateniveleledeclasificarealeorganismelor(regnuri,filumuri,familii, genuri, specii i populaii intraspecifice), utiliznd diferite gene sau secvene de ADN. Analiza filogenetic este de asemeni important pentru elucidarea modelelor evolutive ale familiilor de gene (Atchley et al., 1994; Goodwin et al., 1996; Nei et al., 1997) ca i pentru explicarea proceselor de evoluie adaptativ, la nivel molecular (Jermann et al., 1995; Chandrasekharan et al., 1996; Zhang et al., 1998). Reconstruciaarborilorfilogeneticiutilizndmetodestatisticeafostiniiat independent n cadrul taxonomiei numerice, referitor la caracterele morfologice (Sokal iSneath,1963)ingeneticapopulaionalpentrufrecvenagenelor(Cavalli Sforza i Edwards, 1964, 1967). Unele metode statistice dezvoltate n aceste scopuri suntncutilizatepentruanalizastatisticadatelordeordinmolecular,dar,recent, numeroase metode noi au fost dezvoltate. Relaiilefilogeneticedintreorganismesaugenesuntdeobiceiprezentatesub form de arbori filogenetici cu o rdcin (Figura 6a) sau fr rdcin (Figura 6b).Modul n care se dispun ramurile ntr-un arbore filogenetic se numete topologia arborelui.Existunnumrfoartemaredearbori(curdcinsaufr)pentruun anumitnumrdetaxoni(oricetipdeunitatetaxonomic,fieeafamilie,specie, populaie, secven de ADN sau aminoacizi). abc dc d a b Figura 6 Cele dou tipuri mari de arbori filogenetici: a-cu rdcina, b-fr rdcin a b 36 Dacnumrultaxonilor(m)este4,exist3topologiiposibilepentruarborifr rdcini15pentruarboricurdcin.Numrulposibildetopologiicretebrusc odat cu creterea lui m.Numrul de topologii posibile pentru un arbore cu rdcin ce prezint doar bifurcaii (rezolvat complet) este | || | )! 2 ( 2)! 3 2 () 3 2 ( 5 3 12= mmmm pentru m 2 > . Deci numrul posibil de topologii pentru m = 2, 3, 4, 5 i 6 este de 1, 3, 15,105 i945respectiv.Cndm=10eldevine34.459.425,doarunadintreaceste topologiifiindceaadevrat!Pentruacalculanumrultotaldetopologiipentruun arbore fr rdcin nlocuim n formula de mai sus m prin m 1.ntr-unarborefilogeneticfrrdcindemtaxoniexist2m3ramificaii,m ramificaii externe i deci m 3 ramificaii interne. Numrul de noduri interne este de m2.Pentruunarborecurdcinnumrulderamificaiiinterneestedem2, numrul de noduri interne este de m 1, iar numrul total de ramificaii este de 2m 2.TeoreticosecvendeADNsempartedihotomiclafiecarespeciaiesau duplicaie de gene, arborii filogenetici fiind de obicei bifurcai. Totui cnd se studiaz osecvenrelativscurtuneleramificaiiinternepotsnuprezinteniciosubstituie putndapreaastfelarboripluriramificai.Majoritateametodelorfolositepentru deducerea arborilor filogenetici construiesc arbori bifurcai, dar un arbore obinut poate fitransformatntr-unulpluriramificateliminndoriceramificaieculungime0.Este posibildeasemenicachiardacadevratafilogenieesteunfenomendihotomic arborelereconstruitsaparpluriramificatdatoriterorilorstatistice.nrealitatecele dou cazuri sunt practic imposibil de deosebit. 2.5.1. ARBORI AI GENELOR I ARBORI AI SPECIILOR De cele mai multe ori suntem interesai s obinem un arbore filogenetic care s reprezinteistoriaevolutivaspeciilorsaupopulaiilor.Acesttipdearboreeste denumitarborealspeciilorsaualpopulaiilor.ntr-unarborealspeciilormomentul divergenei dintre dou specii corespunde cu apariia izolrii reproductive. Totui cnd seconstruieteunarborefilogeneticporninddelaogendelafiecarespecie, arboreleobinutpoatesnufienconcordancufilogeniaspeciilor.ncazul existeneialelelorpolimorfedivergenagenelorarelocanteriorseparriipopulaiilor (Figura 7) 37 Cndgeneleluatenstudiuaparinuneifamiliimultigenicepoatesaparalt problem. Dac spre exemplu dou specii nrudite 1 i 2 au dou gene duplicate, a1 b1ia2b2respectiv,iarduplicareaaavutlocnainteaseparriicelordouspecii atunci genele a1 i a2 sunt ortoloage, adic una este descendentul direct al celeilalte, iar perechile a1 cu b1, a2 cu b2, a1 cu b2 i a2 cu b1 sunt paraloage, adic nu sunt descinsedirectunadincealalt.Cndconstruimunarborefilogeneticalspeciilor trebuiesutilizmdoargeneortoloageinuparaloage,deoarecedoarprimele reprezintfenomeneledespeciaie.difereniereantreceledoutipuridegenenu estentotdeaunasimpl,maialesncazulfamiliilormultigenice,deaceiadeducerea filogeniei speciilor din cea a genelor trebuie fcut mereu cu mult grij.Bineneles c nu ntotdeauna se caut a obine un arbore al speciilor. n studiul familiilormultigenicesecautcunoatereaistorieievolutiveamembrilorfamilieii procesul duplicrii genelor. Oaltproblemnreconstruireaarborilorfilogeneticiestecdemulteori lungimea secvenelor utilizate este mic, aprnd erori statistice. O filogenie teoretic construitdintr-unsetdedateculungimefoartemareiunnumrateptatde substituii se numete arbore real, iar cel din secvenele disponibile cu numrul real de substituii, arbore realizat, i unul i cellalt fiind diferii de fapt de arborele reconstituit sau dedus. Majoritatea modelelori metodelor de reconstrucie a arborilor filogenetici autendinadeaproducefilogeniilerealizate,iarUPGMApeceareal.Dinpcate aceast din urm metod este foarte sensibil la erori i dimensiunea setului de date. Desigurccelmaiutilestearborelereal,celcereprezintevoluiaistoric,nsn practic este mult mai simplu s obinem arborele realizat, deoarece setul de date se refer anume la acest tip de arbore. De asemeni topologia unei filogenii realizate este aceiaicuceaaceleireale,exceptndcazurilencareprimadevinecunoduri pluriramificatedatoriterorilorstatistice(uneleramificaiiinternepotsnuprezinte a b c d AB dg1 t0 dg2-t1 dg3-t2 sp-t3 populaie polimorf ancestral Figura 7 Diagram ce arat c n cazul existenei polimorfismului, momentul separrii genelor este anterior separrii populaiilor 38 niciosubstituie).Odatcucretereanumruluidenucleotideutilizatearborele realizat se apropie de cel real.Cnd se construiete o filogenie a speciilor sau populaiilor arborele real trebuie saiblungimearamificaiilorproporionalcutimpuldeevoluie,iardoulinii evolutivedescendentedinacelainodinterntrebuiesaibaceiailungime.n realitate ns rata de evoluie a genelor este supus erorilor randomice ct i anumitor tipuri de presiune selectiv, astfel nct n unele linii gena poate evolua mai rapid, iar naltelemaincet,arborelerealizatnereuindsproductipuldearborefilogenetic descris mai sus. 2.5.2. METODE DE RECONSTRUIRE A ARBORILOR FILOGENETICI Metodele utilizate la ora actual pentru reconstruirea arborilor filogenetici pot fi mprite n trei mari categorii:1. metode bazate pe distane 2. metode MP (Maximum Parsimony) 3. metode ML (Maximum Likelyhood) Reconstruciaunuiarborefilogeneticestedeobiceiprivitcadeducereastatistica adevratului arbore filogenetic care este necunoscut. Acest proces poate fi subprit n dou etape i anume estimarea topologiei i estimarea lungimii ramificaiilor. Cndtopologiaestecunoscutestimarealungimiiramificaiiloresterelatvsimpl,utilizndu-se metode ca cea a ptratelor minime sau ML. Cum pentru un numr dat de secvene exist foarte multe topologii posibile au fost dezvoltate metode de optimizare acutriicumarficeaamaximeiverosimilitudini(ML)sauaevoluieiminime(ME). Pentrunsecvenemiciiunnumrdespeciimareacestemetodetindnssdea topologii greite. 2.5.2.1. METODE BAZATE PE DISTANE n cadrul metodelor bazate pe distan sau pe matrixul de distan, acestea sunt calculate pentru toate perechile de taxoni, iar arborii filogenetici sunt construii innd cont de relaiile stabilite n jurul valorilor acestor distane. nacestcaz,direciilefilogeneticesuntconstruiteconsiderndmatriciale distanelorncaresuntcalculatedistanelentresecveneluatedouctedou. Exist un numr foarte mare de metode prin care se pot estima direciile filogenetice pornind de la distane. UPGMA (Unweighted Pair-Group Method using Arithmetic Averages) Numelemetodeiprovinedelaunweightedpair-groupmethodusingarithmetic averages" (UPGMA). Metoda este atribuit autorilor Sokal i Michener (1958), dar s-a constatat ulterior c prezenta metod este complet diferit de cea utilizat de acetia. nschimb,algoritmulaparepublicatdectreSneathiSokal(1973).Unarbore construitpebazaacesteimetodeestenumitifenogram,deoareceafostiniial folosit la reprezentarea gradului de similaritate fenotipic pentru un grup de specii, n cadrultaxonomieinumerice.Oricum,poatefifolositnfilogeniamolecularatunci cnd rata de substituie a genelor este mai mult sau mai puin constant. n special n 39 cazul n care frecvena genelor este folosit n reconstrucia filogenetic, acest model producearboridestuldebuni,comparativcualtemetodebazatepedistan(Neiet al., 1983; Takezaki i Nei, 1996). n acest caz, o msur a distanei care prezint un coeficientmaimicdevariaie,paresduclaconstruireadearboricuomaimare precizie, comparativ cu alte metode de determinare a distanei, chiar dac nu respect exactnumruldesubstituiigenice(TakezakiiNei,1996).PrinUPGMAsepot construiarboripentruevoluiancadrulspeciilor,cutoateceroridetopologieapar adeseacndratasubstituieigenelornuesteconstantsaucndnumruldegene sau nucleotide este mic. ncadrulUPGMA,unmoddemsurareadistanelorevolutive,estecalcularea acestorapentrutoateperechiledetaxonisausecvene,valoriledistanelorfiindsub forma unei matrici (Tabelul 4) Tabel 4 Prima matrice a distanelor (Nei i Kumar, 2000) Taxon1234 2d12--- 3d13d23-- 4d14d24d34 5d15d25d35d45 Dinaceastmatrice,rezultcdijreprezintdistanadintretaxoniiiij.Analiza grupat (de tip clustal) a taxonilor ncepe cu perechea de taxoni ntre care exist cea maimicdistan.Presupunndcd12esteceamaimicdistandintretoate valorilematriceirezultate,taxonii1i2vorfigrupaiporninddintr-unramcomun localizatladistanab=d12/2.Dinacestea,putempresupuneclungimearamurilor celor doi taxoni care provin dintr-un ram comun, este aceeai. n acest caz, taxonii 1 i 2vorfincadraintr-unsingurtaxoncompussaugrup[u=(1-2)],iardistanadintre acest grup i un alt taxon k (k1,2) este dat de: duk=(d1k+d2k)/2. n plus, obinem o nou matrice (Tabel 5) Tabel 5 A doua matrice a distanelor (Nei i Kumar, 2000) Taxonu=(1-2)34 3du3-- 4du4d34- 5du5d35d45 n continuare, presupunnd c distana du3 este cea mai mic, taxonii u i 3 vor fi ncadraintr-unnoutaxoncompussaucluster[v=(1-2-3)],cuolungimearamului comun de b=du3/2=(d13+d23)/(2x2). Aceast distan ntre noul cluster (grup) creat v ifiecaredintretaxoniirmai(k),estedatde:dkv=(dk1+dk2+dk3)/3.Atunci matricea se va transforma n (Tabelul 6): Tabel 6 A treia matrice a distanelor Taxonv=(1-2-3)4 4dv4- 5dv5d45 Presupunndcdv4esteceamaimicvaloaredinmatriceaanterioar,putem ncadra v=(1-2-3) i 4 ca avnd un ram comun dat de b=dv4/2=(d14+d24+d34)/(3x2). 40 Este evident c ultimul taxon care se altur celorlali trei, este 5 i ramul comun este dat de: b=(d15+d25+d35+d45)/(4x2). Estedeasemeneaposibil,canceade-adouamatriceceamaimicdistan poate fi d45 (sau oricare alta n afar de du3). n acest caz, taxonii 4 i 5, sunt unii cu ramuracomundatdeb=d45/2,crendu-seastfelunnoutaxoncompus,v=(4-5). Distanelentrevialttaxon(3iu)suntdateded3v=(d34+d35)/2i duv=(d14+d15+d24+d25)/4. Presupunnd c duv este cel mai mic, taxonii u i v sunt grupai iar taxonul 3 va fi ultimul care se va altura grupului. De asemenea, dac d3v este cel mai mic, taxonii 3 i v se vor grupa primii. Dup cum reiese din exemplul anterior, distana dintre dou grupuri (A i B) este dat de urmtoarea formul: ( )=ijij ABrs d d / ,underissuntnumereledetaxoningrupeleAiB, iar ijd estedistanadintretaxonulidingrupulAitaxonuljdingrupulB.Ramura comundintreceledougrupe,estedatdedAB/2.Cutoateacestea,nscopul modelriipecalculator,ecuaiademaisusnuesteutilizabil,fiindfolosiialgoritmi mai facili pentru a calcula dAB (Swofford et al., 1996). METODA PTRATELOR MINIME (LS Least Squares) Cndratadesubstituieanucleotidelorvariazdelauntaxonlaaltulmetoda UPGMAdadeseorifilogeniicutopologiegreit.nacestcazpoatefiutilizat metoda ptratelor minime. n cazul metodei ptratelor minime obinuite, se ia n considerare urmtoarea sum rezidual a ptratelor < =j iij ij Re d S2) (undedijieijsuntdistaneleobservatirespectivpatristicdintretaxoniiiij. Distana patristic este suma lungimii estimate a ramificaiilor ce unesc cei doi taxoni. SRestecalculatpentrutoatetopologiileplauzibileitopologiacuceamaimic valoareestealeasdreptfilogeniefinal.OaltposibilitatedeacalculaSReste aplicnd formula : | |< =j iij ij ij Rd e d S / ) (2 n practic cele dou formule dau rezultate identice sau aproape identice. O problem ce se datoreaz criteriului de optimizare al acestei metode este obinerea frecvent a ramificaiilor cu lungime negativ (ceia ce din punct de vedere biologic este imposibil). Felsenstein(1995)ambuntitmetodaLSprinaplicareaconstrngeriidea