Os genomas dos eucariotas são pontuados por longas porções de sequências que não codificam proteínas ou RNAs. Embora algumas destas regiões contenham sequências regulatórias cruciais, a grande maioria deste DNA não serve nenhuma função conhecida. Normalmente, estas regiões do genoma são aquelas em que se observa a alteração mais rápida, em termos evolutivos, porque há normalmente pouca ou nenhuma pressão de seleção que actua sobre estas regiões para preservar as suas sequências.
Em contraste, regiões que codificam para uma proteína podem sofrer uma pressão de seleção elevada, uma vez que quaisquer alterações na sua sequência são susceptíveis de resultar em uma proteína menos capaz de executar a sua função de forma ideal. No entanto, ocasionalmente, uma mutação em uma dessas regiões resultará em algo benéfico que contribui para a aptidão geral do organismo, e essas mutações muitas vezes persistem e podem mesmo fixar-se em populações. Quando se compara a frequência destes eventos de mutação com as alterações relativamente regulares observadas em sequências não codificantes, ela é extremamente rara, pelo que, no geral, é considerado que regiões codificantes evoluem lentamente.
Também é verdade que existe uma quantidade mensurável de variação nos níveis de conservação de sequências em sequências codificantes, e isto é visto em todos os organismos. Por exemplo, considere uma proteína receptora. Essas proteínas têm geralmente regiões diferentes que podem executar funções como ligação a ligandos, sinalização intracelular, ou integração membranar. Neste caso, uma mutação na região que está envolvida na ligação ao ligando pode produzir uma proteína que se liga com menor eficiência ao ligando. Portanto, a pressão de seleção seria provavelmente alta nos nucleótidos específicos que codificam para esta parte da proteína. No entanto, na região da proteína que se estende pela membrana, pode observar-se um efeito menor se ocorrer uma substituição de aminoácidos, e portanto níveis mais baixos de pressão de seleção. Nestas condições, podemos ver que duas regiões do mesmo gene codificante de proteína podem ter velocidades diferentes de evolução.
Sequenciação de Genes ou Regiões Genómicas para Construir Filogenias
Esta variação na velocidade de evolução do genoma em diferentes regiões pode ser estudada para responder a perguntas sobre relacionamentos evolutivos. Genes e regiões genéticas podem ser seleccionados e sequenciados em grupos de indivíduos para responder a questões tão restritas como “estas populações são espécies potencialmente diferentes?” ou tão amplas como “como é que estes filos se encaixam na árvore da vida?”. Para o primeiro, seleccionar um gene que tenha uma região relativamente pouco conservada ajudaria a identificar diferenças a nível populacional. Por outro lado, para responder a questões sobre grupos tão diversos como filos, uma região genética altamente conservada pode fornecer homologia suficiente para produzir uma filogenia desses grupos. As regiões mais utilizadas para análises filogenéticas moleculares como estas incluem genes ribossomais de rRNA (tais como rRNA 16s, rRNA 18s, ou rRNA 28s), ou regiões genómicas conhecidas como ITS (Espaçadores Internos Transcritos, I ou II) que se encontram entre os genes das subunidades ribossomais de rRNA.