Famílias de genes consistem em grupos de genes que se propõe terem origem a partir de um ancestral comum. Normalmente, estes surgem através de eventos em que um gene ou genes são erradamente duplicados durante a divisão celular. Ao contrário dos genes que lhes deram origem (que estão sujeitos à pressão de seleção para manter a função), estas cópias genéticas não precisam preservar as suas sequências e podem evoluir a uma velocidade relativamente mais rápida.
Ocasionalmente, essas regiões podem ser adaptadas para assumir novos papéis dentro do organismo, tornando-se novos genes no seu próprio direito. Quando isso ocorre, referimo-nos a esses genes como parálogos – dois genes dentro da mesma espécie que evoluíram a partir de um gene ancestral comum.
Outro termo comum quando se refere a membros de uma família de genes é ortólogo. Genes ortólogos são aqueles que surgiram a partir de um gene ancestral comum, mas continuaram a evoluir após um ou mais eventos de especiação. Por exemplo, o gene para a enzima trealase de murganho teria um ortólogo em humanos que também produz a enzima trealase. No entanto, esses genes e os seus produtos seriam pelo menos parcialmente diferentes em sequência devido aos anos de alterações evolutivas desde o último ancestral comum entre murganhos e humanos. Portanto, eles são ortólogos na mesma família de genes.
O terceiro termo comum utilizado nas famílias de genes são os genes homólogos. Este termo é mais amplo e aplica-se a todos os genes relacionados dentro de uma família de genes.
Além disso, o termo superfamília é às vezes usado para referir grupos muito grandes de genes e proteínas que apresentam homologia suficiente para compartilharem ancestralidade comum. Para essas grandes famílias, o agrupamento pode contar com semelhanças mecanísticas para determinar a extensão do grupo. Como consequência da sua criação genética partilhada, os genes dentro de uma família de genes desempenham normalmente funções relacionadas. A superfamília de imunoglobulinas, por exemplo, é composta por um grande número de genes que codificam tanto proteínas solúveis como proteínas de superfície celular envolvidas em respostas imunológicas, como a ligação ou adesão celulares. A característica principal desta família é que os membros compartilham um domínio comum chamado imunoglobulina fold – que é crítico para a sua função.