1. 简单百科
  2. 基因家族

基因家族

基因家族(gene family),是来源于同一个祖先,由一个基因通过基因重复而产生两个或更多的拷贝而构成的一组基因,它们在结构和功能上具有明显的相似性,编码相似的蛋白质产物。基因家族的成员可能是旁系同源物或直系同源物,其中旁系同源物是同一物种中具有相似序列的基因,而直系同源物是不同物种中具有相似序列的基因。同一家族基因可以紧密排列在一起,形成一个基因簇,但多数时候,它们是分散在同一染色体的不同位置,或者存在于不同的染色体上的,各自具有不同的表达调控模式。

定义

真核生物中,许多相关的基因常按功能成套组合,被称为基因家族。

构成

基因组进化中,一个基因通过基因重复产生了两个或更多的拷贝,这些基因即构成一个基因家族。

特点

是具有显著相似性的一组基因,编码相似的蛋白质产物。同一家族中的成员有时紧密的排列在一起,成为一个基因簇;更多的时候,它们却分散在同一染色体的不同部位,甚至位于不同染色体上,具有各自不同的表达调控模式。

一组功能相似且核苷酸序列具有同源性的基因,可能由某一共同祖先基因经重复和突变产生。

外显子相关的一组基因所组成,家族成员来自某个祖先基因的倍增和变异。

命名

国际人类基因组组织(HUGO)的人类基因组组织基因命名委员会(HGNC)使用基因家族成员的“主干”(或“根”)符号(通过同源性或功能)创建命名方案,并使用分层编号系统来区分各个成员。例如,对于过氧化物氧还酶(peroxiredoxin)家族,PRDX是根符号,家族成员为PRDX1、PRDX2、PRDX3、PRDX4、PRDX5和PRDX6。

演化

基因家族是基因组中信息存储层次结构的一部分,在多细胞生物的演化和多样性中发挥着重要作用。基因家族是信息和遗传变异的大单位。随着演化时间的推移,基因家族随着新基因家族的形成和一些基因家族的丢失而扩大和收缩。在几个演化谱系中,基因以相对相同的速率获得和丢失。当自然选择有利于额外的基因拷贝时,就会发生基因家族的适应性扩展。当环境压力源作用于一个物种时就是这种情况。基因扩增在细菌中更为常见,是一个可逆过程。基因家族的适应性收缩通常是由功能丧失突变的积累引起的。过早停止基因转录无义突变种群中固定下来,导致基因丢失。当环境的变化使基因变得多余时,就会发生这个过程。

分类和结构

基因家族在大小、序列多样性和排列方面变化很大。根据家族内基因的多样性和功能,家族可分为多基因家族或超家族。多基因家族通常由具有相似序列和功能的成员组成,尽管高度差异(在序列和/或功能水平上)不会导致基因从基因家族中移除。家族中的单个基因可能在同一条染色体上紧密排列在一起,也可能分散在不同染色体上的整个基因组中。由于它们序列的相似性和重叠功能,家族中的单个基因通常共享调控元件。在某些情况下,基因成员具有相同(或几乎相同)的序列。这些家族允许根据需要在短时间内表达大量基因产物。其他家族允许在不同细胞类型或生物体发育的不同阶段表达相似但特定的产物。超家族比单个多基因家族大得多。超家族包含多达数百个基因,包括多个多基因家族以及单个基因成员。大量的成员使得超家族可以广泛分散,一些基因聚集在一起,一些基因分散得很远。这些基因在序列和功能上是多种多样的,显示出不同的表达水平和独立的调节控制。

多基因家族

真核生物基因组的特点之一就是存在多基因家族(multi gene family)。多基因家族是指由某一祖先基因经过重复和变异所产生的一组基因。

一类是基因家族成簇地分布在某一条染色体上,它们可同时发挥作用,合成某些蛋白质,如组蛋白基因家族就成簇地集中在第7号染色体长臂3区2带到3区6带区域内;另一类是一个基因家族的不同成员成簇地分布不同染色体上,这些不同成员编码一组功能上紧密相关的蛋白质,如珠蛋白基因家族。在多基因家族中,某些成员并不产生有功能的基因产物,这些基因称为假基因(pseudo gene)。假基因与有功能的基因同源,原来可能也是有功能的基因,但由于缺失,倒位或点突变等,使这一基因失去活性,成为无功能基因。与相应的正常基因相比,假基因往往缺少正常基因的内含子,两侧有顺向重复序列。人们推测,假基因的来源之一,可能是基因经过转录后生成的核糖核酸前体通过剪接失去内含子形成mRNA,如果mRNA经反复转录产生cDNA,再整合到染色体DNA中去,便有可能成为假基因,因此该假基因是没有内含子的,在这个过程中,可能同时会发生缺失,倒位或点突变等变化,从而使假基因不能表达。

参考资料