什么是CNV
CNV的全称是Copy Number Variantion ,但这里特指“人类基因组拷贝数变异”。我们知道人类基因组是由60亿个化学碱基(核苷酸)所构成的。这60亿个化学碱基一共组合成了23对(46条)染色体,在每一对染色体中都有两条姐妹染色单体,它们分别遗传自父亲和母亲。在这些染色体中包含着大约30000个编码基因。鉴于人类基因组是一个二倍体,那一般来说,我们会自然而然地认为每一个基因都应该恰好有2份拷贝,即姐妹染色单体上各有一份。但,实际的情况却并非如此。近期的研究也表明,基因组上有些长度较大的DNA序列片段——长度通常在1000bp至1Mbp,存在着反常的拷贝次数。这样的一种现象就称之为拷贝数变异,也就是英文的CNV。这种拷贝数变异会导致受其影响的基因表达失调。举个例子来说,比如我们一直以为在每个人中这些基因都只有2份拷贝,但是现在却会在有些人中看到它们只有1份,或是3份,甚至更多。更为罕见的情况是在有些人中甚至存在着两条染色单体中同时丢失某个基因的情况(见下图)。
大家从图中可以看到,大多数的基因确实只有2分拷贝,但也存在着反常的情形(红色高亮的部分)(译者:这个图只是示意而已,实际的情形可不一定是这样分布的)。
CNV为什么那么重要
明确了CNV是什么之后,接下来的话题便是要明白CNV为什么重要了。应该说正是由于DNA序列上的差异使得我们每个人在这个世界上都是独一无二的。当然了,这些独一无二的特性还包括了对不同疾病易感程度的差异和不平等性。以前的看法认为单核苷酸多态性(SNP)是DNA遗传差异的最主要和最重重要的来源。然而,近期的研究成果中我们却看到,人类基因组CNV变异的序列,在长度上至少已经是单核苷酸变异(SNP)总长的3倍(译者:原文虽然这么说,但其实并不能因此就简单的以为CNV在遗传差异上的贡献会是SNP的3倍,这还和它所能表现出来的效应相联系)。并且考虑到发生CNV的序列常常围绕在基因的周围,这很可能暗示了它们在人类疾病和药物反应中扮演着一个相当重要的角色。另外,能弄明白人类基因组CNV的发生机制也将有助于我们更好的了解自身基因组的进化历程,以便搞清楚**“我为何不同,我之所以是我”**的深层原因。
欢迎关注我的个人公众号:helixminer(碱基矿工)