注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

lican8341的博客

霜剑如梦倚残翼,泊影难觅几何时!

 
 
 

日志

 
 

全基因组扫描定位易感基因的策略和方法  

2014-12-15 20:08:04|  分类: 抬头望见北斗星— |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |

【关键词】  全基因组扫描定位 易感基因

 基因在决定个体表型方面起着决定性作用,通过赋予个体对疾病的易感性或抵抗力,以及影响机体与环境因素的相互作用,基因对疾病的发生起着间接或直接作用。因此,人们希望通过识别疾病相关基因,以最终实现疾病的基因诊断和基因防治[1]。

  因绝大多数疾病是多个微效基因协同作用并与环境因素共同导致,此类基因赋予患者易感性,故称为疾病易感基因(susceptibility genes)。随着分子遗传学和人类基因组计划的发展和实施,分析复杂疾病的遗传因素,定位疾病易感基因成为可能,从而为疾病的早期诊断和预警带来了希望[2]。迄今为止,对符合孟德尔规律的单基因病已经建立了一套行之有效的研究体系并定位克隆了近千个致病基因。但对于多基因病,因其不完全符合孟德尔规律,所以在其易感基因的定位和遗传分析中仍存在很多问题。多基因病易感基因的定位和遗传分析成为近年来医学遗传学研究的热点和难点。

  多基因病涉及的主要为一些常见疾病,如原发性高血压、糖尿病、哮喘、银屑病、神经及精神疾病等,其群体总患病率近6 %[3]。它们虽有一定程度的家族倾向,但不遵从典型的孟德尔遗传规律,其表型与基因型之间的关系错综复杂,对其致病基因的分离尚缺乏成熟的技术,必需在人群与遗传标志的选择、数学模型的建立、统计方法的改良等方面进行不断的探索和艰苦的工作。当今国内外学者所采取的基本策略主要是从改进实验技术和遗传分析方法等方面开展研究,其中常用的方法是大规模全基因组扫描和分型的连锁分析[4,5],即首先选定研究样本如家系、同胞对或人群,用遗传位标对样本成员针对全基因组、某染色体区段或某候选基因进行扫描,最后将所得数据用相应统计方法分析,确定哪些区段或基因与所研究的疾病间存在连锁或相关关系。

  一、全基因组扫描策略

  全基因组扫描(genomewide search)利用DNA多态性标记(主要是微卫星DNA)或消减杂交等策略,对基因组逐个点进行筛查,进行全基因组扫描,寻找与疾病相关的易感基因。用多态性遗传位标对样本个体进行基因扫描和分型,定出每一个体遗传位标的等位基因。用统计软件(如GENEHUNTER等)进行遗传统计分析,确定与疾病相连锁的染色体区段,通过增加扫描密度或单倍型分析等方法,将定位区域尽可能缩小。遗传位标目前大多采用微卫星多态标记(short tandem repeats, STR),单核苷酸多态性(single nucleotide polymorphisms, SNP)被认为是很有前途的新一代遗传位标。

  1.样本的收集和提取DNA样本:当前全基因组扫描基因定位主要是采用以家系为基础的分析方式。

  选择理想家系。所谓理想家系应符合(1)诊断准确,且为迁移较小、相对封闭的人群;(2)家系的数目及大小需达到一定要求;(3)有明确的遗传相关数据,如遗传方式、遗传度、外显率等。家系材料的收集应尽可能全面,包括血液样本、组织切片、分离的细胞株、临床检验结果等[6]。

  此外,还有以患病同胞对、核心家庭或以人群为基础的分析形式,选择相对应的不同样本。

  2.DNA短串联重复序列STR方法:(1)选择与制备。全基因组扫描中利用的微卫星标记,是一种广泛存在于人类基因组、以2~6个碱基为单位、串联重复排列的序列,具有高度的多态性,并以孟德尔共显性遗传,可以作为一种遗传标记。目前商品化的AB I PR ISMTM Linkage Mapping Set(PE公司出品)共包含400个STR,分辨率达<10 cm,可覆盖人类整个基因组。然后合成STR的引物,进行PCR反应。(2)电泳检测。PCR产物的检测过程是在自动激发荧光DNA测序仪上进行的。与测序仪联接的计算机可直观地将每一产物的产量及分子量大小用曲线峰谱表示出来,再用相应的软件系统将电泳检测到的数据进行处理。(3)自动基因分型。用Gene scan和Geno typer软件对基因组扫描的结果进行基因分型[7]。首先用Gene scan软件自动分析电泳检测结果,准确测量每一泳道内的分子量内标,依靠内标绘出分子量的回归曲线;然后采用Geno typer软件对所得数据进行基因分型,据此得到家系中每个个体在400个基因位点的基因型。(4)基因组扫描综合分析。经上述处理后的数据输入相应的软件(如LINKAGE等),并与家系分析得出的数据进行综合处理,最常用的是连锁分析。目前该方法经过不断的改进和发展,并与其他分析方法,如相关分析及连锁不平衡分析等相结合,大大提高了在复杂性多基因遗传病易感基因定位研究中的能力。它的主要缺点是费用昂贵,现在并非每个实验室都能够办得到的。

  在上述区段内选择覆盖密度更高的微卫星标记,进行精细定位,尽量缩小致病基因的范围,明确基因位点。第三代遗传标志系统—单个核苷酸多态性,因其数目更多、覆盖密度更大(有可能达到人类基因组遗传多态性标志位点数目的极限),故在基因定位研究中具有其它标志系统不可比拟的优越性和潜力,目前被大量使用。

  3.SNP的发展:1990年开始启动的人类基因组计划(human genome project, HGP)揭开了人类遗传信息的秘密。随着研究的深入,人类基因组单核苷酸多态性( single nucleotide poly-morphisms, SNPs)的研究应运而生,并且得到迅猛的发展。SNPs数量大、分布广且在不同人群中的分布频率也有差异,这些差异可以代表某一种族或人群间的遗传差异[8]。SNPs是指基因组DNA序列中由于单个碱基(A、T、C、G)的变异而形成的多态性,并且这种变异人群中出现的频率大于1 %[9]。SNP的位点及其丰富,几乎遍及整个基因组。据估计基因组中大约平均每1 000 bp,就会出现一个SNP,这样SNP在整个基因组的分布就会达到300万个。

  由于SNP在基因组中的高密度的特点,与以前的微卫星或其它遗传标记相比,利用SNP可以在上述的研究中对目的片段或基因作出更加精细的标定,从而使研究不断深入。目前,几个相对有前景的半自动或全自动地进行大量SNP检测的方法已经初露端倪。包括小型测序、多重反向点杂交、DNA芯片或微列阵,以及TaqMAN的方法[10]。

  4.基因芯片:基因芯片的基本原理是应用已知的核苷酸序列作为探针与标记的靶核苷酸序列进行杂交,通过对信号的检测进行定性与定量分析。它将许多探针同时固定在同一芯片上,在一次试验中,可以同时平行分析成千上万个基因[11]。因此它和传统杂交法相比具有操作简单、效率高、成本低、自动化程度高、检测靶分子种类多、结果客观性强等明显的优点。

  基因芯片现已广泛使用于基因表达分析,疾病诊断与治疗等方面。例如基因芯片技术对血友病、杜氏肌营养不良症、地中海贫血、异常血红蛋白病、苯酮尿症等的检测均已取得了较大的成功[12]。随着“人类基因组计划”和“后基因组计划”的开展,越来越多的遗传病相关基因会被揭示出来,这为在基因水平上揭示遗传病,并进行早期诊断奠定了基础。

 二、全基因组扫描数据分析方法

  1.连锁分析:在遗传过程中,2个基因或遗传标志被一起分配到子代而不发生交换,称为连锁(linkage)。两个基因位点发生交换的可能性反映了这两个基因的遗传距离,所以由标记位点与疾病位点间的重组率可估算出两者间的遗传距离及连锁程度。根据疾病有无合适的遗传模式,可分别进行参数分析与非参数分析。(1)参数分析法。亦称模式依赖的连锁分析法,即一般所指的连锁分析法。两位点连锁分析最常用的是LODS 连锁分析,即对数优势计分法(log odds score ,LODS) 是基于最大似然比检验的参数连锁分析方法[13],主要检测在两基因以某一重组率相连锁时,出现这种情况的似然性有多大。该分析方法利用一个家系中所有成员之间的遗传信息,适用于已知遗传方式的单基因遗传病的基因定位。目前该计算有相应软件包可供使用,如Linkage, Lipid,Vitesse,Gene, Hunter[14~17]等。(2)非参数分析法。此法不依赖于疾病的遗传模式,被认为是多基因疾病的理想分析法。其研究对象限于家系中成对的患病成员,常用的非参数分析法有患病同胞对法和患病家系成员法。但非参数分析法在检出效力及分析可靠性上较参数连锁分析低,它也不能象LODS法那样得出遗传标记和易感基因之间的距离。患病同胞对法(affected sibpair ,ASP)原理是,如同胞对均为患者,他们将共有带有致病基因的那段染色体,通过标记物确定个体的基因型,可找出染色体上共有超出理论值的区域,从而对疾病基因进行定位。患病家系成员法(affected pedigree member ,APM)原理与ASP法相同,只是把研究对象扩展到整个家系的所有成员(包括患病的成对远亲),从而解决ASP法分析时家系资料不足的问题,其分析遗传标记和易感基因连锁的有效性则比ASP低。它只能确定致病基因与一个较大的染色体区域的连锁关系,而不能用于致病基因的精细定位[18]。目前,APM法较多用于同胞对收集较困难的晚发性多基因遗传病的遗传分析。

  2.人群相关性分析:在一个群体中设立病人组和对照组,确定遗传位标频率在两组中是否存在差别,即分析遗传位标基因型与性状基因间有否连锁不平衡,进而在该遗传位标附近寻找目标基因。选用隔离人群进行连锁不平衡分析更为理想。

  3.传递- 连锁不平衡检验:染色体上遗传位标与疾病位点间的距离较近,它们在传递过程中一起传递给子代,表现为共分离,即连锁不平衡(linkage disequilibrium )[19]。由于群体相关分析可能产生因群体分层而导致的假阳性,近年来有人提倡用患者核心家系成员(双亲及同胞)作为相关分析对照组,即Spielman创立的传递- 连锁不平衡检验(transmission/disequilibrium test, TDT)[20]。TDT基于连锁不平衡的分析方法,一般用于亲代的标记等位基因是杂合型,观察可能的易感标记等位基因传递给患病子代的概率。一般情况下,当通过病例-对照研究已经揭示在人群水平上某标记位点与某性状(如疾病)间存在某种关联性(无论是真实还是虚假的关联)时,进行传递/不平衡检验可排除可能的虚假关联[20]。

  三、展望

  多基因病的遗传模式尚未确定,性状的变异往往受众多基因与环境的共同调控,相互间又存在一定程度的互作[21]。基因与基因间、基因与环境因素间的相互作用到目前为止还无法检测,所以多基因疾病的定位结果往往不尽如人意。然而SNP和DNA芯片等新技术的出现,为多基因遗传病易感基因的定位展示了广阔的前景。多基因疾病的发病存在种族、地区差异,所以易感基因的定位应开展国际性各地区多个实验室合作研究。我国地大人稠、民族众多,由于历史、地理、传统等原因,保存着许多相对隔离群体,这是我们开发人类疾病相关基因研究一项不可多得的资源优势。充分利用我国丰富的家系资源,迅速开展多基因疾病全基因组扫描和分型的连锁分析、相关分析研究,对推动我国多基因疾病研究和提高我国人类遗传学科研水平具有极为重要的现实意义。总之,重视遗传统计学和生物信息学的发展,易感基因的定位才能有所突破。

  评论这张
 
阅读(65)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017