< align=center><B>A题:DNA限制性图谱的绘制<p></p></B></P>
< align=center><B><p> </p></B></P>
< >绘制<FONT face="Times New Roman">DNA</FONT>限制性图谱(<FONT face="Times New Roman">restriction mapping</FONT>)是遗传生物学中的重要问题。由于<FONT face="Times New Roman">DNA</FONT>分子很长,目前的实验技术无法对其进行直接测量,所以生物学家们需要把<FONT face="Times New Roman">DNA</FONT>分子切开,一段一段的来测量。在切开的过程中,<FONT face="Times New Roman">DNA</FONT>片段在原先<FONT face="Times New Roman">DNA</FONT>分子上的排列顺序丢失了,如何找回这些片段的排列顺序是一个关键问题。<p></p></P>
<P >为了构造一张限制性图谱,生物学家用不同的生化技术获得关于图谱的间接的信息,然后采用组合方法用这些数据重构图谱。一种方法是用限制性酶(<FONT face="Times New Roman">restriction enzyme</FONT>)来消化<FONT face="Times New Roman">DNA</FONT>分子。这些酶在限制性位点<FONT face="Times New Roman">(restriction sites)</FONT>把<FONT face="Times New Roman">DNA</FONT>链切开,每种酶对应的限制性位点不一样。对于每一种酶,每个<FONT face="Times New Roman">DNA</FONT>分子可能有多个限制性位点,此时可以按照需要来选择切开某几个位点(不一定连续)。<FONT face="Times New Roman">DNA</FONT>分子被切开后,得到的每个片段的长度就是重构这些片段的原始顺序的基本信息。在多种获取这种信息的实验方法中,有一种广泛采用的方法:部分消化(<FONT face="Times New Roman">the partial digest, PDP</FONT>)方法。<p></p></P>
<P >在<FONT face="Times New Roman">PDP</FONT>中,采用一种酶,通过实验得到任意两个限制性位点之间片段的长度。假设与使用的酶对应的限制性位点有<I><FONT face="Times New Roman">n</FONT></I>个,<FONT face="Times New Roman"> </FONT>通过大量实验,可得到<FONT face="Times New Roman"><I>n</I>+2</FONT>个点(<I><FONT face="Times New Roman">n</FONT></I>个位点加上两个端点)中任意两点之间的距离,共<v:shapetype><FONT face="Times New Roman"> <v:stroke joinstyle="miter"></v:stroke><v:formulas><v:f eqn="if lineDrawn pixelLineWidth 0"></v:f><v:f eqn="sum @0 1 0"></v:f><v:f eqn="sum 0 0 @1"></v:f><v:f eqn="prod @2 1 2"></v:f><v:f eqn="prod @3 21600 pixelWidth"></v:f><v:f eqn="prod @3 21600 pixelHeight"></v:f><v:f eqn="sum @0 0 1"></v:f><v:f eqn="prod @6 1 2"></v:f><v:f eqn="prod @7 21600 pixelWidth"></v:f><v:f eqn="sum @8 21600 0"></v:f><v:f eqn="prod @7 21600 pixelHeight"></v:f><v:f eqn="sum @10 21600 0"></v:f></v:formulas><v:path gradientshapeok="t" connecttype="rect" extrusionok="f"></v:path><lock v:ext="edit" aspectratio="t"></lock></FONT></v:shapetype><v:shape><v:imagedata></v:imagedata></v:shape>个值。然后用这<v:shape><FONT face="Times New Roman"> <v:imagedata></v:imagedata></FONT></v:shape>个距离来重构<I><FONT face="Times New Roman">n</FONT></I>个限制性位点的位置<FONT face="Times New Roman">(</FONT>解不一定唯一,两个端点对应于最长的距离<FONT face="Times New Roman">)</FONT>。若<v:shape><FONT face="Times New Roman"> <v:imagedata></v:imagedata></FONT></v:shape>是线段上的点集<v:shape><FONT face="Times New Roman"> <v:imagedata></v:imagedata></FONT></v:shape>中所有点之间距离的集合,<FONT face="Times New Roman">PDP</FONT>就是给定<v:shape><FONT face="Times New Roman"> <v:imagedata></v:imagedata></FONT></v:shape>求<v:shape><FONT face="Times New Roman"> <v:imagedata></v:imagedata></FONT></v:shape>。下图给出了一个例子。<p></p></P>
<P ><p><FONT face="Times New Roman"> </FONT></p></P>
<P ><FONT face="Times New Roman"> 2 3 4 5 2<p></p></FONT></P>
<P ><p><FONT face="Times New Roman"> </FONT></p></P>
<P ><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><v:line><FONT face="Times New Roman"></FONT></v:line><FONT face="Times New Roman"> <p></p></FONT></P>
<P ><FONT face="Times New Roman"> A a b c d B<p></p></FONT></P>
<P ><FONT size=3>图<FONT face="Times New Roman">1. A,B</FONT>是<FONT face="Times New Roman">DNA</FONT>分子的两个端点。<FONT face="Times New Roman"> a</FONT>,<FONT face="Times New Roman">b</FONT>,<FONT face="Times New Roman">c</FONT>和<FONT face="Times New Roman">d</FONT>是限制性位点。<FONT face="Times New Roman"> </FONT>通过实验可以得到</FONT><FONT face="Times New Roman" size=3> </FONT><v:shape><v:imagedata><FONT face="Times New Roman" size=3></FONT></v:imagedata></v:shape><FONT face="Times New Roman" size=3>={2,3,4,5,2,5,9,14,16,7,12,14,9,11,7}. </FONT><FONT size=3>再通过</FONT><v:shape><FONT face="Times New Roman"><FONT size=3> <v:imagedata></v:imagedata></FONT></FONT></v:shape><FONT size=3>来求</FONT><v:shape><FONT face="Times New Roman"><FONT size=3> <v:imagedata></v:imagedata></FONT></FONT></v:shape><FONT size=3>,对应于上图的</FONT><v:shape><FONT face="Times New Roman"><FONT size=3> <v:imagedata></v:imagedata></FONT></FONT></v:shape><FONT face="Times New Roman" size=3>={0,2,5,9,14,16}</FONT><FONT size=3>是一种解。<p></p></FONT></P>
<P ><p><FONT face="Times New Roman" size=3> </FONT></p></P>
<P >上述方法要把<FONT face="Times New Roman">DNA</FONT>分子在任意的两个限制性位点处切开,这对于当前的实验技术来说有相当难度,而且,还要对实验数据进行处理,也很复杂。最近研究人员提出了一种新的方法,称为简化的部分消化方法(<FONT face="Times New Roman">SPDP</FONT>)。这个方法与<FONT face="Times New Roman">PDP</FONT>的不同就在于它避免了在任意两个位点切开<FONT face="Times New Roman">DNA</FONT>分子的难题和处理重复数据的困难。仍假设与使用的酶对应的限制性位点有<I><FONT face="Times New Roman">n</FONT></I>个。首先<FONT face="Times New Roman">DNA</FONT>分子被复制成<FONT face="Times New Roman"><I>n</I>+1</FONT>份,前<I><FONT face="Times New Roman">n</FONT></I>个复制品中的每一个在一个限制性位点处被切开,最后一个复制品在所有的限制性位点处被切开。这样我们分别得到<FONT face="Times New Roman">2<I>n</I></FONT>个片段长度(称为第一组数据)和<FONT face="Times New Roman"><I>n</I>+1</FONT>个片段长度(称为第二组数据)。在没有误差的前提下,第一组数据中<FONT face="Times New Roman">2<I>n</I></FONT>个长度可以分成<I><FONT face="Times New Roman">n</FONT></I>对,每对的和都等于<FONT face="Times New Roman">DNA</FONT>分子的总长度;第二组数据中<FONT face="Times New Roman"><I>n</I>+1</FONT>个长度的和也等于<FONT face="Times New Roman">DNA</FONT>分子的总长度。<FONT face="Times New Roman"> SPDP</FONT>问题是如何利用这两组数据重构出这<FONT face="Times New Roman"><I>n</I>+1</FONT>个片段在<FONT face="Times New Roman">DNA</FONT>分子上的排列,使得这个排列在<I><FONT face="Times New Roman">n</FONT></I>个位点切开后得到的<FONT face="Times New Roman">2<I>n</I></FONT>个片段长度与实验得到的<FONT face="Times New Roman">2<I>n</I></FONT>个长度相等。下图给出了一个例子。<p></p></P>
<P ><p><FONT face="Times New Roman"> </FONT></p></P>