数模论坛

 找回密码
 注-册-帐-号
搜索
热搜: 活动 交友 discuz
查看: 2987|回复: 6

[讨论]看看这个题目:DNA限制性图谱的绘制

[复制链接]
发表于 2004-9-13 04:58:13 | 显示全部楼层 |阅读模式
<>
A题:DNA限制性图谱的绘制</P>

<>绘制DNA限制性图谱是遗传生物学中的重要问题。由于DNA分子很长,目前的实验技术无法对其进行直接测量,所以生物学家们需要把DNA分子切开,一段一段的来测量。在切开的过程中,DNA片段在原先DNA分子上的排列顺序丢失了,如何找回这些片段的排列顺序是一个关键问题。</P>
<>为了构造一张限制性图谱,生物学家用不同的生化技术获得关于图谱的间接的信息,然后采用组合方法用这些数据重构图谱。一种方法是用限制性酶来消化DNA分子。这些酶在限制性位点把DNA链切开,每种酶对应的限制性位点不一样。对于每一种酶,每个DNA分子可能有多个限制性位点,此时可以按照需要来选择切开某几个位点(不一定连续)。DNA分子被切开后,得到的每个片段的长度就是重构这些片段的原始顺序的基本信息。在多种获取这种信息的实验方法中,有一种广泛采用的方法:部分消化(the partial digest, PDP)方法。</P>
<P>在PDP中,采用一种酶,通过实验得到任意两个限制性位点之间片段的长度。假设与使用的酶对应的限制性位点有n个, 通过大量实验,可得到n+2个点(n个位点加上两个端点)中任意两点之间的距离,共 个值。然后用这 个距离来重构n个限制性位点的位置(解不一定唯一,两个端点对应于最长的距离)。若 是线段上的点集 中所有点之间距离的集合,PDP就是给定 求 。下图给出了一个例子。</P>

<P>         2        3           4             5            2</P>

<P>        </P>
<P> A       a          b            c               d       B</P>
<P>图1.   A,B是DNA分子的两个端点。 a,b,c和d是限制性位点。  通过实验可以得到 ={2,3,4,5,2,5,9,14,16,7,12,14,9,11,7}. 再通过 来求 ,对应于上图的 ={0,2,5,9,14,16}是一种解。</P>

<P>上述方法要把DNA分子在任意的两个限制性位点处切开,这对于当前的实验技术来说有相当难度,而且,还要对实验数据进行处理,也很复杂。最近研究人员提出了一种新的方法,称为简化的部分消化方法(SPDP)。这个方法与PDP的不同就在于它避免了在任意两个位点切开DNA分子的难题和处理重复数据的困难。仍假设与使用的酶对应的限制性位点有n个。首先DNA分子被复制成n+1份,前n个复制品中的每一个在一个限制性位点处被切开,最后一个复制品在所有的限制性位点处被切开。这样我们分别得到2n个片段长度(称为第一组数据)和n+1个片段长度(称为第二组数据)。在没有误差的前提下,第一组数据中2n个长度可以分成n对,每对的和都等于DNA分子的总长度;第二组数据中n+1个长度的和也等于DNA分子的总长度。 SPDP问题是如何利用这两组数据重构出这n+1个片段在DNA分子上的排列,使得这个排列在n个位点切开后得到的2n个片段长度与实验得到的2n个长度相等。下图给出了一个例子。</P>
<P> (a)</P>
<P>2       6         1       4       3</P>


<P>(b)</P>
<P>           2                   14</P>


<P>                 8                  8</P>


<P>                 9                    7</P>


<P>                     13                    3</P>


<P>          </P>
<P>2     1         4           3              6</P>
<P>  </P>


<P>图2.  这个例子对应的位点有4个。(a) 就是我们希望重构的顺序。 (b)中的前4对为第一组数据,它通过切开一个位点得到,每对长度的和都是16,剩下的为第二组数据,含5个片段长度,它通过切开所有位点得到,它们的长度总和也是16, 但实验结果只告知每段的长度,不知道它们在DNA分子上的排列顺序。</P>

<P>现对上述SPDP问题,建立数学模型,并研究以下问题:</P>
<P>(1)     设计求解该问题的算法, 并评估该算法的效率和效果。对下述2个实例给出答案:</P>
<P>实例1: 第一组数据:2,14,8,8,9,7,13,3 </P>
<P>第二组数据:2,1,4,3,6</P>

<P>实例2:  第一组数据:1,14,12,3,7,8,9,6,11,4,12,3,13,2,5,10</P>
<P>第二组数据:1,1,2,1,2,2,1,2,3</P>

<P>(2)    讨论在实验中测量片段长度时的误差,将在多大程度上影响算法的效果,当误差到多大程度时,限制性图谱的重构将无法进行。</P>

<P> 线图我没有办法画出来,抱歉,不过见过这个题或对它有兴趣的可以好好讨论,我希望看到你们的想法.
</P>
 楼主| 发表于 2004-9-13 07:48:29 | 显示全部楼层
谁能给我一点思路 谢谢!!1[em06]
 楼主| 发表于 2004-9-13 20:25:43 | 显示全部楼层

有关序列组合的难题i

<>这是2004年东华大学的刚出不久的一道模拟题</P>
<>大家动动脑,估计还没有现成的算法可查</P>
发表于 2004-9-14 14:21:01 | 显示全部楼层
<>[em08]挺深奥的吗?</P>
发表于 2004-9-14 22:50:58 | 显示全部楼层
你不妨找一本关于分子信息学方面的书,有几个比较适用而且已经开始应用的做法。
 楼主| 发表于 2004-9-15 21:09:11 | 显示全部楼层
<>我们用C语言编了这个题目的程序,但是不实用</P><>但是我没有用MATLAB编,谁会呀?告诉我一下</P>
发表于 2004-9-16 05:38:32 | 显示全部楼层
<>这是浙江大学校内赛题啊~</P><>有原版英文论文的~全新的矩阵算法</P>
您需要登录后才可以回帖 登录 | 注-册-帐-号

本版积分规则

小黑屋|手机版|Archiver|数学建模网 ( 湘ICP备11011602号 )

GMT+8, 2024-11-28 20:41 , Processed in 0.056409 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表