楼上一点都不通俗
举个例子
序列假如是ATCGAAAATCG
你一次shotgun得到ATCG ATCG
又一次shotgun得到CGAA AATC
又一次shotgun得到GAAAAT
单次的shotgun不会覆盖到所有的碱基序列,也没法判断片段的前后顺序.
如果再来一次shotgun,就可能拿到之前没拿到的片段,片段也可能会落在前一次片段之间的衔接部分,反复多次shotgun以后,我们就能把这些零碎的片段拼接成完整的序列.
就像我给你的例子一样,你完全可以通过shotgun的结果来推断完整的序列.
对于基因组这样大量的数据,显然通过你人工拼接是不现实的,于是借助计算机.