科创新动力|这群光谷青年编制数千物种“基因组字典”
2022-10-09 20:48:00 来源: 武汉软件新城


  “上世纪,人类基因组计划集美、英、法、中、德、日6国科学家之力,耗时10余年才得以完成。如今,基因测序技术已经十分成熟,只需要几天时间。”


  在光谷,希望组公司是国内首家提供三代测序服务的公司,已为数千个物种绘制基因组图谱,成果用于科学研究、分子育种、疾病诊疗等各个领域。
  “我们的下游客户想知道哪一段基因起到何种作用,而我们把整个基因组图谱都测定出来了。相当于他们只想认识一两个字句,而我们编制了整本字典。”武汉希望组总经理梁帆介绍。
  这家企业由一群怀揣梦想的年轻人创立,创始人汪德鹏毕业于北京大学生命科学学院,2011年以4万元起家,在武汉与几位华科、华农毕业生一起创业。


  如今,企业已发展至260多人,一半以上是技术人员,并将事业版图扩展至北京,先后获得了经纬中国、赛富投资、远毅资本、昌发展、京铭资本等国内知名投资机构投资。
  01
  光谷,花山,武汉软件新城,希望组公司的办公室占了三层楼。除了大部分生物医药公司都拥有的装满各类试管、试剂的实验室外,这家企业还拥有一个IT公司才有的巨大机房。


  “这个房间里有50多台服务器,每一台都有32核CPU、256G内存。相比于普通办公用电脑,性能不是一般的强大。就这样,我们的算力还是远远不够,需要通过专线,把数据传到华为云上进行计算。有一次,我们组装一个基因组,把一台内存30T的服务器给跑爆了。”
  首席生信技术官胡江介绍,生物基因组的信息量是十分庞大的。人类基因组单倍DNA数据量约为3.1Gb,23对染色体双螺旋DNA就是6.2Gb。到目前为止,动物界已知最大的基因组是肺鱼类,其中相对较小的非洲肺鱼,就有40多Gb,是人类基因组大小的15倍左右,为了解决这样的世界级难题,企业专门开发了组装软件NextDenovo,成果发表在国际顶级科学杂志Cell的封面。
  基因测序行业是一个典型的BT(生物技术)+IT(信息技术)产业。在此过程中,测序仪对一个个基因片段进行测定,一台测序仪两天就可以产生100多T的数据。完成后,研究人员再使用算法和高性能计算机,将片段组装成完整的基因图谱。


  相比第二代测序技术,第三代技术可读取的片段更长,可大幅减少后续基因组拼接和注释的工作难度,且经过修正的精度可达到99.9%以上。“理论上所有使用二代测序技术测序过的基因组,都可以使用第三代技术再来一遍,结果将更加完整、准确。”
  希望组团队在超高分子量样品制备、长读长序列分析算法开发等方面,具有独特技术优势。胡江开发的NextDenovo等系列基因组组装软件,国内外很多测序公司及科研机构都在使用。


  “在我们刚刚创业的时候,第三代测序还未兴起,存在测序成本高、单次读序错误率高等问题,备受挑战和质疑。”但希望组团队毅然坚持探索,如今已成长为世界领先的三代测序基因组公司。
  02
  在希望组公司展厅内有一面墙,上面挂满了使用该公司测序成果产生的科研文章,发表在《Nature》《Science》《Cell》等众多国际顶级期刊上,有的成果甚至已经写入教科书。


  比如,苹果皮为什么能进化出诱人的红色?在希望组团队在给苹果基因测序时,就与合作者发现了一个Gypsy-like反转座子充当增强子控制着苹果着色,基于这个结果,育种科学家在苹果种子阶段,就能精准的进行果色预先选择,节省大量育种时间。
  短串联重复序列(STR)占人类基因组序列的7%,目前人类已知有50多种神经和神经肌肉疾病是由STR扩增引起的,包括亨廷顿病、强直性肌营养不良、运动神经元病等。其中,有约5种疾病的致病变异是由希望组与合作单位联合发现,占全球该领域10%,公司甚至立下目标,要在接下来几年之内,发现全球一半的“重复扩张症“新基因。


  目前,三代测序全基因组检测的成本已经可以控制在万元以内,1周内就能出报告,很快就能成为遗传病检测的重要手段。
  最近,该公司正在测定一些水稻的泛基因组,共测定了两三百种水稻,希望定位一些抗旱、抗淹方面的基因。未来,还可以扩展到大麦、燕麦、西瓜等物种上。
  “我们不育种,也不治病,但我们为他们提供完整的‘百科全书’。对我们来说,每一个项目,都是探索全新的未知领域。”
  一群朴实热情的年轻人,在光谷做一件很酷的事。梁帆介绍,希望组正在筹备上市工作,团队将继续坚持“科学的边界,技术的极限,伦理的底线,人文的关怀”,用基因组技术推动社会发展进步。
  R E C O M M E N D
  推 荐 阅 读




  — END —
  转载自:中国光谷 运营:同享传媒


  
  • 为你推荐
  • 公益播报
  • 公益汇
  • 进社区

热点推荐

即时新闻

武汉