教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

标记基因(标记基因筛选原理)

  标记基因(标记基因筛选原理)
  Knight & Yang-Yu Liu. (2021). Challenges in benchmarking metagenomic profilers. Nature Methods, doi: https://doi.org/10.1038/s41592-021-01141-3
  随着越来越多的研究揭示出微生物组与人体健康的密切关系,宏基因组测序尤其是全宏基因组鸟枪法测序(whole metagenome sequencing,WMS)作为微生物组学最重要的研究手段之一被学术界、工业界广泛使用。为了解读高通量WMS数据,许多用于物种分类的生物信息学工具被开发出来,而这其中能够避免拼接等繁重计算任务的MetaPhlAn、Kraken、PathSeq等在大量宏基因组研究种被应用。但是目前在正确评价和使用这些生信工具以及解读相应的输出结果方面并没有引起足够的重视。比如,不同工具的输出结果之间具有很大的差异,研究人员往往将其归因于不同工具所用数据库的差别。但是我们发现,不同生信工具输出的"丰度类型"存在根本性的差别,是生信工具之间分析结果差异产生的本质原因之一。忽视和混淆这一丰度类型的差别,将改变生信工具性能评价的结果,并深刻影响对宏基因组测序数据的解读。另外,该问题也会严重阻碍荟萃研究,影响跨研究之间结果的可比性,并导致微生物组研究在临床医学转化上的困难。
  2021年5月13日,哈佛大学医学院刘洋彧团队与加州大学圣地亚哥分校Rob Knight团队在Nature Methods上发表了题为Challenges in Benchmarking Metagenomic Profilers的论文。该研究通过数据模拟,对宏基因组物种分类工具的输出结果进行了深度解读,创造性的提出了基于不同丰度类型(基于序列或基于物种分类相对丰度)的双重评价标准,为解决微生物组研究中如何选择宏基因组学物种分类工具的问题提供了重要依据,也对微生物组标准化研究提出了一系列建设性的意见。
  模式图:基于物种分类(标记基因,如MetaPhlAn2)和基于序列方法(如Kraken2)对物种分类定量产生巨大差异,主要受微生物基因组大小影响。
  在宏基因组测序分析中,序列(sequence)丰度和物种(taxonomic)丰度是两种截然不同的相对丰度类型。前者序列(sequence)丰度是计算属于某一物种经过测序后的DNA在整个菌群DNA中的百分比,而后者物种(taxonomic)丰度则代表某一物种的个体数量在菌群总个体数中的百分比。宏基因组学物种分类工具可根据其使用数据库的类型而分为三类:DNA-to-DNA,DNA-to-Protein,DNA-to-Marker。通过设计一个简单的模拟菌群,我们发现不同类型工具输出的相对丰度类型并不统一,比如DNA-to-DNA方法的(代表软件Kraken和Bracken)输出丰度类型为序列丰度,而DNA-to-Marker方法的(代表软件MetaPhlAn和mOTUs)输出的丰度类型为物种丰度(如下图1所示)。
  图1. 三种物种定量方法的比较。a. 模式图;b. 两种基因组的模拟群落;c. 不同软件定量的结果。
  通过模拟数据,研究人员将序列丰度和物种丰度分别作为金标准,对不同的宏基因组学物种分类工具进行评价,结果发现,在以序列丰度为金标准时,DNA-to-DNA方法的表现优于DNA-to-Marker方法,而在以物种丰度为金标准时,结果则相反。因此,物种分类软件的表现与测评时作为金标准的相对丰度类型有很大关系。
  混淆序列丰度与物种丰度会对宏基因组数据的解读产生四个方面的重要影响:
  1. 在解析物种构成方面:如果使用序列丰度作为解读标准,将高估大基因组物种并且低估小基因组物种在菌群中的真实数量。在复杂的菌群中,微生物基因组的大小存在很大的差别,只在细菌内部,理论上基因组的差别就可以达到100倍,而跨物种(如病毒和真菌)微生物基因组的差别更无法估量。理解序列丰度和物种丰度,对临床诊断病原菌过程中如何设置阈值十分关键。
  2. 在alpha多样性方面:与使用物种丰度相比较,如果使用序列丰度作为解读标准,将会整体上降低样本的alpha多样性(Shannon, Simpson and Pielou’s evenness index),但这一改变并不是严格一致的,部分样本的alpha多样性反而会升高。在当前宏基因组研究受样本量局限的情况下,这将会导致微生物样本alpha多样性的排序混乱,进而影响到alpha多样性在个体和组间比较的一致性和可重复性。
  3. 在beta多样性方面:通过设计模拟菌群,我们基于不同beta多样性分析方法(BC,rJSD,L1,L2,rAD)比较了以两种不同相对丰度为基础的样本间关系,通过检验我们发现序列丰度所描述的样本间关系与物种丰度所描述的样本间关系存在差别,相关性为0.51-0.94。因此,以不同生信工具输出结果为下游分析起点,可能得到不同的样本间或组间关系。
  4. 在排列分析(ordination analysis)方面:排列分析是宏基因组常用的分析手段,通过将N维的物种构成数据降低到两维或者三维来比较和展示个体或组间的差异。对于同一批样本,基于序列丰度和基于物种丰度的排列分析所产生的结果相差很大,无论是NDMS, PCoA, t-SNE或UMAP方法所产生的二维散点图,其经过一致性分析后,都表现出很大的差异性。也就是说,在基于不同生信工具所产生的下游分析中,有可能发生组间差异无法重复的情况。
  本文通过严谨的论证分析,量化了宏基因组学物种分类工具所产生的两种相对丰度类型的差别,对于混淆两种丰度所产生的影响进行了全面系统地研究。由于存在大量未知微生物基因组和多倍体信息缺失等原因,将物种丰度与序列丰度之间进行转换存在现实难度,往往无法达到预期目标,因此选择合适的宏基因组学物种分类工具十分关键。目前无论是DNA-to-DNA方法(以Kraken为代表,产生序列丰度)还是DNA-to-Marker方法(以MetaPhlAn为代表,产生物种丰度),都是宏基因组研究中的重要工具,并且已经被应用于大量研究中。虽然在方法一致的前提下,丰度的差别不会影响到同一个实验中组间的比较,但这不可避免地影响了诸多已发表的微生物组相关研究结论的可解读性,也将为回顾性的荟萃分析带来极大的挑战。因此我们呼吁微生物领域研究人员审慎解读宏基因组测序结果,严格区分相对丰度类型,重新审视过往基于序列丰度的研究结论。鉴于物种丰度更具生物学和生态学意义,我们也建议大家开发更多基于DNA-to-Marker方法的宏基因组学物种分类工具。
  本文第一作者是哈佛大学医学院的孙政博士和加州大学圣地亚哥分校的黄适博士。Rob Knight教授和刘洋彧教授为本文的通讯作者。
  图2. 对不同界的物种对序列和分类两种定量结果的相关分析
  图3. 使用Bracken、Kraken2、mOTUs2和MetaPhlAn2共4种软件对模拟群落不同估计方法定量结果的评测。
  图4. 基于序列和物种丰度计算Alpha多样性
  图5. 对两种定量方法结果在不同样本类型上的排序分析。

一群山里娃踢出一个全国足球季军梦想始终生生不息近日一群山里娃踢出一个全国足球季军登录了热搜,也是在网上引起了网友们的关注,那么很多小伙伴可能还不清楚具体的情况如何,小编也是在网上查阅了一些信息,那么接下来就分享给大家来了解下一踢足球作文(关于踢足球的作文)踢足球作文(关于踢足球的作文)关于踢足球的作文篇一踢足球上个星期日,我和小伙伴们痛痛快快地踢了一场球。球赛开始了,双方打得非常激烈。当球传到王严的脚下时,他猛地飞起一脚,球在空中划踢足球的好处(你知道踢球有什么好处吗?)踢足球的好处(你知道踢球有什么好处吗?)足球是世界上粉丝最多的运动之一。足球尤其受到男孩子的喜爱,无论是世界杯,联合会杯,还是英超,意甲,西甲等等比赛,到场人数观赛都是万人以上的。nba有多少支球队(打篮球的多还是踢足球的多)NBA有30支球队,各个球队所在城市简介如下一东部地区1波士顿凯尔特人马萨诸塞州波士顿市,被称为美国最古老的城市,是美国东北部新英格兰地区最大港口城市,马萨诸塞州首府。麻省理工学院跟我学打乒乓球(打乒乓球的十大技巧)跟我学打乒乓球(打乒乓球的十大技巧)点我观看视频版教学初学者不要过早上台打多球或者打单球,不然动作很容易变形。刚开始我们就做固定持拍的练习,比如把正手攻球分为三种状态。准备状态下然运球过人(篮球过人10大必学技巧)运球过人(篮球过人10大必学技巧)相信打篮球的都想象过这样的画面,在比赛关键时刻凭着超强的球技华丽运球过掉防守人然后打进决定比赛的进球,然而梦想很丰满,现实很骨感。我们在屏幕前看到运球过人(篮球过人10大必学技巧)运球过人(篮球过人10大必学技巧)相信打篮球的都想象过这样的画面,在比赛关键时刻凭着超强的球技华丽运球过掉防守人然后打进决定比赛的进球,然而梦想很丰满,现实很骨感。我们在屏幕前看到过人技巧(10个简单有效的过人技巧教学)过人技巧(10个简单有效的过人技巧教学)大家好,今天我们分享10个比赛中最常用的技巧,希望大家喜欢!今天的10个技巧都是比赛中常用的技巧,简单高效,是值得我们每天都练习的技巧,下面梅西过人技巧(梅西常用的10个过人技巧教学)梅西过人技巧(梅西常用的10个过人技巧教学)大家好,今天我们分享梅西常用的10个过人技巧教学,希望大家喜欢!梅西,他简直像神一般的存在,今天就给大家展示10个他常用的击败防守队员的今日四川生猪价格几(四川今日猪价)为了对抗猪价进而挺价惜售,今日四川省的生猪价格为00元斤,猪价随之止跌出现小幅反弹,今日北京天津河北省的猪价来到了今年以来的最低点,四川今日生猪价格今日价格最新报价行情走势来自于我七月十四是什么节日(农历七月十四是什么节日祭)今天是农历七月十四是中国传统的鬼节,又称盂兰节,中元节。由于七月是属坤,是八卦中至阴的一卦,而据过往经验,这个月又最常遇到怪事,所以渐渐演变成七月鬼门关大开的日子。中元节源自道教,
爬行垫什么牌子好(国内爬行垫质量较好的品牌)人们常说三翻六坐七八爬,就连专家也告诉我们,宝宝发育到8个月左右时,就可以开始学习爬行了,因为爬行能促进宝宝大脑发育以及身体的协调与平衡,如果越过学习爬行的阶段而直接学走路,那么宝哪个品牌家具好(口碑比较好的家具品牌)这两天是真被我们国家奥运健儿的精神感动到了,转念觉得文化的影响太重要了。想想中华上下五千年,随之流传下来的文化和传统,其实也被烙印在了一些家具用品上,值得好好欣赏的同时,也应该被记内衣哪个品牌好(男士保暖内衣哪个品牌好)今年,北方冷空气来猝不及防,很多地方一夜入秋,一夜入冬,谁都买过保暖内衣,打开购物平台,一搜各式各样的,看到眼花缭乱!以前我购买方式简单粗暴,谁的销量高谁的广告宣传好,我就选谁,这红茶哪个牌子好(红茶比较好的品牌)喝茶是一件简单快乐的事。茶叶有着各种不同的滋味,或苦涩,或甜爽,或醇厚,而喝茶的时候,许多茶友都有一个疑问,到底应不应该发出声音?有的朋友说,喝茶发出呲溜的声音,是对主人的认可赞许衬衫哪个牌子好(中国做衬衣比较好的品牌)在大数据的全球化形式下加速发展的服装行业不断的时尚潮流化,竞争也日益加剧,只有不断的创新,才能与时代并存,当代年轻人是追随大众和坚持自我的矛盾品,习惯于追求国外的一些品牌,从而忽视腰带哪个品牌的好(腰带比较好的品牌)相信大家都买过皮带吧!皮带对于男士来说,不仅仅是一件服饰单品,更多的是显示职场的成就感。无论你20几岁,还是30岁40岁50岁的男士。皮带可以说是大家最需要的一件产品。西裤需要它工内衣的品牌有哪些(中国十大知名品牌保暖内衣)冷!冷!冷!冻哭人的拉尼娜真的来啦!随着今年第三次寒潮预警的来袭,每天都能感受到温度跳水般的变化。之前小薇给大家推荐了抵御寒潮的最佳被芯,今天依旧给大家推荐冬季暖身好物保暖内衣(俗刷基膜后多久贴墙纸(基膜刷完5天才贴墙布)咱们自己家里装修,关于贴墙布是不是经常遇到很多问题?网络上充斥着各色的答案,看来看去怎么都减少不了心中的疑问,有可能搜不到答案,又或者是搜不到满意的答案,这些场景是不是特别熟悉呀!冒险岛什么职业好玩(冒险岛斗燃推荐职业排行)本篇文章为征稿计划的第七篇职业攻略文章(目前箭神神炮王船长剑豪战神米哈尔已完成),欢迎大家继续投递剩余没出品的职业攻略。本文将会从以下目录来给大家整体介绍圣晶使徒这个职业。一职业简冒险岛什么职业厉害(冒险岛79单扎最效率的职业)本篇文章为征稿计划的第三篇职业攻略文章(目前箭神神炮王已完成),欢迎大家继续投递剩余没出品的职业攻略。本篇攻略为冒险家海盗系第三篇船长的职业攻略,希望读者能多提建议,完善本系列攻略女圣职者哪个职业厉害(男法师哪个职业最厉害)DNF护石和符文如何选择?全职业CP搭配推荐,完美9保1无懈可击DNF流放者山脉减负,每周挑战1次,获取的材料50角色绑定50账号绑定,可以多角色养猪,而且,商店可以不限量兑换自选