教育房产时事环球科技商业
投稿投诉
商业财经
热点动态
科技数码
软件应用
国际环球
晨报科学
新闻时事
信息智能
汽车房产
办公手机
教育体育
生活生物

标记基因(标记基因筛选原理)

  标记基因(标记基因筛选原理)
  Knight & Yang-Yu Liu. (2021). Challenges in benchmarking metagenomic profilers. Nature Methods, doi: https://doi.org/10.1038/s41592-021-01141-3
  随着越来越多的研究揭示出微生物组与人体健康的密切关系,宏基因组测序尤其是全宏基因组鸟枪法测序(whole metagenome sequencing,WMS)作为微生物组学最重要的研究手段之一被学术界、工业界广泛使用。为了解读高通量WMS数据,许多用于物种分类的生物信息学工具被开发出来,而这其中能够避免拼接等繁重计算任务的MetaPhlAn、Kraken、PathSeq等在大量宏基因组研究种被应用。但是目前在正确评价和使用这些生信工具以及解读相应的输出结果方面并没有引起足够的重视。比如,不同工具的输出结果之间具有很大的差异,研究人员往往将其归因于不同工具所用数据库的差别。但是我们发现,不同生信工具输出的"丰度类型"存在根本性的差别,是生信工具之间分析结果差异产生的本质原因之一。忽视和混淆这一丰度类型的差别,将改变生信工具性能评价的结果,并深刻影响对宏基因组测序数据的解读。另外,该问题也会严重阻碍荟萃研究,影响跨研究之间结果的可比性,并导致微生物组研究在临床医学转化上的困难。
  2021年5月13日,哈佛大学医学院刘洋彧团队与加州大学圣地亚哥分校Rob Knight团队在Nature Methods上发表了题为Challenges in Benchmarking Metagenomic Profilers的论文。该研究通过数据模拟,对宏基因组物种分类工具的输出结果进行了深度解读,创造性的提出了基于不同丰度类型(基于序列或基于物种分类相对丰度)的双重评价标准,为解决微生物组研究中如何选择宏基因组学物种分类工具的问题提供了重要依据,也对微生物组标准化研究提出了一系列建设性的意见。
  模式图:基于物种分类(标记基因,如MetaPhlAn2)和基于序列方法(如Kraken2)对物种分类定量产生巨大差异,主要受微生物基因组大小影响。
  在宏基因组测序分析中,序列(sequence)丰度和物种(taxonomic)丰度是两种截然不同的相对丰度类型。前者序列(sequence)丰度是计算属于某一物种经过测序后的DNA在整个菌群DNA中的百分比,而后者物种(taxonomic)丰度则代表某一物种的个体数量在菌群总个体数中的百分比。宏基因组学物种分类工具可根据其使用数据库的类型而分为三类:DNA-to-DNA,DNA-to-Protein,DNA-to-Marker。通过设计一个简单的模拟菌群,我们发现不同类型工具输出的相对丰度类型并不统一,比如DNA-to-DNA方法的(代表软件Kraken和Bracken)输出丰度类型为序列丰度,而DNA-to-Marker方法的(代表软件MetaPhlAn和mOTUs)输出的丰度类型为物种丰度(如下图1所示)。
  图1. 三种物种定量方法的比较。a. 模式图;b. 两种基因组的模拟群落;c. 不同软件定量的结果。
  通过模拟数据,研究人员将序列丰度和物种丰度分别作为金标准,对不同的宏基因组学物种分类工具进行评价,结果发现,在以序列丰度为金标准时,DNA-to-DNA方法的表现优于DNA-to-Marker方法,而在以物种丰度为金标准时,结果则相反。因此,物种分类软件的表现与测评时作为金标准的相对丰度类型有很大关系。
  混淆序列丰度与物种丰度会对宏基因组数据的解读产生四个方面的重要影响:
  1. 在解析物种构成方面:如果使用序列丰度作为解读标准,将高估大基因组物种并且低估小基因组物种在菌群中的真实数量。在复杂的菌群中,微生物基因组的大小存在很大的差别,只在细菌内部,理论上基因组的差别就可以达到100倍,而跨物种(如病毒和真菌)微生物基因组的差别更无法估量。理解序列丰度和物种丰度,对临床诊断病原菌过程中如何设置阈值十分关键。
  2. 在alpha多样性方面:与使用物种丰度相比较,如果使用序列丰度作为解读标准,将会整体上降低样本的alpha多样性(Shannon, Simpson and Pielou’s evenness index),但这一改变并不是严格一致的,部分样本的alpha多样性反而会升高。在当前宏基因组研究受样本量局限的情况下,这将会导致微生物样本alpha多样性的排序混乱,进而影响到alpha多样性在个体和组间比较的一致性和可重复性。
  3. 在beta多样性方面:通过设计模拟菌群,我们基于不同beta多样性分析方法(BC,rJSD,L1,L2,rAD)比较了以两种不同相对丰度为基础的样本间关系,通过检验我们发现序列丰度所描述的样本间关系与物种丰度所描述的样本间关系存在差别,相关性为0.51-0.94。因此,以不同生信工具输出结果为下游分析起点,可能得到不同的样本间或组间关系。
  4. 在排列分析(ordination analysis)方面:排列分析是宏基因组常用的分析手段,通过将N维的物种构成数据降低到两维或者三维来比较和展示个体或组间的差异。对于同一批样本,基于序列丰度和基于物种丰度的排列分析所产生的结果相差很大,无论是NDMS, PCoA, t-SNE或UMAP方法所产生的二维散点图,其经过一致性分析后,都表现出很大的差异性。也就是说,在基于不同生信工具所产生的下游分析中,有可能发生组间差异无法重复的情况。
  本文通过严谨的论证分析,量化了宏基因组学物种分类工具所产生的两种相对丰度类型的差别,对于混淆两种丰度所产生的影响进行了全面系统地研究。由于存在大量未知微生物基因组和多倍体信息缺失等原因,将物种丰度与序列丰度之间进行转换存在现实难度,往往无法达到预期目标,因此选择合适的宏基因组学物种分类工具十分关键。目前无论是DNA-to-DNA方法(以Kraken为代表,产生序列丰度)还是DNA-to-Marker方法(以MetaPhlAn为代表,产生物种丰度),都是宏基因组研究中的重要工具,并且已经被应用于大量研究中。虽然在方法一致的前提下,丰度的差别不会影响到同一个实验中组间的比较,但这不可避免地影响了诸多已发表的微生物组相关研究结论的可解读性,也将为回顾性的荟萃分析带来极大的挑战。因此我们呼吁微生物领域研究人员审慎解读宏基因组测序结果,严格区分相对丰度类型,重新审视过往基于序列丰度的研究结论。鉴于物种丰度更具生物学和生态学意义,我们也建议大家开发更多基于DNA-to-Marker方法的宏基因组学物种分类工具。
  本文第一作者是哈佛大学医学院的孙政博士和加州大学圣地亚哥分校的黄适博士。Rob Knight教授和刘洋彧教授为本文的通讯作者。
  图2. 对不同界的物种对序列和分类两种定量结果的相关分析
  图3. 使用Bracken、Kraken2、mOTUs2和MetaPhlAn2共4种软件对模拟群落不同估计方法定量结果的评测。
  图4. 基于序列和物种丰度计算Alpha多样性
  图5. 对两种定量方法结果在不同样本类型上的排序分析。

范冰冰从国际范到逃税犯,栽在被小鬼反噬的跟头上情降和合术师傅微信18328654747爱情锁心降回心转意法事桃花降财运降拆婚降拆散姻缘符拆散情侣降拆散术拆散小三降拆散法事拆婚法事微信18328654747诅咒小人惩罚诅咒降天师uc来电通(来电通app)uc来电通(来电通app)在合适的时机,漂亮的收拾市场来电通是塞班时代的通讯辅助必备软件,到了安卓时代,来电通是第一批尝试互联网免费电话的app。最高峰的时候做到了两千多万的日活。今日广聚能源价格(深圳市广聚能源股份有限公司)这些公司也要卖房。盘活公司存量资产!3月24日晚间。净流入资金。而正是在国内外油价一片大涨的背景下。除广聚能源外。却于3月11日交出了。股票价格市值交易业绩财务数据Financia三脚架什么牌子好(tripod什么牌子三脚架)意大利坎普CAMP有限空间作业三脚架使用说明一产地意大利二三角架型号TRIPODEVO编号1883认证CEEN795B三使用功能及环境铝合金三角架通过欧洲EN795认证,金属框架,微信频率过快怎么解决(微信能用的最低版本)手机总是卡顿,用起来不顺畅?用了这么久,可能还有许多小伙伴不知道里面有这么一个功能。用户可以通过调节性能卡顿阈值,让性能更加的合适,一般用于出现卡顿运行缓慢有时没有反应等这类的情况腾讯回应美商务部决定近日有关于腾讯回应美商务部决定的问题受到了很多网友们的关注,大多数网友都想要知道腾讯回应美商务部决定的具体情况,那么关于到腾讯回应美商务部决定的相关信息,小编也是在网上进行了一系列MINICARE。爱旅行健诊活动爱玩好动的MINI玩家最懂把握每一刻玩乐时刻,开着MINI爱车出发前,提醒您先与MINI总代理汎德全台经销商服务厂预约MINICARE爱旅行健诊活动回厂时间,在9月17日至29日提孕妇可以用取暖器(孕妇使用电暖器的建议)孕妇可以用取暖器(孕妇使用电暖器的建议)冬天来了,家家户户都开始使用取暖器,家里有孕妇的人们就很关注电暖器对孕妇有辐射吗这个问题,下面我们来了解看看。家里有孕妇的人要注意冬天的取暖油汀取暖器的优缺点(油汀取暖器品牌介绍)油汀取暖器的优缺点(油汀取暖器品牌介绍)冬季是一个很冷的季节,所以我们都需要购买取暖的东西,现代社会很多朋友很可能对于油汀取暖器不了解吧,对于油汀取暖器的优缺点你了解多少呢?对于油碳晶墙暖为什么不流行(碳晶壁画取暖器优缺点)今年冬天的温度持续走低,市面上的采暖设备也越来越多,但是随着科技的不断发展和人类需求的不断变化,很多新型采暖设备开始不断闯入人们的视线其中碳晶墙暖就是其中的一种,下面天津装修网就来油汀哪个好(先锋油汀和美的油汀哪个好)说到冬天,想必大家都会想到一个词,那就是冷,寒潮一来,瑟瑟发抖,出门就更不用说了,每次出门就跟打仗似的,包裹得严严实实的,可还是会被寒冷的冷风劝退。所以冬天一到许多小伙伴就特别喜欢
二战时间(二战历史讲解)二战时间(二战历史讲解)1。中国战场1931年9月18日1945年9月2日主要对阵双方中国军队和日本军队主要战役淞沪会战武汉会战结果日本投降2。苏德战场1941年6月22日1945今日废合金钢回收价格,今日废钢价格回收最新价格提供废不锈钢价格废不锈钢价格行情最新废不锈钢价格走势今日废不锈钢价格表废不锈钢多少钱一斤废不锈钢回收价格等最新最全面的信息,钢材企业提供最新的回收废钢不锈钢汇,废钢厂家收货相对谨慎中国气象局连续发三个预警近日有关于中国气象局连续发三个预警的问题受到了很多网友们的关注,大多数网友都想要知道中国气象局连续发三个预警的具体情况,那么关于到中国气象局连续发三个预警的相关信息,小编也是在网上今天北京已发布6个预警近日有关于今天北京已发布6个预警的问题受到了很多网友们的关注,大多数网友都想要知道今天北京已发布6个预警的具体情况,那么关于到今天北京已发布6个预警的相关信息,小编也是在网上进行了罗晋帮唐嫣孙坚等人聚会订火锅大家都发现最近唐嫣开始参与这种活动了,据悉在不久前唐嫣和罗晋有了新宝宝,如今已经又开始投身于工作中了,据最新消息报道,罗晋帮唐嫣孙坚聚会订火锅,从视频中可以看出来唐嫣和孙坚的关系也某某门(宜家门)某某门(宜家门)编辑同志最近美国总统特朗普通话门持续发酵,引发关注。请问为何丑闻多被称为某某门?天津读者李玉萍在1972年前,虽然美国发生过很多和总统相关的政治丑闻,但这些丑闻并没超级终端设置(win10的超级终端在哪)超级终端设置(win10的超级终端在哪)LAN(VirtualLocalAreaNetwork)的中文名为虚拟局域网,注意和39VPN39(虚拟专用网)进行区分。VLAN是一种将局情癫大圣经典台词(每一段故事的背后都令人心酸)情癫大圣经典台词(每一段故事的背后都令人心酸)网络电影真三国无双的热映,在网友对人物造型的一番吐槽之后,让富江看到了香港电影的没落。韩庚饰演的汉瘦挺猴,最值得吐槽。先不说这瘦骨嶙峋大薏米和小薏米的区别(男人为什么不能吃薏米)薏米自述薏米又叫薏苡仁苡仁六谷子,为禾本科植物薏苡的种仁。其性凉,味甘淡,入脾肺肾经,具有利水健脾除痹清热排脓的功效。利水消肿祛除湿气健脾益胃Q薏米可以单一煮吗?还可以和什么搭配?怎么让彩印公章像原件(公章彩印算原件吗)PS小白课堂,专注PS零基础教学!想学习平面设计的同学别忘了哦!本期小K老师为大家带来是公章制作1新建画布,用椭圆工具画出正圆,填充为空描边颜色为f7585c。2使用多边形工具画出为什么说石破天是修真(还有谁能打败石破天)武侠的故事与魔幻仙侠故事有明确边界,但即便是金庸,也有把控不那么严谨的时候,比如新修版天龙八部中,他就吐槽了自己笔下的某些设定已超出武侠范畴。原著道六脉神剑火焰刀少林派指法等将内劲