微生物广泛存在于自然界中,与人类的生产和生活息息相关。微生物生物多样性丰富,网页组具有相对较小、重复序列较高、易于突变等特点,因此很必要对微生物进行全网页组测序,而且同动植物相比较在时间和成本上也容易实现。目前,全网页组测序成为微生物遗传进化、疾病预防控制、生物工程技术等方面重要的研究和开发手段。
二、生物信息分析
1. 原始数据整理、过滤及质量评估
2. Survey 分析 (网页组大小估计)
3. 网页组拼装与分析:
♦序列拼装
♦ 拼装统计(N20、N50、N90、总拼接长度、最长拼接长度、GC含量、总序列数量、>1 kb序列数量、N数量、N比例、测序深度等)
♦测序深度分布图
♦网页组圈图绘制(仅适用于完成图)
4. 功能元件分析
5. 蛋白编码网页功能注释:
♦序列比对 (数据库:refseq)
♦GO注释 (数据库:refseq)
♦COG注释 (数据库:eggNOG)
♦KEGG注释(KAAS,BBH)
6 比较网页组学分析:
♦网页家族分析(共有网页,特有网页分析)
♦共线性
♦基于 16s rDNA或 18s rDNA的进化分析
三、结果展示
2、真菌:Miseq DNA PE 文库浓度≥20 ng/ μl,总量≥6 μg(荧光定量);Miseq DNA MP 文库浓度≥40 ng/ μl,总量≥12 μg(荧光定量);454 DNA库浓度≥20 ng/ μl,总量≥3 μg(荧光定量)。提供组织样品应>1 g,尽量提供较多量,不同的物种DNA提取产量有差异。
3、样品保存期间切忌反复冻融。
4、送样管务必标清样品编号,管口使用Parafilm 膜密封。
5、提供DNA电泳检测照片,用自封袋密封后随样品一起送样。
五、华津优势
1.平台优势:拥有ABI 3730 XL、Roche 454 FLX+、Illumina Miseq和Illumina HiSeq2000(manbetx手机)高通量测序 平台,多种平台联合应用,优势互补,满足客户不同需求。
2.技术团队:拥有经验丰富的技术人员,专业的生物信息团队和大型计算机服务系统,可提供个性化生物信息分析服务。
3.项目周期:个人型测序平台,无需长时间凑样上机,极大缩短项目周期。
4.免费服务:免费方案设计、免费标准分析、免费论文润色。
背景:海豚链球菌是革兰氏阳性致病菌,不仅能够感染淡水、咸水鱼类,而且能够感染人类,被认为是对水产养殖业发展影响最大的致病菌之一。
结果:海豚链球菌SF1的全网页组大小为2.15 Mb,GC%含量为36.7%,共注释到2125个蛋白质编码网页,预测到45 tRNA网页和12 rRNA网页。CRISPR/Cas系统是目前发现存在于大多数细菌与所有的古菌中的一种后天免疫系统,以消灭外来的质体或者噬菌体,并在自身网页组中留下外来网页片段作为“记忆”,本研究在SF1中发现一个CRISPR位点和4个Cas网页。通过进一步的蛋白质组学实验检测到SF1中21个被宿主血清诱导表达的分泌蛋白,为了进一步验证这些蛋白的功能,经过免疫效果实验显示其中的两个候选蛋白可以作为制备防治该种鱼病的疫苗使用。本研究结果为其他类型的海豚链球菌的研究提供了一个分子生物学理论基础,尤其是在对海豚链球菌的发病机制和对水产品疾病控制方面具有重要意义。
原文索引:[Zhang B C, et al. Streptococcus iniae SF1: complete genome sequence, proteomic profile, and immunoprotective antigens[J]. PloS one, 2014, 9(3): e91324.]
背景:虹彩病毒科是双链DNA病毒,包括5个病毒属,其中体育肿大病毒属病毒可导致许多种水产养殖鱼类致病,因此对水产养殖业造成很大的威胁。
结果:条石鲷虹彩病毒RBIV-C1的全网页组大小为112.3 kb,GC%含量为55%。同时发现RBIV-C1中有4584个简单重复序列,其中89.8%的简单重复序列分布在编码区,并预测到119个开放阅读框。另外与OSGIV和RBIV进行序列比对发现,它们的序列相似度达到99%,推测可能是同一病毒菌株的变异,在RBIV-C1网页组中发现了11个插入突变,13个缺失,103个SNP位点,这些变异位点可成为RBIV-C1鉴定的依据。通过进一步的qPCR全网页转录模式分析,显示119个开放阅读中有118个在活体感染时表达,并根据它们的表达模式,将其分为3个系统聚类,这一结果为体育肿大病毒属的网页性能和网页表达特性的研究提供了新的参考。
原文索引:[ Zhang B C, et al. Complete genome sequence and transcription profiles of the rock bream iridovirus RBIV-C1. Dis Aquat Org, 2013, 104: 203-214.]
A:微生物网页组测序按测序精度大致可以分为框架图、精细图和完成图三类。框架图要求网页组覆盖度大于95%,网页区覆盖度达到98%以上,单碱基错误率低于十万分之一;精细图要求网页组覆盖度大于98%,网页区覆盖度达到99%以上,单碱基错误率低于十万分之一,gap数不超过100个;完成图要求完整网页组序列,单碱基错误率低于十万分之一,gap数不超过5个。
2.Q:什么是测序深度和覆盖度?
A:测序深度是指测序得到的总碱基数与待测网页组大小的比值。假设一个网页大小为2M,测序深度为10X,那么获得的总数据量为20M。覆盖度是指测序获得的序列占整个网页组的比例。由于网页组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌网页组测序,覆盖度是98%,那么还有2%的序列区域是没有通过测序获得的。
3.Q:如何使GC含量过高或过低物种的网页组测序达到相应组装标准?
A:当GC含量大于65%或小于35%时测序难度均会增加,需要构建不同长度测序文库,并通过加大测序量才能够达到组装标准。
4.Q:如何完成网页组中重复序列数据的准确拼接?
A:通过构建不同长度测序文库并使用Roche 454 FLX+平台深度测序,可以对重复序列引起的错误进行校正。