芯片与生物信息学

生物信息学服务

基本信息
服务名称:
生物信息学服务
英文名称:
参考报价:
最优
总点击数:
2599
更新日期:
2016-08-30
服务类别:

服务详情

一、统计分析

1.单因素两组数据统计分析
   要求:一个影响因素下的2组数据,每组数据3个以上生物学重复(例如试验组3个样本,对照组3个样本,比较两组间的差异基因)
主要包括差异基因的探针号,P值,不同组中均一化的信号值(对数形式),以及其他基因的相关信息。

2.单因素多组数据统计分析
    要求:一个影响因素下的多组数据,每组数据3个以上生物学重复(例如不同药处理后看不同药与对照组,不同药之间的差异; A药3个样本,B药3个样本,对照组3个样本)
主要包括差异基因的探针号,P值,不同组中均一化的信号值(对数形式),以及其他基因的相关信息。

3.多因素数据统计分析
    要求:多个影响因素下的2组数据,每组数据3个以上生物学重复(例如不同的组织来源样本组,而且这些样本还有不同的处理时间点,比较两组间不同影响因素单独作用或协同作用下的差异基因)。
主要包括差异基因的探针号,不同因素的P值,不同组中均一化的信号值(对数形式),以及其他基因的相关信息。

二、聚类分析

1. 非监督层次聚类
    非监督层次聚类法是将n个样品各作为一类, 计算n个样品两两之间的距离, 构成距离矩阵, 合并距离最近的两类为一新类, 计算新类与当前各类的距离。再合并、计算, 直至只有一类为止. 分层聚类是第一个被应用于基因表达谱数据分析的聚类方法, 由于结果的可视化和基因间关系的明确表现, 广泛地应用于基因表达谱的肿瘤亚型分类和生存率研究中。
    目的:用挑选的差异基因的表达情况来计算样品直接的相关性。一般来说,同一类样品能通过聚类出现在同一个簇(cluster)中,聚在同一个簇的基因可能具有类似的生物学功能。
    要求:至少提供3 组数据进行聚类分析。
    备注:双通道芯片产生的数据是Cy3 通道和Cy5 通道的荧光信号比值,即ratio 值,Cy3通道信号和Cy5 通道信号在常规实验设计中不能独立分开作为两组单通道信号值进行数据分析,因此,类似:肿瘤1vs 癌旁1,肿瘤2vs 癌旁2,肿瘤3vs 癌旁3,这样的三次生物学重复双通道实验设计无法进行有意义的聚类分析。
提供聚类分析结果的png格式缩略图和html格式的完整图

2. 自组织映射聚类SOM
    自组织映射聚类是以神经网络算法为基础的一种分割性聚类方法。SOM 按照每一基因表达向量与各类中参照向量的相似性,将基因分类,因此它与均值聚类的不同之处就是需要定义参照向量。在确定类的几何形状时,研究者就在有效地确定分类的数目。SOM将高维的表达数据呈现在低维的空间中,结果便于解释。相邻节点的参照向量接近,结果图中保存了邻簇关系,更便于对结果进行调整。SOM 适于在没有先验知识的情况下,对数据作探索性的分析,其算法易于实现,适合大规模的数据分析。
    目的:按照一个固定的顺序对若干个样品进行SOM 聚类分析,寻找在四个组织内表达模式类似的基因群。
    要求:具有序列实验设计样品的实验数据。
    备注:双通道芯片产生的数据是Cy3 通道和Cy5 通道的荧光信号比值,ratio 值,Cy3 通道信号和Cy5 通道信号在常规实验设计中不能独立分开作为两组单通道信号值进行数据分析。
自组织映射聚类SOM 结果图。每个趋势用蓝色的折线表示。每个趋势可以通过一个六边形同另外一个趋势连接。六边形的灰度表示相关性系数(correlation)的大小,白色:correlation=1,黑色:correlation=0,灰度表示不同的相关性系数。通过连接相邻两个趋势的六边形的灰度可以了解它们之间的相关性系数。

3. 样本主成分分析(PCA)
    在大规模基因表达数据的分析中,由于组织样本例数远远少于所观察基因个数,如果直接采用前述聚类分析可能产生较大误差,故需要对聚类算法进行改进。其中较为流行的方法是应
用PCA方法对数据进行分析。PCA的目的是要对多变量数据矩阵进行最佳综合简化。使用的方法是寻找这些变量的线性组合(称为主成分),使这些主成分间不相关,第一主成分最能反映数据间的差异。PCA有助于简化分析和多维数据的可视化。
    目的:考察样品的分布情况,验证实验设计的合理性,生物学重复样品的均一性。
    要求:至少2 组数据。
    备注:双通道芯片产生的数据是Cy3 通道和Cy5 通道的荧光信号比值,ratio 值,Cy3 通道信号和Cy5 通道信号在常规实验设计中不能独立分开作为两组单通道信号值进行数据分析。
提供不同样本PCA分析结果图

三、功能分析

1.Go分析
    GO分类法是最先出现的芯片数据基因功能分析法。Gene Ontology(GO,即基因本体论)数据库是一个较大的公开的生物分类学网络资源的一部分,它包含38675 个Entrez Gene注释基因中的17348个,并把它们的功能分为三类:分子功能,生物学过程和细胞组分。在每一个分类中,都提供一个描述功能信息的分级结构。这样,GO中每一个分类术语都以一种被称为定向非循环图表(DAGs)的结构组织起来。研究者可以通过GO分类号和各种GO数据库相关分析工具将分类与具体基因联系起来,从而对这个基因的功能进行描述。在芯片的数据分析中,研究者可以找出哪些变化基因属于一个共同的GO功能分支,并用统计学方法检定结果是否具有统计学意义,从而得出变化基因主要参与了哪些生物功能。
    目的:寻找不同样品的差异基因可能和哪些基因功能的改变有关

 

 GO ACCESSION

 GO Term

  p-value

 corrected p-value

 GO:0032396 

 inhibitory MHC class I
receptor activity

 1.64E-10 

 4.14E-05

 GO:0030110 

 HLA-C specific inhibitory
MHC class I receptor activity

  1.77E-09 

2.23E-04 

 2.Pathway分析
    根据挑选出的差异基因,计算这些差异基因同Pathway 的超几何分布关系,Pathway 分析会对每个有差异基因存在的pathway 返回一个p-value,小的p 值表示差异基因在该pathway 中出现了富集。
    Pathway 分析对实验结果有提示的作用,通过差异基因的Pathway 分析,可以找到富集差异基因的Pathway 条目,寻找不同样品的差异基因可能和哪些细胞通路的改变有关。与GO 分析不同,pathway 分析的结果更显得间接,这是因为,pathway 是蛋白质之间的相互作用,pathway 的变化可以由参与这条pathway 途径的蛋白的表达量或者蛋白的活性改变而引起。而通过芯片结果得到的是编码这些蛋白质的mRNA 表达量的变化。从 mRNA 到蛋白表达还要经过microRNA 调控,翻译调控,翻译后修饰(如糖基化,磷酸化),蛋白运输等一系列的调控过程,mRNA 表达量和蛋白表达量之间往往不具有线性关系,因此mRNA 的改变不一定意味着蛋白表达量的改变。同时也应注意到,在某些pathway 中,如EGF/EGFR 通路,细胞可以在维持蛋白量不变的情况下,通过蛋白磷酸化程度的改变(调节蛋白的活性)来调节这条通路。所以芯片数据pathway 分析的结果需要有后期蛋白质功能实验的支持,如Western blot/ELISA,IHC(免疫组化),over expression(过表达),RNAi(RNA 干扰),knockout(基因敲除),trans gene(转基因)等。

3.GSEA分析
    Gene Set Enrichment Analysis分析是用统计学的方法分析5类功能基因簇(gene set)是否在不同的生物样本组中存在差异,通过芯片实验数据的分析,寻找不同样品的差异基因可能与哪些生物学功能相关,为后期实验提供参考。

若需更多信息请与我们联系 

电话:4001869509

邮箱:marketing@kangpusen.com

网址:www.kangpusen.com

公司简介

北京康普森生物技术有限公司自2011年成立以来,深耕育种行业,始终将前沿生物技术的产业转化与中国现代种业创新作为企业之责任与担当。利用领先的基因组技术结合信息技术改良开发多物种的新性状,助力育种研发与生产过程的自动化、集成化、数字化和智能化。

自成立以来,康普森坚持自主研发适合中国种业的育种产品,构建了从技术、设施到产品、服务的育种4.0产业化应用体系。提供基于新型农业基因组技术的动植物分子育种、特色农业基因服务以及现代化农业生产、品牌建设整体解决方案。


售后服务
联系方式
单位名称:
详细地址:
北京市昌平区中关村生命科学园生命园路4号院4号楼7层
qq:
官网:
联系电话:

4001869509

Email:

在线询价
*姓名:
*单位:
职位:
*手机:
*邮箱:
地址:
*地区:
资料:
需要
不需要
报价:
需要
不需要
留言:
验证码:
我希望获得多家供应商报价
首页 我的账户 立即询价 电话咨询