生物信息软件

生物数据分析系统

基本信息
产品名称:
生物数据分析系统
英文名称:
国产/进口:
国产
产地/品牌:
Bioknow
型号:
BioKnow-DataAnalysi
参考报价:
总点击数:
2572
更新日期:
2020-09-28
产品类别:

性能参数

一、产品概述
您在生物数据分析是否遇到过下面令人头疼的问题呢?
•现在的生物、医学、药学等研究都会遇到数据处理,数据如何分析才能得到好的结果…
•高通量技术在生物各个学科应用中越来普遍,如何进行实验设计…
•实验得到的芯片数据、测序数据、质谱数据如何分析…
•自己的实验数据分析流程是什么…
•同一个处理过程,分析方法太多,哪个结果更好…
•分析结果如何解释生物学功能…

百奥知数据分析系统(Bioknow Data Analysis System,简称Bioknow-DataAnalysis),是生物数据分析软件系统。系统提供各种生物数据平台的数据分析支持,如表达谱芯片、miRNA芯片、SNP芯片、比较基因组杂交芯片、蛋白芯片、Promoter芯片以及Affymetrix提供的各种芯片等,并提供各种常用的归一化方法、检验方法、聚类方法、分类方法、调控网络重构方法、各种相关图形绘制等;同时系统还支持新测序数据如RNA-seq、Chiq-seq、miRNA-seq等进行序列拼接、序列定位、表达水平评估、差异表达分析等;此外系统还提供医学常用的统计分析,例如假设检验、方差分析、卡方检验、回归分析、PCA分析、生存分析等。旨在为医药研究领域分析人员以及生物信息学研究者提供各种数据分析的平台,发掘基因表达与其功能间的关系,帮助研究者发现新药靶点、开展疾病的基因诊断和早期预警等。

二、应用范围
大规模实验数据的生物学分析;
各类生物分子的关联功能统计分析;

三、产品功能

图 产品功能图

3.1 生物数据分析
实现表达谱芯片数据的预处理、归一化、荧光交换数据分析等
实现多种常用的统计学检验方法和聚类/分类方法,实现差异基因的挑选
实现多种类型芯片数据的整合分析方法,供试验者从不同角度数据进行综合分析
实现多种类型芯片数据的整合分析方法,供试验者从不同角度数据进行综合分析
芯片数据概要模块
M vs. A:芯片数据分布
Histogram:单张芯片的数据分布情况

图 芯片数据分布直方图

显著性分析模块
DiffGene:组合t-test、SAM分析
One group ttest:单组样本T检验
onewayANOVA:单因素方差分析
twowayANOVA:双因素方差分析
Vokano:显著型结果作图

图 差异表达基因分析

多基因集分析模块包括:
Venn Plot:计算三个基因之间的交集,并集

图 多基因集关系分析

聚类分析的模块:
HeatMap:对样本和基因进行双向聚类
Sample cluster:对样本进行层次聚类
SOM:自组织映射聚类
其他分析模块:
Compare:计算样本间的相似度
PCA:主成份分析

图 PCA分析结果

3.2 疾病相关SNP分析
数据基本情况,检验Hardy-Weinberg平衡,MAF和位点非缺失基因型所占百分比等位点相关信息。
SNP关联分析,通过 Pearson 卡方检验或Fisher精确检验,分析正常组和疾病组每个位点上基因型和等位基因的分布差异,寻找与疾病相关的位点。
LD(连锁不平衡)分析,这种不同基因座位的某些等位基因非随机联合经常会在一起遗传。通过D’/r^2等考察位点之间的连锁不平衡。
单体型分析,通过Pearson 卡方检验考察这些整体遗传的单体型是否和疾病关联(p值<0.05)。

图 HW平衡检验

图 连锁不平衡分析

3.3 常见统计分析
医学统计是运用统计学的原理和方法研究医学科研中有关数据的收集、整理和分析。正确运用统计学思维,针对数据特点,巧妙地选用恰当高效的统计分析方法,从而得到可靠的结果和科学的结论。

统计分析模块
假设检验:T检验
方差分析:ANOVA
非参数检验:sampleks、kappa、chisquare、pairchisq
相关分析:correlation、distance、linear regression
聚类分析:kmeans、 hierarchy、 SOM
主成份分析:PCA
生存分析:survival

3.4 高通亮测序数据分析
Solexa数据处理

Solexa数据处理包括图片分析、碱基识别、序列分析。通过数据处理,测序仪上产生的图片文件被转换为易于进行下一步分析的序列文件和质量文件;维护与改进标准数据处理流程;对于可能影响数据质量的所有因素,寻求解决方案,并对数据处理与质控提供技术支持。

RNA-Seq测序分析方案
基因组定位,数据处理由原始fastq文件开始。数据首先将含有Q<20的碱基替换为N。然后使用MAQ软件将fastq转换为Fasta。然后去掉3’-adaptor。然后序列数据通过MAQ软件将序列向基因组比对。生成覆盖度数据。
转录本定量分析,MAQ比对的结果用于基因定量,对于每个基因进行基因定量,定量方法采用 reads per kilobase of exon per million mapped sequence reads (RPKM)反映表达量。
可变剪切预测,我们使用TopHat软件进行进行可变剪切的分析。
反义转录本的寻找。
识别新转录本、选择性剪切和组织特异性microRNA信息,通过将Reads往参考基因组上Mapping,可以将Reads定位到考基因组三类位置:已经被标注的基因外显子区域;已经被发现的非编码RNA区域;未被确认的区域。

获取SNP、Indel和Mutation数据,统计不同个体、组织间的分布差异,方法为基于SNP、Indel和Mutation位点reads覆盖度的统计检验方法筛选在组织间具有显著差异的位点或者基因。

sRNA测序分析方案
将测序结果分为microRNA, piRNA, tRNA, snRNA, rRNA, snoRNA 等,最后绘制成饼图展示结果。
计算已知miRNA的表达量,对于处理-对照实验设计采用Audic Claverie test筛选两个样本间的差异表达microRNA。
miRNA家族、基因座分类,有一些MicroRNA在基因组中成簇(cluster)分布。这些microRNA同步转录。由于转录后成熟过程的调节各异,因此成簇的microRNA成熟体的表达量略有不同。通过对成簇microRNA的分析,可以在cluster的水平考察microRNA的差异表达情况。
预测新的miRNA, 根据solexa测序得到的未知序列信息,结合基因组提供的序列上下文信息,使用miRDeep预测solexa测序得到的未知序列中可能存在的novel microRNA。
miRNA进化分析,跨物种比较microRNA 序列的保守性及种子序列的保守性。
microRNA 基因簇分析,将新预测的microRNA 在基因组上定位,并寻找可能同时转录的microRNA。

mRNA测序分析方案
基因注释,我们将测序结果进行比对和分析,确定tag代表的基因。
差异基因筛选,筛选到表达有差异变化的基因。然后对变化基因的趋势进行归类,以方便分析和描述。
样品之间的比较分析,我们将通过曲线拟合的方法,寻找样品之间趋势差异最大的一些基因。
GeneOntology分析,对于每一种表达趋势的基因,选择性的进gene ontology:功能分析. 对差异表达的所有基因向gene ontology数据库的各节点映射。计算每个节点的基因数目,并结合整个数据库的基因作为背景分部,对于每个节点,得到一个2x2的表格,使用超几何分布检验基因在每个GO节点的富集或贫乏程度。
Pathway分析,我们同样将差异基因使用KEGG pathway和BioCarta数据库映射。通过统计方案,找到统计上最有意义的pathway。
转录因子分析,利用相关的转录因子(TF)数据库,将差异基因的启动子(基因第一个外显子上游1000bp)提取出来。我们使用HsPD 提供的启动子序列。转录因子数据库使用TRANSFAC 7.0 public。转录因子结合位点预测使用pwmatch 程序,对每个转录因子分析其在上调基因和下调基因的分布情况,利用chi-square test 寻找有差异的转录因子。

ChIP-Seq单通道(Lane)Single-end数据信息分析方案
将测序结果进行大规模随机blast,检测可能的样品污染。
Reads比对到基因组,将测序结果与reference genome进行mapping, mapping 的reads 中mismatch 的数目可以根据客户需要进行分析, 并挑选出unique mapping 的所有reads用于后续peak的分析。
Peak的查找,根据mapping的unique reads进行peak查找, 确定具有统计学意义的靶位点,用于后续分析。
Peak的全基因组定位,对查找的具有统计学意义的peak进行全基因组locus定位,在得到每个peak对应的locus的基础上,再对全基因组上peak进行位置的分布统计,以对靶基因的偏好性进行了解。

Peak附近区域序列提取及motif分析,对peak附近的区域进行序列提取,并对其做motif分析,特别是对转录因子结合位点测序,在验证已有motif的基础上,进行denovo分析,试图发现新的motif。
靶基因的GO,PATHWAY,NETWORK分析。

公司简介

北京百奥知信息科技有限公司成立于2007年,是中国领先的创新型医药研发信息化解决方案供应商,致力于以信息化+AI赋能医药产业,帮助医药企业、医生与患者创造价值。
百奥知依托eClinical临床研究一体化信息平台MedAI智能研究云平台两大核心技术,以临床数据为中心,医学智能为目标,搭建以患者为中心的医药研发全流程协作生态,提供注册研究一体化、上市后研究一体化与医学创新研究一体化三大解决方案,帮助医药企业、CRO等全面提升医药研究效率、加速产品上市,提升产品销量;助力医生改善患者服务,加速成果转化;促使患者获得精准诊断与精准用药。
百奥知拥有70+项软件著作权证书,20+项国家认可机构软件测评报告,10+项专利,已获得ISO9001、ISO20000、ISO27001等多项行业及国际认证,核心业务涵盖软件产品研发、行业应用解决方案和数据云服务等,累积为国内外1000多家申办方、CRO等客户的2500多个项目提供医药研究智能化解决方案。百奥知已形成以北京为中心,覆盖上海、成都、广州、武汉、济南、长沙、长春、南京、苏州、沈阳等10个大中型城市的全国服务网络,为客户持续提供高质量的产品和高水平的专业服务,支持医药产业全链条赋能。

两大技术平台 

一、eClinical临床研究一体化信息平台
为生命科学行业提供数据、过程、安全警戒及文档、影像的规范化信息化管理服务工具。实现临床研究流程的全覆盖,为提升我国医药临床研究的质量提供全面技术保障,并为医疗大数据的分析挖掘奠定数据基础。
主要产品有:
1)临床数据类——
 EDC(临床试验数据电子采集系统) RTSM(随机化与试验药物管理系统) MedCoding(医学编码系统)DTMS(临床数据全流程管理系统)
2)药物警戒类——
 PV(药物安全警戒管理系统)、  

3)文档管理类: eTMF(临床试验全文档管理系统)
4)项目管理类:CTMS(临床试验项目管理系统)、eTraining(在线培训考核系统)
5)影像管理类: Bioknow SDIM(临床试验读片与标本运送管理系统)、Bioknow eImage(影像阅片系统)
实现“一个入口、一个账号、一次录入”,真正做到信息统一维护、账户统一管理,集成消息入口、项目全局掌控。,使各信息化产品间互联互通,更通过人工智能技术赋能各产品,达到标准统一、数据互通、流程协作、文档规范,帮助各方加快临床研究进程和新药上市的步伐。

二、MedAI智能研究云平台
MedAI智能医药研究云平台提供eStudy,eMAF两大整体解决方案。其中eStudy是针对临床研究者设计解决方案。包含“智能分析”、“云RWS”、“分析模型库”等系列智能化效率工具,帮助临床研究者更高效的开展真实世界研究,提升临床研究效率和质量,发表高水平研究成果。eMAF解决方案提供智能“学术网络”、“产品知识库”、“临床试验库”等系列智能化业务工具,帮助医药企业医学部、市场部、销售部更高效的进行医学市场策略制定,临床研究项目实施,KOL级大处方HCP管理,提高学术营销的质量和效率,提升市场占有率。

 

售后服务
相关视频
暂无

资料下载
暂无
联系方式
单位名称:
详细地址:
北京市海淀区北三环中路44号海淀文教产业园B座111
qq:
469027820
联系电话:

010-82790315 82790317

Email:

在线询价
*姓名:
*单位:
职位:
*手机:
*邮箱:
地址:
*地区:
资料:
需要
不需要
报价:
需要
不需要
留言:
验证码:
我希望获得多家供应商报价
首页 我的账户 立即询价 电话咨询