基因/蛋白互作网络NLP分析
一、项目目标:
利用NLP(Natural Language Processing)方法从PubMed文献摘要数据库中分析A基因调控网络,并对互作的基因进行GO、pathway分析。
用途:
基因-基因互作网络、基因-蛋白互作网络、基因-microRNA互作网络、蛋白-蛋白互作网络、microRNA-microRNA互作网络。
二、项目方案
2.1.基本流程
1) 利用关键词进行文档搜索,并将文档整理成XML格式。
2) 将摘要文本分离成单个句子。后续的分析是以句子为基本单位的。
3) 利用B软件进行人类基因的描述的定位,提取基因。
4) 基因符号以NCBI的entrez gene数据库为准。基因互作关系由B软件绘制为网络结构。
5) 建立一个基因互作的verb词典,分离句子中基因互作的verb。
6) 生成A基因同义词字典,分离句子中A基因的描述。
7) 统计分析基因名、互作verb和A基因同时出现(co-occurrence)的句子,整理列表。基因互作关系由某软件绘制为网络结构。
联系我们:
上海总部:
网址:
电子邮箱:market@microsci.com
企业QQ:800068602
电话:4000-331-887
传真:021-61268380转8002
地址:上海市闵行区剑川路951号沧源科技园A楼102室
邮编:200241
淘宝地址:http://shop57095553.taobao.com
----联系时,请注明信息来自“中国生物器材网”----
用手机“扫一扫”,更多学术资讯齐分享!
上海丰核信息科技有限公司,是由具有丰富企业管理运营的职业经理人创建的一家专注于生物信息学分析的高科技创新型企业。丰核信息团队核心成员由香港大学,美国贝勒医学院,华东师范大学的生物信息学高学历人才组成。公司已经建成并完善了流程化的智能网络分析平台以及文本挖掘系统平台并申请了相关专利。 公司致力于为生命科学领域研究者提供专业的生物信息学服务,主营业务包括个性化科研目为导向的数据挖掘,算法开发,高通量生物学芯片数据分析,数据库开发以及基于生物信息学分析探路的实验路线设计,实验外包,结果分析等服务。 公司已经以不同形式为数十家国内研究单位提供了生物信息学服务,共同发表了SCI文章。合作单位有美国食品药品监管局(FDA) 、香港大学、中国科学院、华东师范大学、上海市第二军医大学、上海市第六人民医院、四川农业大学等科研单位建立了长期的合作关系,客户在公司的帮助下在科研上取得了较好的研究成果,并且发表在国际一流的学术刊物上。
客服QQ:270082951;272349462
电话: 021-61268380
传真:021-61268380
地址:上海市闵行区剑川路951号沧源科技园A楼4606室 200241
单位名称: |
详细地址:
上海市闵行区剑川路951号沧源科技园B号楼319
|
qq:
800068602
|
官网: |
联系电话: |
Email: |