文章

ImmPort数据库下载教程:Shared Data模块使用方法

2025-07-08     来源:本站     点击次数:71

ImmPort(Immunology Database and Analysis Portal)是由美国国立卫生研究院(NIH)、过敏与传染病研究所(NIAID)及过敏免疫移植部(DAIT)联合开发的免疫学数据平台。该平台开放共享,为全球研究者提供免疫学数据的标准化归档与开放访问。

ImmPort数据库分为四大应用模块:
1、Private Data:研究者可上传、管理私有数据(如未发表的实验数据),控制访问权限。
2、Shared Data:包含大量免疫研究项目及样品的临床与检测数据,可下载并使用。这个模块是今天介绍的重点。
3、Data Analysis:提供图形化界面与开源工具进行数据分析。
4、Resources:ImmPort的综合资源中心,旨在为研究者提供标准化工具、参考数据集及分析指南,支持免疫学数据的深度挖掘与跨研究整合,助力免疫组学研究。这个模块里整理出很多免疫学领域有价值的信息,下一期会详细介绍这个模块。


ImmPort数据库Shared Data模块使用方法

打开ImmPort官网并选择Shared Data模块,或者直接访问网址,便会看到如下界面(图1)。界面中位于上方的搜索框中可输入关键词或研究项目编号(SDY编号)进行数据集搜索。此外,也可以通过下方的Data Summary、Matrix Summary和Bubble Summary筛选出相关的数据集。

图片图1. ImmPort Shared Data首页

我们输入“breast”进行搜索,进入搜索结果页面(图2)。ImmPort提供了多种方式对搜索结果进行筛选并提供了操作教程(图3)。搜索结果包含Studies和Subjects两部分。Studies是研究项目,包含许多样品的数据。而Subjects是Studies中包含的各样品信息。搜索结果以列表形式呈现。列表中各title含义如下:
1)Study:研究项目编号
2)Title:研究项目名称
3)Pubmed Id:研究项目来源于哪篇已发表文献
4)Research Focus:研究方向
5)Condition/Disease:状态或疾病类型
6)Assay Methods:实验检测方法,括号里是检测数量
7)Latest Release Version:研究项目的新版本号(DR编号,编号数字越大版本越新)。ImmPort数据库允许上传者对上传的数据集进行更新(如新增样本、修正错误、补充元数据),更新后版本号会迭代更新。在论文或分析中引用数据集时,必须注明版本号,以便他人复现结果(如:使用ImmPort SDY1597, DR34版本数据”)
8)Program Name:研究项目所属的大型科研计划或资助项目的名称
 
图片
图2. ImmPort Shared Data搜索结果
 

图片图3. ImmPort Shared Data搜索结果筛选教程

打开SDY1597进入该研究项目详情页,可以看到该研究项目的详细信息(图4)。打开右上角的“Study Package(Web)”可进入数据下载页面(图5)。ImmPort数据库下载数据需要账号登陆并使用Aspera进行数据传输。如果没有登陆账号或缺少数据传输必要的扩展插件和Connect软件的话,网站会跳转到登陆界面或插件与软件下载提示窗口。
 

图片图4. SDY1597项目详情页

可下载内容主要包含三个部分:
1.实验方法(Protocols)和每个样品的检测结果(ResultFiles)。
2.ImmPort数据库的结构化输出结果。其中,“XXX_result.txt”文件非常重要。该文件记录了多个样品的临床信息和对应的检测数据结果文件名称,帮助我们将下载到的每个样品数据结果与其临床信息结合到一起。
3.*archive文件夹内包含了不同版本(DR编号)的结构化输出结果。
 

图片图5. SDY1597项目数据下载页

这一期我们学习了如何从ImmPort数据库的Shared Data模块搜索和下载免疫类研究项目的数据。下期详解ImmPort数据库Resources模块使用技巧。
相关文章 更多 >