news 2026/6/10 17:27:39

UKB数据库/RAP平台批量下载数据教程

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
UKB数据库/RAP平台批量下载数据教程

使用 Table Exporter方法
第一步:
通过在本地终端(请确保你的机器上安装了dx-toolkit)或ttyd终端,执行以下命令,获取包含你数据集中所有可用数据字段的文件:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","
where project-xxxx:record-yyyy is ID of your Dataset

【安装dx-toolkit】打开本地电脑中的Anaconda Prompt
【安装dx-toolkit】在Anaconda Prompt中输入

pip install dxpy

系统会进行自动安装。

假如出现类似以下报错:

WARNING: The scripts dx, dx-app-wizard, dx-build-app and dx-build-applet are installed in '/Users/user-amy/Library/Python/3.9/bin' which is not on PATH. Consider adding this directory to PATH

说明需要更新电脑的PATH环境变量配置,以包括pip安装新命令的路径(具体解决方案自行百度)。

【CLI登录】在Anaconda Prompt中输入

dx login

服务器连接成功后按提示输入RAP的用户名和密码即可

现在输入:

dx extract_dataset project-xxxx:record-yyyy -ddd --delimiter ","

注意!

project-xxxx:record-yyyy为你的数据库 例如xxxxx.dataset

完成后有三个文件

上述命令将生成3个*.csv文件,其中*.dataset.data_dictionary.csv文件包含所有可用数据字段的完整信息(字段名称位于称为 的第二列name)。

where project-xxxx:record-yyyy is ID of your Dataset

【登出/注销CLI】使用完毕养成好习惯需要登出/注销,在Anaconda Prompt中输入:

dx logout

第二步:
接下来使用Table Exporter

收集所有感兴趣的数据字段名称,并写入field_name.txt文件。文件应有1列,每行只有1个数据字段名称。上述文件应仅包含同一实体中的数据字段(例如“参与者”、“olink_instance_0”等)。不同实体中的数据字段应写入独立文件。用于的值可以在.dataset.data_dictionary.csv文件的第一列中找到(注:这与entity_dictionary.csv文件中的不同)

注意这一步:
可以在自己电脑上新建txt,
但是!
需要用Visual Studio Code软件将txt转化为unix格式的txt !!!
也可,自行百度查看其他方法windows的txt转unix的txt.

用 VS Code 打开文件 查看右下角状态栏,会显示 "CRLF" 或 "LF" 点击 "CRLF" 或 "LF",选择 "LF" 保存文件

第三步
将field_name.txt文件上传到RAP项目

根据需要,
我用这个

注意:指定实体会快更多!


到这个就批量下载完成!

RAP官网下载教程如下:

https://dnanexus.gitbook.io/uk-biobank-rap/working-on-the-research-analysis-platform/accessing-data/accessing-phenotypic-data
https://documentation.dnanexus.com/developer/apps/developing-spark-apps/table-exporter-application

可进行进一步参考!

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 11:59:26

java基于SringBoot框架的智慧博物馆文创产品商城及预约平台的设计与实现-vue

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华
网站建设 2026/6/9 12:37:37

java基于SSM的农家乐美食预约点餐系统设计与实现-vue多商家

目录已开发项目效果实现截图关于博主开发技术介绍核心代码参考示例1.建立用户稀疏矩阵,用于用户相似度计算【相似度矩阵】2.计算目标用户与其他用户的相似度系统测试总结源码文档获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!已开发…

作者头像 李华
网站建设 2026/6/10 0:15:31

第一篇:基石篇——硬件设计的哲学:为“服务”而生的硬件

1.1 解码硬件配置单:一份需求说明书一份硬件配置清单,并非冰冷参数的堆砌,而是一份用技术语言写就的“需求说明书”。每一行规格的背后,都对应着上层业务一个尖锐的诉求。本章,我们将化身技术侦探,破译这份…

作者头像 李华
网站建设 2026/5/29 23:19:52

一个男人不想失去你,才会有这9种表现,别不懂

1️⃣ 吵架吵到脸红脖子粗,也舍不得拉黑删除,顶多气鼓鼓发个“哼”,转头还偷偷看你朋友圈。2️⃣ 以前熬夜打游戏、外卖当正餐,现在主动早睡还学煲汤,说“得养好身体陪你久一点”。3️⃣ 老板催他加班都敢说“等会儿”…

作者头像 李华