组学数据上传(六)|GEO数据库数据上传实操
最近有些老师反馈文章发表时要求提供GEO登录号,如:GSEXXXX,问要怎么获取这种登录号?这时就需要把数据上传至GEO数据库了。还在等什么,跟着小编了解下GEO数据库,手把手教您上传数据至GEO数据库。
GEO数据库全称GENE EXPRESSION OMNIBUS,成立于2000年,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库,主要收录高通量基因表达数据。除SRA数据库之外,GEO数据库也是目前文章投递数据上传的数据库之一。
接受数据类型:原始数据或者经过处理的数据(符合“有关芯片试验的最小信息(minimum information about a microarray experiment,MIAME)”标准)
存储数据格式:web格式、spreadsheets格式、XML格式和纯文本格式
数据上传实操
01# 账号注册及登录
1)注册账号:进入https://www.ncbi.nlm.nih.gov/ 网页,找到页面右上角Sign in ,进入页面后,点击页面中的Sign up,根据自己喜好,选择对应的账号进行注册,按照提示填写账号、密码、邮箱等信息。
如果已有NCBI账号,此步骤可忽略。

2)登录账号:输入账号及密码(注册时使用哪种账号注册,登录时选择对应的登录通道登录),点击Log in,然后点击左上角的NCBI大图标回到NCBI的主页,点击图中Submit按钮进入提交数据页面。

02# 进入GEO数据上传页面
1)点击主页中Submit按钮进入提交数据页面,选择EGO数据库。进入GEO数据上传页面,选择对应的上传数据类型,高通量测序数据就点击“数据类型”中的第二行,进入数据上传页面。



03# 准备文件
根据网页提示准备3类文件,1. metadata spreadsheet,2. processed data files,3. raw data files 。


1)metadata spreadsheet:点击“metadata spreadsheet” 下载模板进行填写。
下载文件为Excel表格形式,该文件是填写关于整个研究中样本和实验的相关信息。
具体栏目填写参考:
SERIES这一块是一些跟您的实验相关的信息介绍,summary这一栏可以采用分段的模式来写,也可以采用一段式的模式来写,类似于科研论文中的摘要。

SERIES栏目
SAMPLES这一块是具体的实验分组信息,以及每一个组别里面的样品名称的填写

SAMPLES栏目
PROTOCOLS这一块主要是样品的处理方式以及测序建库的方式,一般服务商的结果报告中都会提供,也可通过与合作服务商伙伴的沟通来获得该部分的信息。

PROTOCOLS栏目
2)processed data files:一个至多个文件,是根据你的原始文件进行分析所提取得到的一些数据;该部分经过处理的数据是GEO提交的必要部分,GEO会审核客户上传的处理过的数据,以此来检验相关文章结论的真实可靠性。比如RNA-seq可以上传基因表达量文件,ChIP-seq可以上传WIG, bigWig, bedGraph等,不过由于是中间文件,该部分内容没有完全固定的格式。
3)raw data files:一个至多个文件,这是你测序或芯片获得的原始文件。测序的原始数据一般采用FASTQ格式,另外SRA数据库接受的其他格式也是可以的(https://www.ncbi.nlm.nih.gov/sra/docs/submitformats/)。
04# 数据上传
点击该网页“Uploading your submission”,跳转到数据上传部分:



跳转到“My GEO Profile”,进行个人基础信息填写,填写后跳转可获取FTP登录所需的IP、用户名及密码,通过FileZilla进行登录,开始上传数据。
GEO官网推荐的软件FileZilla,下载链接:https://filezilla-project.org。


进入到项目数据传输页面:



点击鼠标右键,在此路径下建三个子文件夹:1. metadata spreadsheet,2. processed data files,3. raw data files。然后将对应的文件上传至该文件夹即可。注意,由于raw data files很大,上传时需要耐心等待。
05# 确认数据上传完成
上传结束后,可点击Notify GEO,提醒GEO后台人员上传完成,可以进行审核。

点Notify GEO进去之后就是这样的界面,需要填写你建立的文件夹名称,期望数据公开的时间,以及更进一步的说明等。
上传成功或者数据有问题GEO都会以邮件的形式进行通知。一般约2,3个工作日,经审核数据没有问题,GEO会以邮件形式通知数据的GSM(实验样本编号)、GSE(研究项目编号)。
提示:提交了该数据之后,就会收到来自GEO数据库的邮件。(邮箱为NCBI注册时留下的邮箱)如果你的数据有问题,会通知你去再次上传或者是修改。你重新上传下数据就可以了。
等你的文件全部上传完成后,5个工作日内就会收到GEO给你发来的邮件,这时会给你一个GEO号,类似于GSEXXX。当你收到这封邮件后意味着你的数据正式上传成功了,写文章的时候把这个号附上就大功告成。
相关文章:
组学数据上传(六)|GEO数据库数据上传实操
最近有些老师反馈文章发表时要求提供GEO登录号,如:GSEXXXX,问要怎么获取这种登录号?这时就需要把数据上传至GEO数据库了。还在等什么,跟着小编了解下GEO数据库,手把手教您上传数据至GEO数据库。 GEO数据库全称GENE EXPRESSION OMNIBUS&…...
洛谷,Hydro,Vijos,博客园,GitHub 分别是什么?
洛谷(luogu.com.cn)是一个在线的算法竞赛平台,提供了大量的算法题目,可以进行刷题、比赛、交流等。Hydro 是一个开源的在线评测系统,用于处理洛谷和其他OJ平台的算法评测。Vijos(vijos.org)是另…...
自学VUE笔记
一、基础语法学习 1、Attribute 绑定 a、绑定单个属性:给这个div 增加id 属性 <div v-bind:id"dynamicId"></div>简写: <div :id"dynamicId"></div> b、绑定多个属性值 data() {return {objectOf…...
系列四十二、Spring的事务传播行为案例演示(二)#REQUIRED
一、演示Spring的默认传播行为(REQUIRED) 1.1、运行之前表中的数据 1.2、StockServiceImpl /*** Author : 一叶浮萍归大海* Date: 2023/10/30 15:43* Description:*/ Service(value "stockServiceREQUIRED") public class StockServiceImpl…...
oracle rac-归档满处理
有客户反馈数据库无法使用了,客户手动启动报错如下 SQL> startup; ORACLE instance started. Total System Global Area 2.6924E10 bytes Fixed Size 2265984 bytes Variable Size 1.3959E10 bytes Database Buffers 1.2952E10 bytes R…...
Python Django 之全局配置 settings 详解
文章目录 1 概述1.1 Django 目录结构 2 常用配置:settings.py2.1 注册 APP:INSTALLED_APPS2.2 模板路径:TEMPLATES2.3 静态文件:STATICFILES_DIRS2.4 数据库:DATABASES2.5 允许访问的主机:ALLOWED_HOSTS 1 …...
挑选MES系统供应商,需要考虑哪些重要因素?
挑选MES系统供应商时,需要考虑下述几个重要因素: 1.功能与特性:MES系统的功能和特性尤为重要。切实保障挑选的服务商可以满足企业的实际需求,包含生产计划管理、物料追踪、质量管理、机器设备等多个方面的功能。 2.系统可扩展性&a…...
Ai创作系统ChatGPT网站源码+图文搭建教程+支持GPT4.0+支持ai绘画(Midjourney)
一、AI创作系统 SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统AI绘画系统,支持OpenAI GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署…...
基于计算机视觉的坑洼道路检测和识别-MathorCup A(深度学习版本)
1 2023 年 MathorCup 高校数学建模挑战赛——大数据竞赛 赛道 A:基于计算机视觉的坑洼道路检测和识别 使用深度学习模型,pytorch版本进行图像训练和预测,使用ResNet50模型 2 文件夹预处理 因为给定的是所有图片都在一个文件夹里面…...
【考研数学】概率论与数理统计 —— 第七章 | 参数估计(1,基本概念及点估计法)
文章目录 引言一、参数估计的概念二、参数的点估计2.1 矩估计法2.2 最大似然估计法 写在最后 引言 我们之前学了那么多分布,如正态分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N(μ,σ2),泊松分布 P ( λ ) P(\lambda) P(λ) 等等,都是在已知 …...
获取文本长度
使用TextView的getLineCount方法,它可以返回TextView当前显示的行数。但是,这个方法只有在TextView绘制完成后才能返回正确的值,否则可能返回0。因此,需要在TextView的post方法中调用,或者在onWindowFocusChanged方法中…...
python html(文件/url/html字符串)转pdf
安装库 pip install pdfkit第二步 下载程序wkhtmltopdf https://wkhtmltopdf.org/downloads.html 下载7z压缩包 解压即可, 无需安装 解压后结构应该是这样, 我喜欢放在项目里, 相对路径引用(也可以使用绝对路径, 放其他地方) import pdfkit# 将 wkhtmltopdf.exe程序 路径 p…...
Spring概述
Spring概述 Spring 是最受欢迎的企业级 Java 应用程序开发框架,数以百万的来自世界各地的开发人员使用 Spring 框架来创建性能好、易于测试、可重用的代码。 Spring 框架是一个开源的 Java 平台,它最初是由 Rod Johnson 编写的,并且于 2003 …...
Linux网卡
网卡 网卡(Network Interface Card,NIC)是一种计算机硬件设备,也称为网络适配器或网络接口控制器。一个网卡就是一个接口 网卡组成和工作原理参考https://blog.csdn.net/tao546377318/article/details/51602298 每个网卡都拥有唯…...
【Python机器学习】零基础掌握ElasticNet变量选择回归器
如何优雅地解决房价预测问题? 房价预测一直是一个热门而复杂的话题。假设一个地产商希望准确地预测不同城市区域的房价,以便更有效地进行房地产投资。问题在于,房价是由多种因素共同决定的,例如地段、房屋面积、交通便利程度等。 为了解决这个问题,一个可行的思路是使用…...
【数据结构】模拟实现Vecotr
namespace my_vector {template <class T>class vector{public:typedef T* iterator;typedef const T* const_iterator;//常量指针,指针指向的值不可以变;//构造函数vector():start(nullptr),finish(nullptr),end_of_storage(nullptr){}//析构函数…...
Qt开发: 利用Qt的charts模块绘制曲线、饼图、柱状图、折线图等各种图表
一、前言 Qt Charts模块是Qt提供的一个用于创建各种类型图表的功能模块。为开发人员提供了一种简单而强大的方式来可视化数据。Qt Charts模块基于Qt GUI框架构建,可以与其他Qt模块无缝集成,例如Qt Widgets、Qt Quick和Qt OpenGL。 Qt Charts模块包含了几个核心类: (1)Q…...
Redis:加速你的应用响应时间,提升用户体验
绝大部分写业务的程序员,在实际开发中使用 Redis 的时候,只会 Set Value 和 Get Value 两个操作,对 Redis 整体缺乏一个认知。这里对 Redis 常见问题做一个总结,解决大家的知识盲点。 1、为什么使用 Redis 在项目中使用 Redis&am…...
乐鑫 SoC 内存映射入门
微控制器 (MCU) 的性能和内存能力逐步提升,其复杂度也随之加大。特别是当用户需要配置内存管理单元来映射外部存储器芯片 (Flash/SPIRAM) 时,这种现象尤其明显。 开始在乐鑫 SoC 上运行 Zephyr RTOS 时,会发现这些 SoC 与 ARM 架构的 MCU 相…...
蓝凌EIS智慧协同平台saveImg接口存在任意文件上传漏洞
蓝凌EIS智慧协同平台saveImg接口存在任意文件上传漏洞 一、蓝凌EIS简介二、漏洞描述三、影响版本四、fofa查询语句五、漏洞复现六、深度复现1、发送如花2、哥斯拉直连 免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者…...
云原生核心技术 (7/12): K8s 核心概念白话解读(上):Pod 和 Deployment 究竟是什么?
大家好,欢迎来到《云原生核心技术》系列的第七篇! 在上一篇,我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在,我们就像一个拥有了一块崭新数字土地的农场主,是时…...
java_网络服务相关_gateway_nacos_feign区别联系
1. spring-cloud-starter-gateway 作用:作为微服务架构的网关,统一入口,处理所有外部请求。 核心能力: 路由转发(基于路径、服务名等)过滤器(鉴权、限流、日志、Header 处理)支持负…...
Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...
为什么需要建设工程项目管理?工程项目管理有哪些亮点功能?
在建筑行业,项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升,传统的管理模式已经难以满足现代工程的需求。过去,许多企业依赖手工记录、口头沟通和分散的信息管理,导致效率低下、成本失控、风险频发。例如&#…...
【JavaWeb】Docker项目部署
引言 之前学习了Linux操作系统的常见命令,在Linux上安装软件,以及如何在Linux上部署一个单体项目,大多数同学都会有相同的感受,那就是麻烦。 核心体现在三点: 命令太多了,记不住 软件安装包名字复杂&…...
Java求职者面试指南:计算机基础与源码原理深度解析
Java求职者面试指南:计算机基础与源码原理深度解析 第一轮提问:基础概念问题 1. 请解释什么是进程和线程的区别? 面试官:进程是程序的一次执行过程,是系统进行资源分配和调度的基本单位;而线程是进程中的…...
如何把工业通信协议转换成http websocket
1.现状 工业通信协议多数工作在边缘设备上,比如:PLC、IOT盒子等。上层业务系统需要根据不同的工业协议做对应开发,当设备上用的是modbus从站时,采集设备数据需要开发modbus主站;当设备上用的是西门子PN协议时…...
五、jmeter脚本参数化
目录 1、脚本参数化 1.1 用户定义的变量 1.1.1 添加及引用方式 1.1.2 测试得出用户定义变量的特点 1.2 用户参数 1.2.1 概念 1.2.2 位置不同效果不同 1.2.3、用户参数的勾选框 - 每次迭代更新一次 总结用户定义的变量、用户参数 1.3 csv数据文件参数化 1、脚本参数化 …...
接口 RESTful 中的超媒体:REST 架构的灵魂驱动
在 RESTful 架构中,** 超媒体(Hypermedia)** 是一个核心概念,它体现了 REST 的 “表述性状态转移(Representational State Transfer)” 的本质,也是区分 “真 RESTful API” 与 “伪 RESTful AP…...
el-amap-bezier-curve运用及线弧度设置
文章目录 简介示例线弧度属性主要弧度相关属性其他相关样式属性完整示例链接简介 el-amap-bezier-curve 是 Vue-Amap 组件库中的一个组件,用于在 高德地图 上绘制贝塞尔曲线。 基本用法属性path定义曲线的路径,可以是多个弧线段的组合。stroke-weight线条的宽度。stroke…...
