miRNA分析流程学习(一)/TCGAmiRNA数据下载
miRNA(microRNA) 是一种小的非编码 RNA 分子,通常由 20 到 24 个核苷酸组成。miRNA 主要存在于动植物中,并在基因表达调控中起到关键作用。它们通过与特定的信使 RNA(mRNA)分子结合来抑制基因表达,通常通过抑制翻译或促进 mRNA 的降解。
miRNA 的特征和功能
-
基因表达调控:miRNA 不直接编码蛋白质,而是通过调节蛋白质编码基因的表达来发挥作用。典型的调控方式是通过与靶 mRNA 配对,然后抑制其翻译或促使其降解。
-
产生与加工:miRNA 通常由较长的初始转录本(称为 pri-miRNA)加工而来。pri-miRNA 在细胞核中由 Drosha 酶加工成较短的 pre-miRNA,然后被运送到细胞质中。在细胞质中,Dicer 酶进一步加工 pre-miRNA,将其切割成成熟的双链 miRNA。其中一条链(称为“引导链”)会与 RNA 诱导沉默复合体(RISC) 结合,另一条链(称为“乘客链”)通常会被降解。
-
靶标结合与功能:miRNA 通过其引导链的 种子序列(位于 miRNA 的 5' 端,通常为第 2 到第 8 位核苷酸)与靶 mRNA 的 3' 非翻译区(3' UTR) 结合。这种结合可以导致 mRNA 的翻译抑制或直接降解,从而减少特定蛋白质的产生。
miRNA 的生物学意义
-
发育调控:miRNA 在胚胎发育、细胞分化和器官形成中扮演重要角色。
-
细胞周期与凋亡:miRNA 参与调控细胞的增殖、分化和凋亡,维持细胞稳态。
-
癌症:miRNA 在肿瘤发生和发展中起到关键作用。某些 miRNA 可以作为癌基因(促进癌症的 miRNA)或抑癌基因(抑制癌症的 miRNA)。
-
免疫反应:miRNA 调节免疫系统的功能,影响炎症反应和免疫调节。
miRNA 的应用
-
生物标志物:由于 miRNA 在不同疾病状态下的表达差异,它们可以作为疾病诊断和预后的生物标志物。例如,在一些癌症中,特定 miRNA 的表达上调或下调与疾病进展相关。
-
治疗靶标:miRNA 的调节功能使它们成为潜在的药物靶标。通过抑制有害的 miRNA 或补充缺失的 miRNA,可以开发新的治疗方法。一些 miRNA 模拟物和反义 oligonucleotide(anti-miRNA) 已经在临床试验中。
-
基因功能研究:miRNA 是研究基因功能和信号通路的重要工具,帮助揭示复杂的基因调控网络。
笔者能力有限,详细的miRNA知识就不再赘述了,感兴趣的小伙伴可以去读一读参考资料中的综述~
miRNA数据库
关于miRNA的数据库有很多,以下是几个比较重要的:
1、miRBase:这个数据库是所有想做miRNA分析的研究者一定绕不开的工具
2、MicroRNAdb
3、miRTarBase
4、除此之外还有很多,比如:psRNATARGET,MicroRNAdb,miRWalk,TarBase,miRGator,CoGemiR,PolymiRTS,PicTar等。
TCGA-miRNA数据下载
正式分析之前还需要获取miRNA的数据,其中最常用的数据库一定是TCGA了, 因此我们先从这个数据库开始。
对于来自TCGA数据库的数据,有一个好用的下载工具就是TCGAbiolinks,它可以帮助我们方便的获取到TCGA中的数据。
1.导入
rm(list = ls())
library(TCGAbiolinks)
library(qs)
library(BiocParallel)
register(MulticoreParam(workers = 8, progressbar = TRUE)) # 查看TCGA中33种癌症的简称
library(TCGAbiolinks)projects <- TCGAbiolinks::getGDCprojects()$project_id ##获取癌症名字
projects <- projects[grepl('^TCGA', projects, perl=TRUE)]
projects
# [1] "TCGA-PCPG" "TCGA-THYM" "TCGA-PAAD" "TCGA-STAD" "TCGA-TGCT" "TCGA-SARC" "TCGA-PRAD" "TCGA-READ" "TCGA-UCS" "TCGA-UVM"
# [11] "TCGA-KICH" "TCGA-HNSC" "TCGA-LUAD" "TCGA-LIHC" "TCGA-LUSC" "TCGA-MESO" "TCGA-LAML" "TCGA-LGG" "TCGA-KIRP" "TCGA-KIRC"
# [21] "TCGA-ACC" "TCGA-BLCA" "TCGA-DLBC" "TCGA-CHOL" "TCGA-CESC" "TCGA-COAD" "TCGA-BRCA" "TCGA-ESCA" "TCGA-GBM" "TCGA-OV"
# [31] "TCGA-THCA" "TCGA-SKCM" "TCGA-UCEC"TCGAbiolinks:::getProjectSummary("TCGA-HNSC")
# $file_count
# [1] 29489
#
# $data_categories
# file_count case_count data_category
# 1 8330 528 Simple Nucleotide Variation
# 2 4595 528 Sequencing Reads
# 3 2858 528 Biospecimen
# 4 1103 528 Clinical
# 5 5925 526 Copy Number Variation
# 6 2270 528 Transcriptome Profiling
# 7 1740 528 DNA Methylation
# 8 354 354 Proteome Profiling
# 9 50 24 Somatic Structural Variation
# 10 2264 521 Structural Variation
#
# $case_count
# [1] 528
#
# $file_size
# [1] 3.019863e+14
2.TCGA-miRNA数据下载
proj <- "TCGA-HNSC"
# 单独下载
query <- GDCquery(project = proj,data.category = "Transcriptome Profiling",data.type = "miRNA Expression Quantification",workflow.type = "BCGSC miRNA Profiling"
)
GDCdownload(query)
GDCprepare(query,save = T,save.filename = paste0(project,"_miRNA.Rdata"))# 批量下载数据
sapply(projects, function(project){query <- GDCquery(project = project,data.category = "Transcriptome Profiling",data.type = "miRNA Expression Quantification")GDCdownload(query)GDCprepare(query, save = T,save.filename = paste0(project,"_miRNA.Rdata"))})
3.数据处理及保存
load(paste0(proj,"_miRNA.Rdata"))
head(data)[1:4,1:4]
# miRNA_ID read_count_TCGA-BA-6871-01A-11R-1872-13 reads_per_million_miRNA_mapped_TCGA-BA-6871-01A-11R-1872-13
# 1 hsa-let-7a-1 39430 8590.708
# 2 hsa-let-7a-2 39178 8535.804
# 3 hsa-let-7a-3 39394 8582.864
# 4 hsa-let-7b 65142 14192.642
# cross-mapped_TCGA-BA-6871-01A-11R-1872-13
# 1 N
# 2 Y
# 3 N
# 4 N# 把列名中含有count的数据提取出来
rownames(data) <- data$miRNA_ID
col <- grepl("count", colnames(data))
miRNA_count <- data[,col]
colnames(miRNA_count) <- sub("read_count_","",colnames(miRNA_count)) # gsub是去除所有匹配的字符
head(miRNA_count)[1:4,1:4]
# TCGA-BA-6871-01A-11R-1872-13 TCGA-CN-6024-01A-11R-1685-13 TCGA-IQ-7631-01A-11R-2080-13
# hsa-let-7a-1 39430 37356 78370
# hsa-let-7a-2 39178 37111 78621
# hsa-let-7a-3 39394 37080 79843
# hsa-let-7b 65142 65155 193506
# TCGA-CV-7406-01A-11R-2080-13
# hsa-let-7a-1 43002
# hsa-let-7a-2 42954
# hsa-let-7a-3 43141
# hsa-let-7b 78858
save(miRNA_count,file = paste0(proj,"_miRNA_count.Rdata"))
参考资料:
-
MicroRNA profiling: approaches and considerations. Nat Rev Genet. 2012 Apr 18;13(5):358-69.
-
microRNA functions. Annu Rev Cell Dev Biol. 2007:23:175-205.
-
miRBase数据库:https://www.mirbase.org/
-
TCGAbiolinks:https://bioconductor.org/packages/devel/bioc/vignettes/TCGAbiolinks/inst/doc/index.html https://bioconductor.org/packages/release/bioc/html/TCGAbiolinks.html
-
GDCquery: https://rdrr.io/bioc/TCGAbiolinks/man/GDCquery.html
-
生信技能树时间线:https://mp.weixin.qq.com/mp/appmsgalbum?action=getalbum&__biz=MzAxMDkxODM1Ng==&scene=24&album_id=2201138830328528899&count=3&uin=&key=&devicetype=iMac+Mac14%2C7+OSX+OSX+14.6.1+build(23G93)&version=13080810&lang=zh_CN&nettype=WIFI&ascene=0&fontScale=100
-
生信技能树B站视频:https://www.bilibili.com/video/BV1zK411n7qr/?vd_source=3a13860df939bc922ad1fd6099e42c1d
-
生信技能树:https://mp.weixin.qq.com/s/847Zc6QbU44LSL3l_STSpg https://mp.weixin.qq.com/s/USc_aUA_loFLLljXzbmpFg
-
生信星球:https://www.jianshu.com/p/59e179212bdc
-
佳奥:https://www.jianshu.com/p/b7cbf0cb78ae
-
医学和生信笔记:https://zhuanlan.zhihu.com/p/556196846
-
叶子的数据科技专栏:https://cloud.tencent.com/developer/article/2245363
致谢:感谢曾老师以及生信技能树团队全体成员。
注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟
- END -
相关文章:
miRNA分析流程学习(一)/TCGAmiRNA数据下载
miRNA(microRNA) 是一种小的非编码 RNA 分子,通常由 20 到 24 个核苷酸组成。miRNA 主要存在于动植物中,并在基因表达调控中起到关键作用。它们通过与特定的信使 RNA(mRNA)分子结合来抑制基因表达ÿ…...
西南大学软件专硕考研难度分析!
C哥专业提供——计软考研院校选择分析专业课备考指南规划 西南大学软件工程学硕近三年呈现出招生规模稳定、复试线稳中有升的特点。2024届实际录取8人,复试分数线305分,复试录取率67%,相比去年复试线略有下降但仍高于2022届,显示出…...
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21 目录 文章目录 计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-21目录1. The Fair Language Model Paradox摘要研究背景问题与挑战如何解决创新点算法模型实验效果重要数据与结论推荐阅读指数&…...
安全芯片 OPTIGA TRUST M 使用介绍与示例(基于STM32裸机)
文章目录 目的资料索引硬件电路软件框架介绍数据存储框架移植框架使用 使用示例示例地址与硬件连接通讯测试功能测试 总结 目的 OPTIGA TRUST M 是英飞凌推出的安全芯片,芯片通提供了很多 slot ,用于存放各类安全证书、密钥、用户数据等,内置…...
【AI换装整合及教程】CatVTON:时尚与科技的完美融合
在当今数字化时代,时尚行业正经历着一场前所未有的变革,而 CatVTON 作为一款由中山大学、Pixocial 等机构联合研发的轻量化 AI 虚拟换装工具,无疑是这场变革中的璀璨明星。 一、独特的技术架构 CatVTON 基于 Stable Diffusion v1.5 inpainit…...
接口测试(七)jmeter——参数化(RandomString函数)
一、RandomString函数 需求:模拟10个用户注册 1. 【工具】–>【函数助手对话框】 2. 选择RandomString函数 假设手机号码前3位设置为固定数值136,后8位可用RandomString函数随机产生数值 ① Random string length:8(随机长度…...
simple_php
访问靶场 这里传入a和b参数,绕过三个if即可拿到flag a a a_GET[ a’ ];中是抑制报错信息的。 第一个if非常的抽象, if($a0 and $a){echo $flag1; }处理a 要输出flag1,a0,但是,在php中0被视为假也就是Flase 如果a0࿰…...
网络搜索引擎Shodan(4)
声明:学习视频来自b站up主 泷羽sec,如涉及侵权马上删除文章 声明:本文主要用作技术分享,所有内容仅供参考。任何使用或依赖于本文信息所造成的法律后果均与本人无关。请读者自行判断风险,并遵循相关法律法规。 感谢泷…...
【Flask】一、安装与第一个测试程序
目录 Flask简介 安装Flask 安装pip(Python包管理器) 使用pip安装Flask 验证安装 创建Flask程序 创建应用 运行 访问测试 Flask简介 Flask是一个用Python编写的轻量级Web应用框架。它被设计为易于使用和扩展,使其成为构建简单网站或复…...
R语言笔记(二):向量
文章目录 一、Data structure: vectors二、Indexing vectors三、Re-assign values to vector elements四、Generic function for vectors五、Vector of random samples from a distribution六、Vector arithmetic七、Recycling八、Element-wise comparisons of vectors九、Comp…...
信息安全工程师(71)隐私保护技术与应用
前言 隐私保护技术是指通过一系列的技术手段来保护人们的隐私不被公开泄露。随着数字化和网络化社会的发展,个人隐私的保护变得尤为重要,隐私保护技术也因此得到了广泛的应用和发展。 一、隐私保护技术概述 隐私保护技术主要包括数据加密技术、身份认证技…...
层和块学习
1.生成一个网络,其中包含一个具有256个单元和ReLU激活函数的全连接隐藏层,然后是一个具有10个隐藏单元且不带激活函数的全连接输出层。 import torch from torch import nn from torch.nn import functional as Fnet nn.Sequential(nn.Linear(20, 256)…...
Zookeeper面试整理-源码及实现细节
Zookeeper 的源码和实现细节是理解其高可用性、分布式一致性和高效性的关键。以下是 Zookeeper 的核心实现细节,涵盖其架构、关键模块、以及具体的代码实现机制。 1. Zookeeper 架构 Zookeeper 采用 Leader-Follower 架构,集群由多个节点组成。主要分为三种角色:Leader、Fol…...
岭回归的MATLAB步骤
MATLAB 实现框架,它涵盖了从数据导入到岭回归的步骤,包括计算共线性、使用 MAE、MSE、R、MAPE 进行评价,以及绘制相应的可视化图表。 1. 数据导入 首先,导入你的 Excel 文件 data.xlsx。假设前面的列是因变量(特征&a…...
智能指针(unique_ptr,shared_ptr,weak_ptr)
在实际的C开发中,我们经常会遇到诸如程序运行中突然崩溃,程序运行所用内存越来越多最终不得不重启等问题,这些问题往往都是内存资源管理不当造成的(内存泄漏) 比如: 有些内存资源已经被释放,但指向它的指针并没有改变指…...
Sql执行较慢的排查方式
SQL执行较慢的排查方式涉及多个方面,包括检查SQL语句本身、数据库配置、硬件资源等。以下是一些具体的排查步骤和优化建议: 一、检查SQL语句 启用慢查询日志: 大多数数据库管理系统(如MySQL、PostgreSQL)都支持慢查询…...
CesiumJS 案例 P6:添加图片图层、添加图片图层并覆盖指定区域
CesiumJS CesiumJS API:https://cesium.com/learn/cesiumjs/ref-doc/index.html CesiumJS 是一个开源的 JavaScript 库,它用于在网页中创建和控制 3D 地球仪(地图) 一、添加图片图层 <!DOCTYPE html> <html lang"…...
Python画笔案例-094 绘制 神奇彩条动画
1、绘制 神奇彩条动画 通过 python 的turtle 库绘制 神奇彩条动画,如下图: 2、实现代码 绘制 神奇彩条动画,以下为实现代码: """神奇彩条动画.py一个用海龟画图的图章功能配合颜色渐变和动画原理做成的动画。 """ from random import randi…...
javaScript整数反转
function _reverse(number) { // 补全代码 return (number ).split().reverse().join(); } number :首先,将数字 number 转换为字符串。在 JavaScript 中,当你将一个数字与一个字符串相加时,JavaScript 会自动将数字转换为字符串…...
Zookeeper面试整理-故障排查和调试
在使用 Zookeeper 的过程中,可能会遇到各种问题,如性能下降、节点失效、集群不可用等。为了保持系统的稳定性和高可用性,掌握 Zookeeper 的故障排查和调试方法至关重要。以下是一些常见的故障排查技巧和调试方法: 1. 日志分析 Zookeeper 的日志是最直接的调试和故障排查工具…...
PG数据库之索引详解
PostgreSQL数据库中的索引是一种用于提高查询性能的重要数据结构。通过索引,数据库可以快速定位到表中的特定行,而无需进行全表扫描。PostgreSQL支持多种索引类型,每种类型都有其特定的应用场景和性能特点。下面将详细介绍PostgreSQL中的索引…...
springboot项目测试环境构建出的依赖包比本地构建出的依赖包多
本地能够正常启动服务,但是测试环境启动报错。 上述druid是服务pom文件中之前引入的依赖包,后续由于某种原因而不需要该依赖包了,故已在pom文件中移除掉了该依赖包。 移除该依赖包之后,本地服务可正常构建和启动。 而测试环境却…...
温湿度传感器(学习笔记上)
在学习这个项目之前,我们先了解一下传感器,查阅资料可知,电路板上温湿度传感器型号是GXHTC3,是北京中科银河芯科技有限公司研发的一款芯片,采用I2C接口与ESP32-C3通信,I2C地址是0x70。 接下来我们要进行编写i2c驱动程序,首先我们复制esp-idf-v5.1.3\examples\get-started\samp…...
sv标准研读第十九章-功能覆盖率
书接上回: sv标准研读第十八章-随机化和约束 第19章 功能覆盖率 19.1 总览 -定义cover group -定义cover point -定义cross cover -cover选项 -cover系统函数和系统方法 -cover计算 19.2 概述 覆盖率广义上分为两种:功能覆盖率和工具可以自动…...
图集短视频去水印云函数开发实践——小红书
前两篇主要讲解了抖音和快手的图集短视频对去水印解析的云函数开发实践,今天说一些小红书图集解析的云函数实践。 图集短视频去水印云函数开发实践——抖音 图集短视频去水印云函数开发实践——快手 其实都是大差不差的,首先获取到小红书的分享链接&…...
Uni-App-03
登录功能开发 实现POST提交 HTTP协议规定请求消息内容类型(Content-Type)有哪些?—— 只有四种 text/plain 没有编码的普通数据 application/x-www-form-urlencoded 编码后的普通数据 multipart/form-data 请求主体中包含文件上传域 application/json 请求主体是 J…...
解决 VScode 每次打开都是上次打开的文件问题
每次使用 VScode 打开总是上次的文件,可以简单设置即可,记录一下。 VScode Visual Studio Code(简称VSCode)是一个由微软开发的免费、开源的代码编辑器。它支持多种编程语言,并提供了代码高亮、智能代码补全、代码重构…...
redis高级篇之skiplist跳表 第164节答疑
跳表查询的空间复杂度分析 比起单纯的单链表,跳表需要存储多级索引,肯定要消耗更多的存储空间。那到底需要消耗多少额外的存储空间呢? 我们来分析一下跳表的空间复杂度。 第一步:首先原始链表长度为n, 第二步:两两取首,每层索引的…...
Java 线程池:深入理解与高效应用
在 Java 并发编程中,线程池是一种非常重要的技术。它可以有效地管理和复用线程,提高系统的性能和资源利用率。本文将深入探讨 Java 线程池的概念、原理、使用方法以及最佳实践,帮助读者更好地理解和应用线程池。 一、引言 在现代软件开发中&a…...
week08 zookeeper多种安装与pandas数据变换操作-new
课程1-hadoop-Zookeeper安装 Ububtu18.04安装Zookeeper3.7.1 环境与版本 这里采用的ubuntu18.04环境的基本配置为: hostname 为master 用户名为hadoop 静态IP为 192.168.100.3 网关为 192.168.100.2 防火墙已经关闭 /etc/hosts已经配置全版本下载地址࿱…...
网站建设与管理ppt课件百度云盘/百度竞价推广自己可以做吗
大家都有这样的经历: 打开VS--〉新建应用程序(FORM1)--〉往里面挪按钮--〉双击按钮--〉写代码 这看上去那么的自然,简单&#x…...
公司微信网站建设方案/东莞seo排名优化
点击上方“后端技术精选”,选择“置顶公众号”技术文章第一时间送达!作者:jajiancnblogs.com/jajian/p/10051901.htmlJSON,全称:JavaScript Object Notation,作为一个常见的轻量级的数据交换格式࿰…...
如何把网站设为正确建设中/应用市场
欢迎关注我的公众号是【CodeAllen】,关注回复【1024】获取精品学习资源 程序员技术交流①群:736386324 ,程序员技术交流②群:371394777 nor 随机存储 速率快,内存下(可以块操作) 一般用来…...
网络维护好学吗/网站页面优化方案
GotW #04 Class Mechanics 著者:Herb Sutter 翻译:kingofark [声明]:本文内容取自www.gotw.ca网站上的Guru of the Week栏目,其著作权归原著者本人所有。译者kingofark在未经原著者本人同意的情况下翻译本文。本翻译内容仅供…...
东城手机网站建设/app拉新推广怎么做
在调研BFF的过程中,看到蚂蚁金服自研的BFF的开发框架BFF Chair是基于Egg.js开发的。BFF Chair没有开源,但是Egg.js已经开源了,如果需要引入BFF,需要基于Egg.js的基础上开发自己的BFF开发框架。 1 Egg.js是什么 Egg是一个为了开发…...
做茶道网站/网上推广平台有哪些
今天和大家分享一下win7系统IIS7站点页面无法正常显示问题的解决方法,在使用win7系统的过程中经常不知道如何去解决win7系统IIS7站点页面无法正常显示的问题,有什么好的办法去解决win7系统IIS7站点页面无法正常显示呢?小编教你只需要1、首先点…...