论文阅读:基于隐马尔可夫模型的蛋白质多序列比对方法研究
本文来自chatpaper
Basic Information:
• Title: Research on Protein Multiple Sequence Alignment Method Based on Hidden Markov Model (基于隐马尔可夫模型的蛋白质多序列比对方法研究)
• Authors: Zhan Qing
• Affiliation: Harbin Institute of Technology (哈尔滨工业大学)
• Keywords: protein multiple sequence alignment, hidden Markov model, optimization, residue substitution scoring, guide tree construction, refinement
论文简要 :
• 本研究基于隐马尔可夫模型,针对蛋白质多序列比对问题进行了研究,提出了一种优化的残基替换计分方法,并结合优化算法和配分函数计算后验概率,通过渐进式多序列比对得到较优的比对结果。
背景信息:
• 论文背景: 生物序列的相似性对于生物功能的理解非常重要,而多序列比对是发现序列相似性的常用方法之一。然而,多序列比对问题是一个NP问题,无法通过标准的动态规划算法得到最优解。因此,研究人员一直在寻找近似算法来解决这个问题。
• 过去方案: 过去的研究中,渐进式多序列比对是应用最广泛的一类近似算法。该算法通过序列之间的两两比对确定距离矩阵,并根据距离矩阵构建指导树,然后逐步构建多序列比对。然而,现有的多序列比对方法在残基的替换计分、指导树的构建和比对结果的精化等方面存在问题。
• 论文的Motivation: 针对现有多序列比对方法的问题,本研究提出了一种基于隐马尔可夫模型的蛋白质多序列比对方法。该方法通过优化残基替换计分方法,结合优化算法和配分函数计算后验概率,以得到更准确的比对结果。通过这种方法,可以提高蛋白质二级结构预测、系统发生树重建和功能推断等分析的准确性和可靠性。
方法:
• a. 理论背景:
o 本博士论文侧重于基于隐马尔可夫模型的蛋白质多序列比对方法的研究。生物序列的相似性反映了生物功能的相似性以及序列之间和共同祖先之间的遗传差异。多序列比对在生物学中被广泛应用于识别不同序列之间的同源位置。它是一种重要的建模方法,帮助生物学家区分序列中的相关区域,对于蛋白质二级结构预测、系统发育树重建和通过蛋白质域比较进行功能推断具有重要意义。本研究解决了多序列比对的问题,这是一个NP问题,无法通过标准的动态规划算法进行最优求解。渐进式多序列比对是最常用的近似算法类别,它首先通过成对比对确定序列之间的距离矩阵,然后基于距离矩阵构建导引树。最后,根据导引树中的进化距离逐步构建多序列比对,并通过迭代改进比对结果以获得最优结果。总体而言,这种类型的近似算法通过逐步比对序列或序列谱将多序列比对问题转化为顺序成对比对问题,从而找到问题的近似解。本论文解决了现有多序列比对方法研究中的几个问题,包括残基替代评分、导引树构建和比对结果的改进。
• b. 技术路线:
o 本文提出了一种基于隐马尔可夫模型优化和组合的残基替代评分方法。该方法在成对比对的动态规划中使用残基对的后验概率作为替代评分。该方法在提高序列比对准确性方面非常有效,特别适用于低同源性的蛋白质家族。
o 本文引入了一种自适应导引树构建方法,根据蛋白质序列之间的相似度程度使用不同的隐马尔可夫模型构建导引树,以解决当前固定导引树构建方法的局限性。比对的顺序很重要,所提出的方法改善了比对的准确性,特别适用于低同源性的蛋白质家族。
o 此外,本文提出了一种基于垂直分割的重新比对改进方法,解决了当前只考虑水平分割的方法的局限性。实验结果表明,该方法提高了比对结果的准确性,特别适用于具有长氨基/羧基端延伸的蛋白质家族。
o 最后,本文提出了一种综合融合的多序列比对方法,根据蛋白质家族的同源性使用不同的模型和技术进行融合。该方法使用粒子群优化、隐马尔可夫模型和分区函数模型处理低同源性的家族,使用局部和全局隐马尔可夫模型处理高同源性的家族。然后,使用基于垂直分割的重新比对改进方法对比对结果进行改进。实验结果表明,该综合融合方法全面提高了序列比对的准确性,并为下游生物学分析提供了更可靠的基础。
结果:
• a. 详细的实验设置:
o 本文的实验设置包括使用不同的蛋白质家族数据集进行测试,比较不同方法的性能。对于残基替代评分方法,使用隐马尔可夫模型优化和组合的方法进行评估。对于导引树构建方法,使用不同的隐马尔可夫模型根据蛋白质序列的相似度构建导引树。对于重新比对改进方法,使用具有长氨基/羧基端延伸的蛋白质家族进行测试。最后,使用综合融合的多序列比对方法对不同同源性的蛋白质家族进行比对,并使用基于垂直分割的重新比对改进方法对比对结果进行改进。
• b. 详细的实验结果:
o 实验结果表明,本文提出的残基替代评分方法在提高序列比对准确性方面非常有效,特别适用于低同源性的蛋白质家族。自适应导引树构建方法改善了比对的准确性,特别适用于低同源性的蛋白质家族。基于垂直分割的重新比对改进方法提高了比对结果的准确性,特别适用于具有长氨基/羧基端延伸的蛋白质家族。综合融合的多序列比对方法全面提高了序列比对的准确性,并为下游生物学分析提供了更可靠的基础。
论文原址:http://cdmd.cnki.com.cn/Article/CDMD-10213-1020401233.htm
参考:https://chatwithpaper.org/
相关文章:
论文阅读:基于隐马尔可夫模型的蛋白质多序列比对方法研究
本文来自chatpaper Basic Information: • Title: Research on Protein Multiple Sequence Alignment Method Based on Hidden Markov Model (基于隐马尔可夫模型的蛋白质多序列比对方法研究) • Authors: Zhan Qing • Affiliation: Harbin Institute of Technology (哈尔滨工…...
Vim同时打开多个文件
分屏模式 在 Vim 中,可以同时打开多个文件并使用分屏模式来查看它们。以下是一些常见的方法和命令: 在启动 Vim 时打开多个文件 使用 -o 选项打开文件并水平分屏: vim -o file1.txt file2.txt使用 -O 选项打开文件并垂直分屏: v…...
SpringCloudStreamkafka接收jsonarray字符串失败
文章目录 场景现象问题处理 场景现象 kafka作为消息队列,作为前端设备数据到后端消费的渠道,也被多个不同微服务消费一个服务与前端边缘计算设备建立socket消息,接收实时交通事件推送,再将事件发送到kafka里面。此处使用的是Spri…...
面向对象特性分析大全集
面向对象特性分析 先进行专栏介绍 面向对象总析前提小知识分类浅析封装浅析继承浅析多态面向对象编程优点abc 核心思想实际应用总结 封装概念详解关键主要目的核心思想优点12 缺点12 Java代码实现封装特性 继承概念详解语法示例关键主要目的核心思想优点12 缺点12 Java代码实现…...
【数据结构】队列和栈
大家中秋节快乐,玩了好几天没有学习,今天分享的是栈以及队列的相关知识,以及栈和队列相关的面试题 1.栈 1.1栈的概念及结构 栈:一种特殊的线性表,其只允许在固定的一端进行插入和删除元素操作。进行数据插入和删除操作…...
WordPress主题开发( 十)之—— 条件标签函数(上)
这里写目录标题 什么是条件标签函数?条件标签函数的使用场景使用条件标签函数的注意事项常用的条件标签函数主页示例:is_front_page() 示例:管理后台is_admin() 示例:单个文章页面is_single() 示例:is_single(17) 示例:is_single(Hello World) 示例:is_single(hello…...
vue学习-10vue整合SpringBoot跨域请求
在Vue.js应用整合Spring Boot后端时,需要处理跨域请求。跨域请求通常发生在前端应用运行在不同的域名或端口上时,而后端服务运行在不同的域名或端口上。以下是一种处理跨域请求的常见方式: 后端(Spring Boot)配置 在…...
ElasticSearch - 基于 JavaRestClient 查询文档(match、精确、复合查询,以及排序、分页、高亮)
目录 一、基于 JavaRestClient 查询文档 1.1、查询 API 演示 1.1.1、查询基本框架 DSL 请求的对应格式 响应的解析 1.1.2、全文检索查询 1.1.3、精确查询 1.1.4、复合查询 1.1.5、排序和分页 1.1.6、高亮 一、基于 JavaRestClient 查询文档 1.1、查询 API 演示 1.1.…...
简易实现通讯录(2.0)
这篇文章是在上期实现的通讯录基础上,增加了自动增容的功能,也解决了一开始通讯录自动开辟一个空间,可能会浪费空间,或者是信息过多无法增容的痛点,由于我们使用的是malloc这类函数来开辟空间,我们也需要来…...
Jasypt 实现自定义加解密
如下文章已经讲解了, Jasypt 是什么,怎么集成 Jasypt,怎么使用 Jasypt。 Jasypt 开源加密库使用教程_jasyptstringencryptor-CSDN博客Jasypt 加密框架概述1、Jasypt Spring Boot 为 spring boot 应用程序中的属性源提供加密支持,…...
Leetcode 554. 砖墙
文章目录 题目代码(9.25 首刷自解) 题目 Leetcode 554. 砖墙 代码(9.25 首刷自解) class Solution { public:int leastBricks(vector<vector<int>>& wall) {unordered_map<int, int> mp;int count 0;for…...
Python 内置函数详解 (3) 进制转换
近期在外旅游,本篇是出发前定时发布的,不完整,旅游回来后再补充。 Python 内置函数 Python3.11共有75个内置函数,其来历和分类请参考:Python 新版本有75个内置函数,你不会不知道吧_Hann Yang的博客-CSDN博客 函数列表 abs aiter all …...
SPSS列联表分析
前言: 本专栏参考教材为《SPSS22.0从入门到精通》,由于软件版本原因,部分内容有所改变,为适应软件版本的变化,特此创作此专栏便于大家学习。本专栏使用软件为:SPSS25.0 本专栏所有的数据文件可在个人主页—…...
聊聊并发编程——并发容器和阻塞队列
目录 一.ConcurrentHashMap 1.为什么要使用ConcurrentHashMap? 2.ConcurrentHashMap的类图 3.ConcurrentHashMap的结构图 二.阻塞队列 Java中的7个阻塞队列 ArrayBlockingQueue:一个由数组结构组成的有界阻塞队列。 LinkedBlockingQueue…...
我庄严承诺终生不去承德旅游
虽然人微言轻,但也要尽一份力。 在此,我庄严承诺: 如果承德相关机构不返还那名"灵活就业人员"105.82万元的财产,并进行公开道歉。 我将终生不去承德旅游, 我将终生不买承德出产的任何产品。 我还将劝诫我…...
【python】python实现杨辉三角的三种方法
文章目录 1.杨辉三角介绍:2.方法一:迭代3.方法二:生成器4.方法三:递归 1.杨辉三角介绍: 杨辉三角是一种数学图形,由数字排列成类似三角形的形状。它的每个数值等于它上方两个数值之和。这个三角形的形状可以…...
GitHub 基本操作
最近要发展一下自己的 github 账号了,把以前的项目代码规整规整上传上去,这里总结了一些经验,经过数次实践之后,已解决几乎所有基本操作中的bug,根据下面的操作步骤来,绝对没错了。(若有其他问题…...
Docker和Docker compose的安装使用指南
一,环境准备 Docker运行需要依赖jdk,所以需要先安装一下jdk yum install -y java-1.8.0-openjdk.x86_64 二,Docker安装和验证 1,安装依赖工具 yum install -y yum-utils 2,设置远程仓库 yum-config-manager --add-r…...
51单片机控制电动机正反转,PWM调速,记录转动圈数。
今天的实验需要用到的材料有:51单片机最小系统,4X4的矩阵键盘,DC直流6V-12V带编码器电机,L298N模块,一个led小灯。下面把产品截图展示一下: 单片机就不展示了,都一样,下面是接线图&a…...
JAVA学习(方法的定义和调用)
一、方法的定义和调用 1、关键词:static表示静态方法,如没有返回值使用void,方法名前使用类型,例如int、float等; /*** 测试方法的定义和调用*/public class TestMethod {public static void main(String[] args) {a…...
Linux(CentOS/Ubuntu)——安装nginx
如果确定你的系统是基于CentOS或RHEL,可以使用以下命令: ①、安装库文件 #安装gcc yum install gcc-c#安装PCRE pcre-devel yum install -y pcre pcre-devel#安装zlib yum install -y zlib zlib-devel#安装Open SSL yum install -y openssl openssl-de…...
26962-2011 高频电磁场综合水处理器技术条件
声明 本文是学习GB-T 26962-2011 高频电磁场综合水处理器技术条件. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了高频电磁场综合水处理器(以下简称处理器)的术语和定义、分类和型号、结构型式、 要求及检验、标志、包装和贮运…...
图扑软件受邀亮相 IOTE 2023 国际物联网展
IOTE 2023 国际物联网展,作为全球物联网领域的盛会,于 9 月 20 日 - 22 日在中国深圳拉开帷幕。本届展会以“IoT构建数字经济底座”为主题,由深圳市物联网产业协会主办,打造当前物联网最新科技大秀。促进物联网与各行业深度融合&a…...
C语言文件操作与管理
一、为什么使用文件 在我们前面练习使用结构体时,写通讯录的程序,当通讯录运行起来的时候,可以给通讯录中增加、删除数据,此时数据是存放在内存中,当程序退出的时候,通讯录中的数据自然就不存在了ÿ…...
蓝桥等考Python组别八级005
第一部分:选择题 1、Python L8 (15分) 运行下面程序,输出的结果是( )。 i 1 while i < 4: print(i, end ) i 1 1 2 30 1 2 31 2 3 40 1 2 3 4 正确答案:C 2、Python L8 &#…...
JUnit介绍
JUnit是用于编写和运行可重复的自动化测试的开源测试框架, 这样可以保证我们的代码按预期工作。JUnit可广泛用于工业和作为支架(从命令行)或IDE(如Eclipse)内单独的Java程序。 JUnit提供: 断言测试预期结果。 测试功能共享通用的测试数据。 测试套件轻…...
(高阶) Redis 7 第16讲 预热/雪崩/击穿/穿透 缓存篇
面试题 什么是缓存预热/雪崩/击穿/穿透如何做缓存预热如何避免或减少缓存雪崩穿透和击穿的区别?穿透和击穿的解决方案出现缓存不一致时,有哪些修补方案缓存预热 理论 将需要的数据提前加载到缓存中,不需要用户使用的过程中进行数据回写。(比如秒杀活动数据等) 方案 1.…...
(三) gitblit管理员手册
(一)gitblit安装教程 (二) gitblit用户使用教程 (三) gitblit管理员手册 目录 权限管理创建仓库时创建用户普通用户 管理员用户访问限制和访问权限仓库创建权限分配 Teams普通组管理员组 参考资料 权限管理 创建仓库时 选择指定的人员查看,克隆,推送 不允许fork 对应Anonymo…...
ESKF算法融合GNSS与IMU信息,航向角的偏差是如何逐渐影响到重力加速度g以及位置偏差的 CSDN gpt
1##############################ESKF算法融合GNSS与IMU信息,航向角的偏差是如何逐渐影响到重力加速度g以及位置偏差的 CSDN gpt 航向角的偏差会逐渐影响重力加速度和位置偏差。首先,航向角的偏差会影响重力加速度的测量值。在ESKF算法中,通过将IMU测…...
Java初始化大量数据到Neo4j中(二)
接Java初始化大量数据到Neo4j中(一)继续探索,之前用create命令导入大量数据发现太过耗时,查阅资料说大量数据初始化到Neo4j需要使用neo4j-admin import 业务数据说明可以参加Java初始化大量数据到Neo4j中(一),这里主要是将处理好的节点数据和…...
做最便宜的网站建设/网站排名
来自公众号:新世界杂货铺前言前段时间发表了Go中的HTTP请求之——HTTP1.1请求流程分析,所以这两天本来打算研究HTTP2.0的请求源码,结果发现太复杂就跑去逛知乎了,然后就发现了一个非常有意思的提问“golang 特殊字符的string怎么转…...
棠下手机网站建设报价/网络公司seo推广
准备工作 软件下载地址 VMware 14_32/64位破解版 断网系统支持win7/8/10 安装步骤 1.先使用“百度网盘客户端”下载VMware14软件安装包到电脑磁盘里,并解压缩,安装前先断开电脑网络,然后找到VMware-workstation-full-14.0.exe,…...
网站建设公司华网天下买送活动/上海网络推广
Oracle的安全措施主要有三个方面,一是用户标识和鉴定;二是授权和检查机制;三是审计技术(是否使用审计技术可由用户灵活选择);除此之外,Oracle还允许用户通过触发器灵活定义自己的安全性措施。一…...
京东云免费建wordpress/内蒙古seo
一、面向对象编程 面向过程编程:关注于解决问题的方法、步骤。 面向对象编程:关注于谁能解决问题(类),以及解决问题需要的数据(成员变量),以及解决问题需要的技能(成员函数)。 抽象:想象出一个能解决问题的…...
html5 mysql 网站开发/网络推广公司方案
嵌入式数据库SQLite的编译、安装和使用下文介绍的内容都是基于 RedHat Linux 9.0 平台的。引言:sqlite简介sqlite是嵌入式SQL数据库引擎SQLite(SQLite Embeddable SQL Database Engine)的一个扩展。SQLite是一个实现嵌入式SQL数据库引擎小型C语言库(C library)&…...
越南人一般去哪个网站做贸易/谷歌seo一个月费用需要2万吗
写这个简单的正则匹配呢,主要是让大家可以参考取自己文本中想要的东西,比如我现在的文本内容是这样的 我想要把<Sentiment>和</Sentiment>之间的neg和pos提取出来,文件基本操作参考上一篇python中使用文件的读取和简单正则使用&a…...