科研人必看入门攻略(收藏版)
来源:投稿 作者:小灰灰
编辑:学姐
本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。
1.如何做科研
1.1 选方向
当我们刚步入科研的第一步时,首选就要选择课题和方向,那么面对实验室很多项目和课题,一般选择方向需要一定的积累,而且很多题目风险性很高,所以要做的就有两个点,一个是多跟老师讨论,还有一个笨方法就是关注一下目前最顶级的研究机构,关注目前的主流模型,他们在做什么,那么我们就可以选择这个方向,并且实时监控他们的科研进展。
那么方向有了,那么就可以关注一些顶级会议的方向:
-
IR(信息检索):人工智能领域智能信息检索方向最权威的顶级国际会议(SIGUIR),国际计算机学会信息与知识管理大会(CIKM)
-
NLP(自然语言处理):ACL,NAACL,EMNLP,IJCNLP
-
ML&AI:NeurIPS
-
DM(数据挖掘):知识发现与数据挖掘顶级会议(SIGKDD)
-
CV(计算机视觉):ICCV、CVPR、 AAAI
-
……
1.2 查找文献
知道了顶级会议的方向,那么就是如何找参考文献了,选择好方向之后,想要更快的知道本领域的研究内容:
-
可以先从中文综述入手找到合适的英文论文
-
对知识点的理解,可以借助知乎,csdn等平台巩固知识点
-
文献的下载可以使用google scholar,百度学术去查找,一般最新的论文一般百度学术检索不到
-
从论文找论文
-
从被引论文找相关论文
一般推荐几个网站:
https://paperswithcode.com/ ---查看论文是否有代码的网站
https://www.aminer.cn/ ---由清华大学计算机科学与技术系建立,收录了sci,ccf优秀论文
https://www.semanticscholar.org/ ---语义学者(Semantic Scholar)是由微软联合创始人 Paul Allen 做的免费学术搜索引擎。
当然也可以从本校的图书馆进去查找相关文献。
1.3 读文献
1.那么我们查找了好多文献,下载了很多,读不懂怎么办呢,首先可以和师兄,老师整理一下,本领域的单词,同时也可以看下b站上,有关读论文的一些视频,比如李沐的视频:https://www.bilibili.com/video/BV1H44y1t75x/?spm_id_from=333.337.search-card.all.click
2.平时不断积累本领域的一些方法,模型
3.从论文中找到本论文中是根据哪篇论文中的研究点,解决了哪些问题。
1.4 建立模型
那么论文大概读懂了,怎么落实行动,依靠代码实现出来呢?就要建立模型。初学者建议从工具使用入手熟悉模型的输入输出,逐渐了解模型背后的原理,对于特定的问题进行整理代码。
那么拿到一篇论文,我们要做好复现,对于初学者就是找到有代码的论文,理清从数据到模型一系列的输入输出数据流,选择自己的工具(pytorch,tensorflow)搭建简单的模型框架,这个过程一定要亲自动手,进行搭积木,从而了解模型背后的数学原理,尤其对一些常用的模型了解背后的数学原理,做到魔改,尤其是本方向的特定任务,要非常熟悉,从而进行创新。
1.5 设计实验
一般读论文开始要格外关注实验的设计,评测指标是否选择合理,在跑实验的时候,发现效果不好,要思考,为什么不好,是什么原因导致这种效果,你选择的模型的假设是否和数据有什么冲突,特别是面对效果很好的时候要稍加注意。
不要放弃,如果做不下去,说不定可以找到一些衍生的点。一定要总结,发现问题。
1.6 如何写论文
那么实验有了,要整理实验,准备写论文,写好论文
-
首先要逻辑过关,保证基本的语法,找出研究领域内的高频词,常用词和通用词,可以做一次系统性的语法学习
-
大量阅读论文,摘抄经典句子,通用句子,优美句子,可以先不要看摘要,练习复写摘要
-
可以先给老师讲清楚创新点,防止出现逻辑的一些突然转折,不清楚的问题。
2.日常内功修炼
2.1 读论文
从大量的论文中,分析出粗读论文和精读论文,一般每周精读3-5篇相关论文。那么要读到什么地步呢,就要从一篇论文回答以下的内容:
-
记住作者的名字,进而follow
-
记住题目,主要是为了防止可以尽快找到
-
要非常容易的说出本篇论文有什么缺点,毛病
-
很容易用一句话说出本篇论文为什么新,很容易发表,他的贡献点是什么。
-
可以很容易说出和这篇论文有类似的若干篇论文
-
很容易说出本篇论文的技术细节
-
很容易说出本篇论文的实验细节
-
最难的是怎么想着把本篇论文的创新点应用到本方向。
2.2 学机器学习
-
没事可以学习机器学习的东西,决策树,SVM,了解其中的背后的数学原理,
-
经常参加学术报告
-
系统上过一门机器学习公开课
-
数学推导写出简单的笔记当作是最终的理解,可以用白板推导。
-
以代码实现为最终掌握
2.3 写代码
-
必须掌握一门语言,一般难度的模型应该三天左右可以复现
-
找一个成熟的工具包或者代码库入手进行拓展,而且练习时要做到良好的代码风格。
-
做到复用
-
一定要做到代码开源,结果能够复现就好,平时多做积累
2.4 观察数据,收集数据
-
可以清晰准确快速的了解一个数据集合和自己当前任务的关系,比如有100个实验,那么就要做100次实验吗,如果能够做到对数据了解,那么里面有的方法可以推翻,不需要做实验,或者做实验的过程中,就可以判断这个方法的好坏,清晰预判一个方法在一个数据上的正确结果,哪些方法可以适用,哪些不适应,自己一定要清楚。
-
能够发现实验结果中的一些问题,进而总结实验中的一些规律,多看一些bad case,总结规律。 总结一下,在三年或者四年的学习中,你是否具备了以下条件:
1.掌握一门编程语言,可以自己动手完成一个模型的主干框架的开发。
2.熟悉基本的机器学习基础,要做到能够白板推导出来。
3.掌握自己本方向自己之前从未做过的任务
4.能够独立发表一篇本方向的相关论文,做到独立科研
5.能够带领低年级同学做科研。
3.常见科研误区
-
不要认为ccf-a,一区的论文就是最好的,要辩证的看法,不要在于来源,学会找准创新点
-
不要认为调参能找到好结果,如果是好的方法,调参不应该很艰难
-
如果有一组参数效果很好,但是其他组参数都不太好,需要高度注意
-
不要把模型弄的过于复杂,要想办法提取核心的创新点。
-
不要搭积木,一个好的创新点要好于三个分散的创新点。
-
在投稿前都应该问一下,本文在这个工作中解决了什么问题,技术创新是什么,别人读了会有什么收获。
-
学会讲故事,营造问题。
4.赏析好论文
可以以Language Models are Unsupervised Multitask Learners 和 Language Models are Few-Shot Learners 这两篇论文自己赏析一下,找到好的句子,温故知新。
关注下方《学姐带你玩AI》🚀🚀🚀
论文资料+比赛方案+面试经验all in
码字不易,欢迎大家点赞评论收藏!
相关文章:
科研人必看入门攻略(收藏版)
来源:投稿 作者:小灰灰 编辑:学姐 本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。 1.如何做科研 1.1 选方向 当我…...
第5章 循环和关系表达式
1. strcmp()//比较字符串数组是否相等| string 可以直接用“”来判断 char word[5] "aaaa"; strcmp(word,"aaab");//相同输出0,不同输出1; 2. 延时函数 #include<ctime>float sec 2.3;long delay sec*CLOCKS_PER_SEC;long start c…...
Scalable Vector Graphics (SVG)中的svg、clipPath、mask元素
Scalable Vector Graphics (SVG)是一种用于描述二维向量图形的XML基础标记语言。使用SVG可以实现丰富的图形效果,而不需要像使用位图那样考虑分辨率和像素密度的问题,可以在不同设备上展示出相同的高质量图像。 在SVG中,除了基本形状如circl…...
Java基础(十五)集合框架
1. 集合框架概述 1.1 生活中的容器 1.2 数组的特点与弊端 一方面,面向对象语言对事物的体现都是以对象的形式,为了方便对多个对象的操作,就要对对象进行存储。另一方面,使用数组存储对象方面具有一些弊端,而Java 集合…...
安装gitea
1、安装包(gitea-1.13.1-linux-amd64)上传到服务器,并添加执行权限 链接:https://pan.baidu.com/s/1SAxko0RhVmmD21Ev_m5JFg 提取码:ft07 chmod x gitea-1.13.1-linux-amd64 2、执行 ./gitea-1.13.1-linux-amd64 web…...
Java异常处理传递规范总结
java 异常分类 Thorwable类(表示可抛出)是所有异常和错误的超类,两个直接子类为Error和Exception,分别表示错误和异常。其中异常类Exception又分为运行时异常(RuntimeException)和非运行时异常, 这两种异常有很大的区别…...
2d俯视视角游戏,可以切换多种枪械
文章目录 一、 介绍二、 人物移动、鼠标控制转向三、子弹脚本四、子弹随机抛壳五、 爆炸特效六、 发射子弹七、 子弹、弹壳对象池八、 散弹枪九、 火箭弹、发射火箭十、 下载工程文件 一、 介绍 2d俯视视角游戏。 人物视角跟随鼠标移动 多种枪械 抛壳效果 多种设计效果 对象池…...
大四的告诫
保研/考研方向就绩点,(各种)比赛,(考研)刷题为主 工作就算法(比赛),项目,实习为主 👂 LOCK OUT - $atori Zoom/KALONO - 单曲 - 网易云音乐 &…...
滚珠螺杆在设备上的应用
滚珠螺杆跟直线导轨一样,是很多机械设备上不可或缺的重要部件,它是确保机器能够具备高加工精度的前提条件,因此本身对于精度的要求也相当地高。今天,我们就来了解一下滚珠螺杆在不同设备上的应用吧! 1、大型的加工中心…...
Day41线程同步
线程同步 案例:三个窗口卖100张票 //定义一个类SellTicket实现Runnable接口,定义成员变量100张票 public class SellTicket implements Runnable{private int tickets 100;//重写run方法Overridepublic void run(){while (true){ //没有票后&…...
设计模式之享元模式
参考资料 曾探《JavaScript设计模式与开发实践》;「设计模式 JavaScript 描述」享元模式设计模式之享元模式Javascript 设计模式 - 享元模式 定义 享元模式的英文叫:Flyweight Design Pattern。享元设计模式是用于性能优化的模式,这种设计…...
【GAMES101】05 Rasterization(Triangles)
光栅化过程:将一系列变换后的三角形转换为像素的过程。 三角形在图形学中得到很多的应用。 最基础的多边形(边数最少)。任何多边形都可以拆成三角形。性质:三角形内部一定是平面的。三角形内外部定义非常清楚。定义三个顶点后&a…...
13. Pod 从入门到深入理解(二)
本章讲解知识点 Pod 容器共享 VolumeConfigMapSecretDownward APIEmptyDir VolumeHostPath Volume1. Pod 容器共享 Volume 1.1. Volume 的背景及需要解决的问题 存储是必不可少的,对于服务运行产生的日志、数据,必须有一个地方进行保存,但是我们的容器每一次重启都是“恢复…...
ORBBEC(奥比中光)AstraPro相机在ROS2下的标定与D2C(标定与配准)
文章目录 1.rgb、depth相机标定矫正1.1.标定rgb相机1.2.标定depth相机1.3.rgb、depth相机一起标定(效果重复了,但是推荐使用)1.4.取得标定结果1.4.1.得到的标定结果的意义 1.5.IR、RGB相机分别应用标定结果1.5.1.openCV应用标定结果1.5.2.ros…...
常量与变量:编程中重要的两种数据类型
常量与变量 在编程中,我们常常需要存储一些数据。这些数据有些是恒定不变的,有些却是可以随时变化的。对于恒定不变的数据,我们称之为常量;对于可以变化的数据,我们则称之为变量。这两种数据类型在程序中非常重要&…...
( 数组和矩阵) 287. 寻找重复数 ——【Leetcode每日一题】
❓287. 寻找重复数 难度:中等 给定一个包含 n 1 个整数的数组 nums ,其数字都在 [1, n] 范围内(包括 1 和 n),可知至少存在一个重复的整数。 假设 nums 只有 一个重复的整数 ,返回 这个重复的数 。 你…...
【学习笔记】「JOISC 2022 Day2」复制粘贴 3
看了正解。我觉得很厉害。虽然用减枝水过去了。 区间 d p dp dp。但是这个转移怎么看都不是 O ( 1 ) O(1) O(1)的。 border \text{border} border 那么 trick \text{trick} trick应该都能看出来。能进行剪切操作当且仅当 s [ l , p ] s [ q , r ] s_{[l,p]}s_{[q,r]} s[l,p]…...
武忠祥老师每日一题||定积分基础训练(三)
常用的基本不等式: sin x < x < t a n x , x ∈ ( 0 , π 2 ) \sin x<x<\ tan x,x\in(0,\frac{\pi}{2}) sinx<x< tanx,x∈(0,2π) e x ≥ 1 x , x ∈ ( − ∞ , ∞ ) e^x\ge1x,x\in(-\infty,\infty) ex≥1x,x∈(−∞,∞) x 1 x ≤ ln …...
Docker安装常用软件-Apollo(有问题)
零:apollo概念介绍 官网网站:GitHub - apolloconfig/apollo: Apollo is a reliable configuration management system suitable for microservice configuration management scenarios. gitee网址:mirrors / ctripcorp / apollo GitCode …...
f(x)与|f(x)|,f ‘ (x),F(x)常见关系。
1.f(x)与|f(x)|关系。 1.连续关系。(f(x)在"[a,b]上连续" > |f(x)|在"[a,b]连续") ①如果f(x)在[a,b]上连续。则|f(x)|在[a,b]上连续. (因为f(x)在x0的连续点>x0必为|f(x)|的连续点) 注:”[a,b]连续“包括&#…...
今天面了一个来字节要求月薪23K,明显感觉他背了很多面试题...
最近有朋友去字节面试,面试前后进行了20天左右,包含4轮电话面试、1轮笔试、1轮主管视频面试、1轮hr视频面试。 据他所说,80%的人都会栽在第一轮面试,要不是他面试前做足准备,估计都坚持不完后面几轮面试。 其实&…...
如何使用二元三次回归分析建立预测模型?(分析、原理、代码示例)
二元三次回归是一种用于建立两个自变量与一个因变量之间关系的回归模型,常用于数据分析和预测。下面我会更详细地解释一下二元三次回归的原理、分析和示例代码。 1、原理 二元三次回归分析用多项式回归建立预测模型,其中包括两个自变量(通常…...
面向万物智联的应用框架的思考和探索(上)
原文:面向万物智联的应用框架的思考和探索(上),点击链接查看更多技术内容。 应用框架,是操作系统连接开发者生态,实现用户体验的关键基础设施。其中,开发效率和运行体验是永恒的诉求,…...
《Python机器学习基础教程》第1章学习笔记
目录 第1章 引言 1.1 为何选择机器学习 1.1.1 机器学习能够解决的问题 第1章 引言 机器学习又称为预测分析或统计学习,是一个交叉学科,是从数据中提取知识。 1.1 为何选择机器学习 智能应用早期,使用专家设计的规则体系来设计。 缺点&…...
ClickHouse 内存管理是如何实现的
概述 本文介绍Clickhouse内存管理的实现原理。通过本文的分析,可以对Clickhouse的内存管理有一个概要的理解。 Clickouse内存管理组成 ClickHouse 使用内存管理系统来控制内存资源的分配和释放。内存管理系统的主要组成部分是: 内存池:Cl…...
docker容器技术
什么是docker Docker 使用 Google 公司推出的 Go 语言 进行开发实现,基于 Linux 内核的 cgroup,namespace,以及 OverlayFS 类的 Union FS 等技术,对进程进行封装隔离,属于 操作系统层面的虚拟化技术。由于隔离的进程独…...
设计模式七大设计原则
文章目录 1、什么是设计模式2、单一职责原则3、开闭原则4、接口隔离原则5、依赖倒置原则6、迪米特法则(最少知道原则)7、里式替换原则8、组合优于继承 设计模式主要是为了满足一个字 变,这个字,可能是需求变更、可能是场景变更&a…...
【Hello Network】TCP协议相关理解
作者:小萌新 专栏:网络 作者简介:大二学生 希望能和大家一起进步 本篇博客简介:补充下对于TCP协议的各种理解 TCP协议相关实验 TCP相关试验理解CLOSE_WAIT状态理解TIME_WAIT状态解决TIME_WAIT状态引起的bind失败的方法理解listen的…...
实施CRM目标有哪几步?如何制定CRM目标?
在当今竞争激烈的商业环境中,与客户建立持久的关系是企业重要的工作。CRM客户管理系统能有效帮助企业管理优化流程、管理客户,提高销售成功率,推动收入增长。那么您了解如何实施CRM吗?下面说说实施CRM目标是什么,如何设…...
船舶建造概论(船舶建造工艺任务与现代造船模式)
船舶建造概论 1 船舶建造概论1.1 船舶建造工艺主要任务1.2 船舶建造流程(1)钢材料预处理(2) 钢材料加工(3)分段制作(4)总段制作(5)船台合拢(6&…...
在微信中做网站/做百度推广多少钱
1.概念: 一个完整的JavaScript实现应该由以下三个部分构成:ECMAScript、DOM、BOM. ECMAScript: ES规定了JS的变成语法和基础核心知识,是所有浏览器厂商都遵守的JS语法工业标准。 DOM: 文档对象模型(Document Object Model…...
东莞营销商城网站建设/服装品牌策划方案
实际操作步骤: 输入brew install nginx-full --with-rtmp-module命令出现以下报错: 需要先安装nginx服务器,运行命令brew tap homebrew/nginx,出现报错: 换一个github项目,即运行命令brew tap denji/nginx …...
php网站插件/怎么创建网站的快捷方式
通常修改网卡物理MAC地址的方法是通过软件信息的方法来实现,当然也可直接修改网卡ROM信息来实现修改地址的方法。在此学习啦小编就与大家分享一下修改笔记本MAC地址的方法。修改笔记本的物理地址的方法首先,我们需要了解当前的物理MAC地址。点击“开始”…...
招标网站免费平台/牛推网络
原文在此:http://blog.golang.org/2011/03/gobs-of-data.html,来自 Golang 官方博客。 Gob 是 Golang 的包中带的一个数据结构序列化的编/解码工具。在实际应用中,已经有不少的编解码工具/包/库了,为什么 Golang 还要新开发一个 …...
如何使用二级域名做网站/网络销售培训
本文主要介绍移动和嵌入式系统中的可信计算,包含TCG 与其标准和解决方案、可信平台模块、嵌入式系统安全与可信和硬件安全模块相关内容。 本文来自实验室孙伊凡的学习笔记 移动和嵌入式系统中的可信计算 1.1 背景与现状 标准计算平台的安全性匮乏问题自70年代早期…...
宠物网站素材/文案发布平台
提问嘉宾: 盛国军,上海麦考林信息科技有限公司首席架构师。曾历任8848软件架构师、光芒国际磊客中国技术总监。具有10年互联网和电子商务开发经验,5年软件架构师经验,3年两千万美金投资的大型网站技术总监管理经验。 回答嘉宾&…...