数学建模经验【更新中】
数学建模简单入门
一、 分工
3人,1人论文,1人代码主力,1人论文+代码(前一半时间主代码,后一半时间主论文)
Tips: 不养闲人,论文必须要在对代码和题目极其了解并且能跟上队友思路的情况下才能写好,混子是写不来的。
二、时间安排
day1 18:00
day5 8:00或9:00,一般day4晚上就完成
第一天拿到题目,一般是审题,选题,第一天的任务就是把题目定下来
不要急着做题,中途发现做不出来换题,非常浪费时间。
论文千万不要憋到最后写。一般是定下来题目就可以开始写题目概述之类的部分了
一般除非三个人实力都非常强,否则至少熬夜1天
一般选在最后一晚通宵搞论文,因为其他时间通宵会影响第二天效率
三、审题
题目一般分为
- 数据分析
- cv题(图像处理)
- 物理题
- 规划题
- …
一般来说,最多选的都是数据分析题。但是如果对其它几类问题更为擅长,也可以选择。
四、做题技巧
4.0 数据预处理
数据预处理相当重要,甚至可能比后续方法的选择更重要。首先拿到数据,先要了解每一列的含义。不同列的数据有不同含义。
比如有的列,空可能为缺失值。但有的列,可能空代表0。
有的列0,1可能代表数值,有的列0,1,2…可能代表颜色种类等类别信息。
对于缺失值,一般要做处理。通常处理方式如下:
- 填0
- 平均值填充
- 众数填充
- 直接删去
有些列,数量级不一样。比如前一列为类似2.7这样的小数,而后一类数据则以百万为单位。
这样的数据一般要做归一化处理。
对于类别变量,比如《多、少》、《红色、蓝色》、《A类、B类、C类》等等
一般要使用**独热向量(One Hot)**进行编码,才能运用到模型中。
对于要预测的内容,一般要与其它列做关联性分析。比如要预测明天天气质量指数,我们手头有温度、湿度、经纬度、以及一氧化碳、二氧化碳等等数十种指标,这个时候我们一般要筛选部分指标,而筛选的依据就是这些指标与我们要预测的内容之间的关联程度。关联性分析一般有以下方法:
- 皮尔逊系数、
- 斯皮尔曼系数、
- 卡方检验
- …
有些方法只适用于定量数据的关联性分析,不能用于定性数据,所以需要了解该方法后再进行正确选择。
也可以使用PCA降维的方式,使用已有特征构建新特征。
如果有图像题(CV),就要使用数据增强等方式进行预处理。
4.1 回归问题
回归问题一般题干中是让你对某些指标进行精确值的预测等等,也有可能表达的比较隐晦。
比如降雨量的预测、天气的预测、动物数量的预测、温度的预测等等。
一般分为传统机器学习、深度学习以及线性插值三种方式。
线性插值:
- 最小二乘法
- 插值拟合
- 其它拟合方式
机器学习
- 岭回归
- 决策树回归(回归树)
- knn回归
- xgboost回归
- 其它回归模型
深度学习
- bp神经网络
- 卷积神经网络(CNN)
- 循环神经网络(RNN、LSTM、GRU)
- 其它神经网络
一般可以使用寻优算法进行参数寻优(调节超参数),常用算法:
- 遗传算法
- 模拟退火算法
- 其他优化算法
正确率视题目而定,在数据量大的情况下,至少能达到95%以上算优。
数据量小,就选择传统插值回归;数据量大,深度学习和机器学习模型的效果就会好一些。
4.2 分类问题
一般是题目中问你一些定性的问题,比如未来是否会下雨、关键词《是否、什么颜色、什么类别》等等。有时会比较隐晦。
常用的分类方法:
- kmeans
- knn
- 决策树
- 神经网络(CNN、RNN、BP)
- logistic
- 支持向量机
- XGBOOST
- 其它分类模型
一般可以使用寻优算法进行参数寻优(调节超参数),常用算法:
- 遗传算法
- 模拟退火算法
- 其他优化算法
正确率视题目而定,在数据量大的情况下,至少能达到95%以上算优。
数据量小,就选择传统插值回归;数据量大,深度学习和机器学习模型的效果就会好一些。
4.3 评价问题
一般使用Topsis,或查阅文献中相关权威评价方式,切忌主观定义评价法。你认为的好不一定是好。
4.4 优化问题
不太了解,一般不是我做,链接↓
数学建模 优化问题——数学规划_数学建模优化问题_斌狗的博客-CSDN博客
4.5 其它问题
见招拆招。比如灵敏性分析,一般要得较好的奖项必须要做,通常通过向数据集中添加噪音等方式进行实现。
又比如2020年的供货商问题,可以使用优化问题的思路。
这种一般是经验来看了,没什么太好的方法,也可以在建模时添加一些发答案的群,把他们的答案当做参考,但是不要抄,一般不靠谱。
五、论文写作技巧
相关文章:
数学建模经验【更新中】
数学建模简单入门 一、 分工 3人,1人论文,1人代码主力,1人论文代码(前一半时间主代码,后一半时间主论文) Tips: 不养闲人,论文必须要在对代码和题目极其了解并且能跟上队友思路的情况下才能写…...
【python学习笔记】:Excel 数据的封装函数
对比其它编程语言,我们都知道Python最大的优势是代码简单,有丰富的第三方开源库供开发者使用。伴随着近几年数据分析的热度,Python也成为最受欢迎的编程语言之一。而对于数据的读取和存储,对于普通人来讲,除了数据库之…...
如何获取或设置CANoe以太网网卡信息(GET篇)
CAPL提供了一系列函数用来操作CANoe网卡。但是,但是,首先需要明确一点,不管是获取网卡信息,还是设置网卡信息,只能访问CAPL程序所在的节点下的网卡,而不是节点所在的以太网通道下的所有网卡 关于第一张图中,Class节点下,有三个网卡:Ethernet1、VLAN 1.100、VLAN 1.200…...
“终于我从字节离职了...“一个年薪50W的测试工程师的自白...
我递上了我的辞职信,不是因为公司给的不多,也不是因为公司待我不好,但是我觉得,我每天看中我憔悴的面容,每天晚上拖着疲惫的身体躺在床上,我都不知道人生的意义,是赚钱吗?是为了更好…...
【Spring】八种常见Bean加载方式
🚩本文已收录至专栏:Spring家族学习 一.引入 (1) 概述 关于bean的加载方式,spring提供了各种各样的形式。因为spring管理bean整体上来说就是由spring维护对象的生命周期,所以bean的加载可以从大的方面划分成2种形式ÿ…...
第五回:样式色彩秀芳华
import matplotlib as mpl import matplotlib.pyplot as plt import numpy as np第五回详细介绍matplotlib中样式和颜色的使用,绘图样式和颜色是丰富可视化图表的重要手段,因此熟练掌握本章可以让可视化图表变得更美观,突出重点和凸显艺术性。…...
关于@Test单元测试
1、关于doReturndoReturn(new Test()).when(testService).updateStatusByLock(any(), any());在单元测试里这个方法可以执行到这里之间跳过不去执行,返回你想要的返回值2、关于givengiven(user.getName(any())).willReturn("张三");在单元测试里这个方法 …...
【项目实战】WebFlux整合r2dbc-mysql实战
一、背景 Webflux虽然是响应式的,但是没办法,JDBC是基于阻塞IO实现的,所以无法真正的威力发挥不出来。 但是,Webflux一旦整合了R2DBC之后,那么它将不再受限于数据库连接了,真正打通了响应式应用的任督二脉,性能才被释放。 当然,除了Spring推出的R2DBC协议,还有Orac…...
go版本分布式锁redsync使用教程
redsync使用教程前言redsync结构Pool结构Mutex结构acquire加锁操作release解锁操作redsync包的使用前言 在编程语言中锁可以理解为一个变量,该变量在同一时刻只能有一个线程拥有,以便保护共享数据在同一时刻只有一个线程去操作。对于高可用的分布式锁应…...
大数据之Hudi数据湖_大数据治理_简介_发展历史_特性_应用场景---大数据之Hudi数据湖工作笔记0001
支持hive spark flink 美国公司开发的~ 都在使用,这些企业都在用 支持hadoop的,更新,插入,删除 和数据增量处理 支持流式数据处理. hive是离线数仓 hive不支持事物 insert overwrite 底层后来通过这种方式支持了事物 insert overwrite处理数据很低效,因为更新是基于覆盖实现…...
射频功率放大器基于纵向导波的杆状构件腐蚀诊断方法的研究
实验名称:基于纵向导波的杆状构件腐蚀诊断方法研究方向:无损探伤测试设备:信号号发生器、安泰ATA-8202功率放大器、数据采集卡、直流电源、超声探头、钢杆、前置放大器。实验过程:图:试验装置试验装置如图3.2所示。监测…...
Leedcode 二分查找 理解1
一个up的理解 一、二分查找基础例题 力扣https://leetcode.cn/problems/binary-search/ 二、二分查找模板问题 带搜索区间分为3个部分: 1、[mid],直接返回 2、[left,mid-1],设置边界right mid - 1 3、[mid1,right]&#x…...
【告别篇】大家好,再见了,我转行了,在筹备创业
前言 相信大家也一直看到我的博客没有更新过了,我其实很久没有打开过博客了,也就意味着我很长一段时间都在停滞不前,没有了学习的动力。 现在我上来是想跟大家告个别 : 很多粉丝宝宝的私信我看了,但是没有回…...
Java——岛屿数量
题目链接 leetcode在线oj题——岛屿数量 题目描述 给你一个由 ‘1’(陆地)和 ‘0’(水)组成的的二维网格,请你计算网格中岛屿的数量。 岛屿总是被水包围,并且每座岛屿只能由水平方向和/或竖直方向上相…...
《代码整洁之道》笔记
1章:专业人士要有专业人士素养,要有责任心,编写代码尽可能完善没有bug,有bug也要勇于承担。坚持学习,坚持练习,保证自己的专业技能。谦虚,相互学习,与顾客达成一致2章:说…...
个人网站如何集成QQ快捷登录功能?
目录 一、网站集成QQ快捷登录的好处 二、网站接入QQ快捷登录具体步骤 (1)登录到QQ互联官网 (2)进行个人开发者认证 (3)创建网站应用 (4)填写网站资料 三、如何在本地开发环境…...
从工厂打螺丝到月薪18k测试工程师,我该满足吗?
以前我比较喜欢小米那句“永远相信美好的事情即将发生”,后来发现如果不努力不可能有美好的事情发生!01高中毕业进厂5年,创业经商多次战败,为了生计辗转奔波高中毕业后我就进了工厂,第一份工作是做模具加工。从500元一…...
【相关分析-高阶绘图】MATLAB实现皮尔逊相关分析-散点直方图
虽然皮尔逊相关分析很常见,但如何更好的展现相关性、散点分布、柱状分布,以提升研究结果的美感和冲击感呢?本文拟通过MATLAB绘制包含散点分布、柱状分布、线性展示的散点直方图,有助于审稿人眼前一亮。 1、Pearson相关系数原理 Pearson相关系数(Pearson Correlation Co…...
Spark性能优化二 Shuffle机制分析
(一) 什么情况下发生shuffle 在MapReduce框架中,Shuffle是连接Map和Reduce之间的桥梁,Map阶段通过shuffle读取数据并输出到对应的Reduce;而Reduce阶段负责从Map端拉取数据并进行计算。在整个shuffle过程中,…...
软测入门(四)Appium-APP移动测试基础
Appium 用来测试手机程序。 测试方面: 功能测试安装卸载测试升级测试兼容测试 Android系统版本不同分辨率不同网络 网络切换、中断测试使用中来电话、短信横竖屏切换 环境搭建 Java安装(查资料)Android SDK安装,配置 HOME和P…...
华为OD机试用Python实现 -【集五福】 |老题且简单
华为OD机试题 最近更新的博客华为 OD 机试 300 题大纲集五福题目描述输入描述输出描述示例一输入输出示例二输入输出代码编写思路Python 代码最近更新的博客 华为od 2023 | 什么是华为od,od 薪资待遇,od机试题清单华为OD机试真题大全,用 Python 解华为机试题 | 机试宝典...
Typro使用以及安装教程来啦
Typora是一款轻便简洁的Markdown编辑器,支持即时渲染技术,这也是与其他Markdown编辑器最显著的区别。即时渲染使得你写Markdown就想是写Word文档一样流畅自如,不像其他编辑器的有编辑栏和显示栏。今天为大家分享下有关Typroa的安装以及使用&a…...
武汉凯迪正大KD305系列智能数字绝缘电阻测试仪
一、概述 KD305系列智能数字绝缘电阻测试仪采用嵌入式工业单片机实时操作系统,数字模拟指针与数字段码显示结合,该系列表具有多种电压输出等级(500V、1000V、2500V、5000V、10000V)、容量大、抗干扰强、模拟指针与数字同步显示、交…...
如何使用码匠连接 Redis
目录 在码匠中集成 Redis 在码匠中使用 Redis 关于码匠 Redis 是由 Salvatore Sanfilippo 用 C 语言开发的一款开源的、高性能的键值对存储数据库,它采用 BSD 协议,为了适应不同场景下的存储需求,提供了多种键值数据类型。到目前为止&…...
防止网络攻击的10大网络安全措施
网络攻击每天都在发生。事实上,每天有超2000次的攻击是针对连接了互联网且未受保护的系统,大概每39s就会发生一次。网络攻击导致的数据泄露、敏感信息被盗、财务损失、声誉受损都给企业及个人带来威胁。随着各大企业对数字系统的依赖,网络威胁已成为当下面临的主要挑战。 实…...
LeetCode 面试题 05.02. 二进制数转字符串
【LetMeFly】面试题 05.02.二进制数转字符串 力扣题目链接:https://leetcode.cn/problems/bianry-number-to-string-lcci/ 二进制数转字符串。给定一个介于0和1之间的实数(如0.72),类型为double,打印它的二进制表达式…...
[MatLab]图像绘制
一、绘制二维图像 1.一张图上绘制一条线 绘制代码如下面所示: x 0:0.01:2*pi; y sin(x); figure %建立幕布 plot(x,y) %绘制图像 %设置图像属性 title(ysin(x)) xlabel(x) ylabel(y)xlim([0 2*pi]) %限制x轴的值域 自定义图线的颜色…...
datax导入到hive的数据量翻倍
现象 mysql->hive 或者oracle->hdfs 源表数据100w 结果hive表数据200w。 这个现象很容易发生,只要你同一时间调度这个json两次。 原因 "writeMode" : "append", "nonconflict","truncate" * appendÿ…...
拿下3个大厂offer的软件测试面试宝典,面试一文搞定
我是谁、工作几年、你上家公司做什么、负责什么、你的优势、为什么适合这个职位、我想做什么、在这个职位上想得到什么 【呕心沥血】耗时7天整理的金三银四必看的软件测试频面试题 涵盖 接口自动化测试框架面试题_哔哩哔哩_bilibili【呕心沥血】耗时7天整理的金三银四必看的软…...
长短记忆神经网络(LSTM,Long Short-Term Memory)
长短记忆神经网络定义 长短记忆神经网络(Long-short term memory, LSTM)是一种特殊的RNN结构。该神经网络可以有效保留历史信息,实现对文本的长期依赖信息进行学习。 关键问题:控制长期状态信息 解决方法:门控开关 门的…...
axure rp怎么做网站/注册网站流程和费用
概述:本章介绍磁盘分区和文件系统,深度了解linux存储数据所依赖到各个部分模块。设备文件I/O Ports: I/O设备地址一切皆文件:Linux为所有的设备文件都提供了统一的操作函数接口,方法是使用数据结构struct file_operations。这个数…...
肇庆做网站的公司/中国营销网站
MorningMorningMorning 今天早上还是赖了一会儿床,早上吃个饼干当早餐完事 来到机房,也差不多开始比赛了 今天题目 1.阿里郎(题解) 2.通行证(题解) 3.逆序对(题解) 4.给水(题解) 比赛过程 看见第一题,感觉可以推一下,然后没有完…...
做游戏直播什么游戏视频网站好/免费的网站域名查询
一、使用top命令查看占用高资源的java项目的进程ID(pid): top 二、查看该进程中的线程所占用资源的情况:top -Hp pid 三、查看该线程对应的16进制:printf %x 11129 打印并保存该进程中堆栈的使用信息日志:jstack -l 11095 >> jstack.lo…...
河北中保建设集团网站/qq群推广软件
Unix_Linux 的 keyctlkeyctl -操作内核的密钥管理工具内容简介#include long keyctl(intcmd, ...);描述keyctl()有许多功能可用:标签描述KEYCTL_GET_KEYRING_IDAsk for a keyring’s ID.KEYCTL_JOIN_SESSION_KEYRINGJoin or start named session keyring.KEYCTL_UPD…...
房产网名字叫啥好听/河北搜索引擎优化
熟练掌握: (1)对于已知过程,设计出其活动记录; (2)对于已知程序,若采用栈式存储分配,随着程序的执行,画出相应动态栈,访问链(存取链&a…...