“东方杯”英特尔oneAPI黑客松大赛—参赛经验分享
目录
- 前言
- 1、大赛要求
- 2、oneMKL介绍
- 3、准备
- oneMKL基本使用
- 1、下载:
- 2、安装:
- 3、初始化oneMKL环境:
- 4、编译代码
- 5、运行
- 所需的头文件
- 使用oneMKL工具生成随机数
- 使用fftw3计算FFT
- 调用oneMKL API加速计算FFT
- 对比两种方法的准确性
- 输出结果
- 结束语
前言
1、大赛要求
本次比赛为命题形式,题目要求如下:
- 使用oneMKl工具生成2048*2048随机单精度实数
- 使用FFT算法实现实数到复数的快速傅里叶变换
- 使用oneMKL加速计算实数到复数的快速傅里叶变换
- 对比上面两种快速傅里叶变换的精度、性能
2、oneMKL介绍
oneMKL(oneAPI Math Kernel Library)是oneAPI包含的一种数学工具,能对各种数据工程问题实现加速与优化。
oneAPI官网:oneAPI
oneMKL官网:oneMKL
oenMKL对C语言的API文档:oneMKL—C语言参考文档
3、准备
- Ubuntu系统
- C++基础
- oneMKL
由于题目比较简单,不需要很复杂的编译方法,上手简单。使用onelMKL工具的话,你的电脑的CPU最好是intel的。而且推荐使用linux系统,加速效果明显。
oneMKL基本使用
oneMKL下载网址:oneMKL下载
注意要使用离线版本安装,如果你使用的是为window的话,使用在线版本的方式安装。
1、下载:
一定要注意下载的是oneMKl_baseKit,不能仅仅下载MKL工具包
wget https://registrationcenter-download.intel.com/akdlm/IRC_NAS/992857b9-624c-45de-9701-f6445d845359/l_BaseKit_p_2023.2.0.49397_offline.sh
2、安装:
sudo sh ./l_BaseKit_p_2023.2.0.49397_offline.sh
默认安装目录:/opt/intel/oneapi
3、初始化oneMKL环境:
source /opt/intel/oneapi/setvars.sh
可以将这条命令放到~/bashrc文件内并激活,这样不用每次启动一个终端都初始化了。
4、编译代码
icpx -qmkl my.cpp -o my.out
注意其中的-qmkl是比较方便的也是不容易出错的动态库链接参数,它是把关于oneMKL的所有动态库都链上了,懒人必备。
5、运行
./my.out
直接把编译好的运行就可。
所需的头文件
#include <chrono> // 计算程序运行时间
#include <iostream>
#include <stdio.h>
#include <math.h>
#include <mkl.h> // onemkl工具包
#include "fftw3.h" // fftw3,onemkl自带,使用fftw3来对比经过oneMKL加速过的fft
using namespace std;
使用oneMKL工具生成随机数
#define ROW 2048
#define COL 2048
float *data = (float *)malloc((ROW * COL) * sizeof(float));
VSLStreamStatePtr stream;
vslNewStream(&stream, VSL_BRNG_MT19937, 42); // 42是随机数种子
vsRngUniform(VSL_RNG_METHOD_UNIFORM_STD, stream, ROW * COL, data, 0.0f, 1.0f); // 生成0到1之间的随机数
vslDeleteStream(&stream);
使用fftw3计算FFT
void fftw3(float *data, MKL_Complex8 *x)
{fftwf_plan r2c;r2c = fftwf_plan_dft_r2c_2d(ROW, COL, data, (fftwf_complex *)x, FFTW_ESTIMATE);fftwf_execute(r2c);fftwf_destroy_plan(r2c);
}
// 开辟内存空间,存储普通FFT计算的结果
MKL_Complex8 *x = (MKL_Complex8 *)malloc(ROW * (COL / 2 + 1) * 2 * sizeof(float));
fftw3(data, x);
注意给x开的空间是:ROW * (COL / 2 + 1) * 2 * sizeof(float)
,
调用oneMKL API加速计算FFT
void r2c_oneMKL(float *data, MKL_Complex8 *y)
{MKL_LONG status;MKL_LONG dim_sizes[2] = {ROW, COL};DFTI_DESCRIPTOR_HANDLE handle;status = DftiCreateDescriptor(&handle, DFTI_SINGLE, DFTI_REAL, 2, dim_sizes);status = DftiSetValue(handle, DFTI_PLACEMENT, DFTI_NOT_INPLACE); // 不覆盖datastatus = DftiSetValue(handle, DFTI_CONJUGATE_EVEN_STORAGE, DFTI_COMPLEX_COMPLEX);status = DftiCommitDescriptor(handle);status = DftiComputeForward(handle, data, y);DftiFreeDescriptor(&handle);
}
// 开辟空间,存储oneMKL API FFT计算的结果
MKL_Complex8 *y = (MKL_Complex8 *)malloc(ROW * COL * 2 * sizeof(float));
r2c_oneMKL(data, y);
注意,要多给y多开点内存空间,乘以2是因为有实部和虚部
对比两种方法的准确性
对比的时候要对比实部和虚部
void compare_results(MKL_Complex8 *x, MKL_Complex8 *y)
{bool is_same=true;// 实部对比for (int i = 0; i < ROW; i++){for (int j = 0; j < (COL / 2 + 1); j++){// cout << x[i*(ROW/2+1)+j].real<< " ";// cout << y[i*(COL)+j].real<< " ";// 实部一个一个比较:if (x[i * (COL / 2 + 1) + j].real - y[i * (COL) + j].real > 1e-6){is_same=false;break;}}}if (is_same){cout<<"实部:"<<"结果正确"<<endl;}else{cout<<"实部:"<<"结果不正确"<<endl;}// 虚部对比is_same=true;for (int i = 0; i < ROW; i++){for (int j = 0; j < (COL / 2 + 1); j++){// 虚部一个一个比较:if (x[i * (COL / 2 + 1) + j].imag - y[i * (COL) + j].imag > 1e-6){is_same=false;break;}}}if (is_same){cout<<"虚部:"<<"结果正确"<<endl;}else{cout<<"虚部:"<<"结果不正确"<<endl;}
}
输出结果
结束语
本次大赛的题目比较基础,对非计算机专业的工科生很友好。本人是地质专业,由于要经常进行地震数据处理、地震数据解释等,对傅里叶变换的需要也很大,oneMKl工具计算速度快,对大型地震数据的复杂计算有着不可替代的性能优势。
相关文章:

“东方杯”英特尔oneAPI黑客松大赛—参赛经验分享
目录 前言1、大赛要求2、oneMKL介绍3、准备 oneMKL基本使用1、下载:2、安装:3、初始化oneMKL环境:4、编译代码5、运行 所需的头文件使用oneMKL工具生成随机数使用fftw3计算FFT调用oneMKL API加速计算FFT对比两种方法的准确性输出结果结束语 前…...

win10家庭版远程桌面补丁_rdp wrapper
RDP Wrapper Library 就是可以帮你在 Windows 7、Windows 8、Windows 10 家庭版中打开远程桌面的工具。 1、把电脑上打开的安全软件与杀毒软件都关掉,因为这个远程桌面补丁会修改系统文件,所以安全软件可能会拦截。 2、下载RDP Wrapper Library补丁压缩…...
【C++设计模式】开放-封闭原则
2023年8月27日,周日下午 我觉得我的这篇博客还是写得很不错的,哈哈哈。 目录 概述举例说明用开放-封闭原则重构 概述 开放-封闭原则(Open-Closed Principle,OCP)是面向对象设计中的一个重要原则,也是许多…...

vue+file-saver+xlsx+htmlToPdf+jspdf实现本地导出PDF和Excel
页面效果如下(echarts图表按需添加,以下代码中没有) 1、安装插件 npm install xlsx --save npm install file-saver --save npm install html2canvas --save npm install jspdf --save2、main.js引入html2canvas import htmlToPdf from …...

axios 进阶
axios 进阶 接口传参方式 使用 xhr 原生技术或者是 axios 时,它的 post 传参方式是键值对的形式 keyvalue。但是在实际开发中一般是使用对象的形式定义数据,方便读取和赋值。所以当我们需要发起请求时可以通过 qs 这一款插件将对象转成键值对形式&…...

Redis限流实践:实现用户消息推送每天最多通知2次的功能
🏆作者简介,黑夜开发者,CSDN领军人物,全栈领域优质创作者✌,CSDN博客专家,阿里云社区专家博主,2023年6月CSDN上海赛道top4。 🏆数年电商行业从业经验,历任核心研发工程师…...
uniapp 存储base64资源为http链接图片
1. 新建一个base64.js 文件 const fsm wx.getFileSystemManager(); // base64data base64资源 // name 文件名 function base64src(base64data, name, cb) {const time new Date().getTime();const filePath ${wx.env.USER_DATA_PATH}/${name}.${time}.png;const buffer …...
列表类控件虚拟化
WPF列表控件提供的最重要的功能是UI虚拟化(WPF编程宝典说的)。所有的WPF列表控件(所有继承自ItemsControl的控件,包括ListBox、CombBox、ListView、TreeView、DataGrid)都支持UI虚拟化。 UI虚拟化的支持实际上没有被构…...
c# 多线程Task.Run 取消正在执行的多线程
c# 异步处理,上次处理没有完成,下次有紧接着处理多线程出错 在 C# 中进行异步处理时,确保处理上一个任务完成后再处理下一个任务是很重要的,特别是在涉及多线程的情况下。如果上一个任务尚未完成,而下一个任务又开始执…...
sql server 如何设置主键
开始之前 限制和局限 一个表只能包含一个 PRIMARY KEY 约束。 在 PRIMARY KEY 约束中定义的所有列都必须定义为 NOT NULL。 如果没有指定为 Null 性,则加入 PRIMARY KEY 约束的所有列的为 Null 性都将设置为 NOT NULL。 创建主键会自动创建相应的唯一群集索引、…...

【LeetCode-中等题】19. 删除链表的倒数第 N 个结点
文章目录 题目方法一:节点加入集合找索引方法二:直接计算长度,然后找出要删除的节点的前一个节点方法三:栈方法四:前后双指针 题目 这题的关键在与两个点 一定要设置一个哑结点,防止删除第一个元素时,导致空…...

Matlab图像处理-减法运算
减法运算 图像减法也称为差分方法,是一种常用于检测图像变化及运动物体的图像处理方法。常用来检测一系列相同场景图像的差异,其主要的应用在于检测同一场景下两幅图像之间的变化或是混合图像的分离。 差影法 将同一景物在不同时问拍摄的图像或同一景…...

stm32之11.USART串口通信
可以添加上拉电阻,但会增加功耗,传输距离变长 要添加库函数USART 官方参考文档说明书位置 ALT+左键可实现整体删除(如下图) 输出模式第三种模式AF ---------------------- 源码 远程控制pc端 #include <stm32f4x…...

Python实现T检验
今天来分享一下T检验的python实现方法。 01 先来上一波概念。 1.单样本t检验,又称单样本均数t检验,适用于来自正态分布的某个样本均数与已知总体均数的比较,其比较目的是检验样本均数所代表的总体均数是否与已知总体均数有差别。已知总体均数…...

校招算法题实在不会做,有没有关系?
文章目录 前言一、校招二、时间复杂度1、单层循环2、双层循环 三、空间复杂度四、数据结构五、校招算法题实在不会做,有没有关系?六、英雄算法集训 前言 英雄算法联盟八月集训 已经接近尾声,九月算法集训将于 09月01日 正式开始,目…...

Michael.W基于Foundry精读Openzeppelin第32期——SignatureChecker.sol
Michael.W基于Foundry精读Openzeppelin第32期——SignatureChecker.sol 0. 版本0.1 SignatureChecker.sol 1. 目标合约2. 代码精读2.1 isValidSignatureNow(address signer, bytes32 hash, bytes memory signature) 0. 版本 [openzeppelin]:v4.8.3,[for…...

如何修改字符串内容?
⭐ 作者:小胡_不糊涂 🌱 作者主页:小胡_不糊涂的个人主页 📀 收录专栏:浅谈Java 💖 持续更文,关注博主少走弯路,谢谢大家支持 💖 String 1. 修改字符串2. StringBuilder和…...

pgadmin4中的备份与恢复
一,postgresql 数据的备份与恢复 (一)数据库备份与恢复 1,备份 windows环境 1> dump 逻辑备份 1,用管理员身份打开power shell 2,切换到本机 postgresql 安装目录下的 bin 目录: PS C…...

内网穿透——搭建私人影音媒体平台
文章目录 1. 前言2. Jellyfin服务网站搭建2.1. Jellyfin下载和安装2.2. Jellyfin网页测试 3.本地网页发布3.1 cpolar的安装和注册3.2 Cpolar云端设置3.3 Cpolar本地设置 4.公网访问测试5. 结语 1. 前言 随着移动智能设备的普及,各种各样的使用需求也被开发出来&…...
使用psql操作PostgreSQL数据库
postgresql的操作和mysql差别较大。。 可以使用 psql 命令行工具或者其他的 PostgreSQL 客户端工具来查看表。如下是使用 psql 命令行工具查看表的方法: 连接到 PostgreSQL 数据库: 如果一个PostgreSQL的连接为 postgresql://用户名:密码127.0.0.1:5432/…...
Python爬虫实战:研究MechanicalSoup库相关技术
一、MechanicalSoup 库概述 1.1 库简介 MechanicalSoup 是一个 Python 库,专为自动化交互网站而设计。它结合了 requests 的 HTTP 请求能力和 BeautifulSoup 的 HTML 解析能力,提供了直观的 API,让我们可以像人类用户一样浏览网页、填写表单和提交请求。 1.2 主要功能特点…...
vue3 字体颜色设置的多种方式
在Vue 3中设置字体颜色可以通过多种方式实现,这取决于你是想在组件内部直接设置,还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法: 1. 内联样式 你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...
在Ubuntu中设置开机自动运行(sudo)指令的指南
在Ubuntu系统中,有时需要在系统启动时自动执行某些命令,特别是需要 sudo权限的指令。为了实现这一功能,可以使用多种方法,包括编写Systemd服务、配置 rc.local文件或使用 cron任务计划。本文将详细介绍这些方法,并提供…...
vue3 定时器-定义全局方法 vue+ts
1.创建ts文件 路径:src/utils/timer.ts 完整代码: import { onUnmounted } from vuetype TimerCallback (...args: any[]) > voidexport function useGlobalTimer() {const timers: Map<number, NodeJS.Timeout> new Map()// 创建定时器con…...

2025盘古石杯决赛【手机取证】
前言 第三届盘古石杯国际电子数据取证大赛决赛 最后一题没有解出来,实在找不到,希望有大佬教一下我。 还有就会议时间,我感觉不是图片时间,因为在电脑看到是其他时间用老会议系统开的会。 手机取证 1、分析鸿蒙手机检材&#x…...

多种风格导航菜单 HTML 实现(附源码)
下面我将为您展示 6 种不同风格的导航菜单实现,每种都包含完整 HTML、CSS 和 JavaScript 代码。 1. 简约水平导航栏 <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"viewport&qu…...

Map相关知识
数据结构 二叉树 二叉树,顾名思义,每个节点最多有两个“叉”,也就是两个子节点,分别是左子 节点和右子节点。不过,二叉树并不要求每个节点都有两个子节点,有的节点只 有左子节点,有的节点只有…...
Mysql8 忘记密码重置,以及问题解决
1.使用免密登录 找到配置MySQL文件,我的文件路径是/etc/mysql/my.cnf,有的人的是/etc/mysql/mysql.cnf 在里最后加入 skip-grant-tables重启MySQL服务 service mysql restartShutting down MySQL… SUCCESS! Starting MySQL… SUCCESS! 重启成功 2.登…...

iview框架主题色的应用
1.下载 less要使用3.0.0以下的版本 npm install less2.7.3 npm install less-loader4.0.52./src/config/theme.js文件 module.exports {yellow: {theme-color: #FDCE04},blue: {theme-color: #547CE7} }在sass中使用theme配置的颜色主题,无需引入,直接可…...
智能职业发展系统:AI驱动的职业规划平台技术解析
智能职业发展系统:AI驱动的职业规划平台技术解析 引言:数字时代的职业革命 在当今瞬息万变的就业市场中,传统的职业规划方法已无法满足个人和企业的需求。据统计,全球每年有超过2亿人面临职业转型困境,而企业也因此遭…...