当前位置：首页 > news >正文

windows C++-并行编程-并行算法(五) -选择排序算法

news 2026/2/8 22:44:49

并行模式库 (PPL) 提供了对数据集合并行地执行工作的算法。这些算法类似于 C++ 标准库提供的算法。并行算法由并发运行时中的现有功能组成。

在许多情况下，parallel_sort 会提供速度和内存性能的最佳平衡。但是，当您增加数据集的大小、可用处理器的数量或比较函数的复杂性时，parallel_buffered_sort 或 parallel_radixsort 性能更佳。确定在任何给定方案中使用哪种排序算法的最佳方式是：体验并度量在有代表性计算机配置下对典型数据排序需要多长时间。在选择排序策略时请遵循以下准则。

数据集的大小。在本文档中，小型数据集包含的元素少于 1,000 个，中型数据集包含的元素介于 10,000 和 100,000 个之间，而大型数据集包含的元素多于 100,000 个;
您的比较函数或哈希函数所执行的工作量;
可用计算资源的量;
数据集的特征。例如，一种算法对已完成近似排序的数据可能执行效果很好，但对完全未排序的数据执行效果就不那么好了;
区块的大小。可选的 _Chunk_size 参数将指定算法在将整体排序细分成较小工作单元时何时从并行排序实现切换为串行排序实现。例如，如果提供的是 512，算法会在工作单元包含 512 个或更少元素时切换到串行实现。串行实现可以提高整体性能，因为它消除了并行处理数据所需的开销;

以并行方式对小型数据集排序可能不值得，即使是在您拥有大量的可用计算资源或您的比较函数或哈希函数执行相对大量的工作时。可以使用 std::sort 函数对小型数据集排序。（当你指定的区块大小大于数据集时，parallel_sort 和 parallel_buffered_sort 会调用 sort；但是，parallel_buffered_sort 将必须分配 O(N) 空间，这样会因锁争用或内存分配而花费更多时间。）

如果您必须节省内存或您的内存分配器容易出现锁争用问题，请使用 parallel_sort 对中型数据集排序。 parallel_sort 不需要额外的空间；其他算法需要 O(N) 空间。

当你的应用程序能够满足额外的 O(N) 空间需求时，使用 parallel_buffered_sort 对中型数据集排序。当您拥有大量的计算资源或高开销的比较函数或哈希函数时，parallel_buffered_sort 尤其有用。

当你的应用程序能够满足额外的 O(N) 空间需求时，使用 parallel_radixsort 对大型数据集排序。当等效的比较操作开销较大或两种操作开销都很大时，parallel_radixsort 尤其有用。

好的哈希函数的实现要求你知道数据集范围以及数据集中的每个元素如何转换为对应的无符号值。由于哈希操作会处理无符号值，如果无法生成无符号哈希值，请考虑使用另外的排序策略。

下面的示例针对相同大小的随机数据集对 sort、parallel_sort、parallel_buffered_sort 和 parallel_radixsort 的性能进行比较。

// choosing-parallel-sort.cpp
// compile with: /EHsc
#include <ppl.h>
#include <random>
#include <iostream>
#include <windows.h>using namespace concurrency;
using namespace std;// Calls the provided work function and returns the number of milliseconds 
// that it takes to call that function.
template <class Function>
__int64 time_call(Function&& f)
{__int64 begin = GetTickCount();f();return GetTickCount() - begin;
}const size_t DATASET_SIZE = 10000000;// Create
// Creates the dataset for this example. Each call
// produces the same predefined sequence of random data.
vector<size_t> GetData()
{vector<size_t> data(DATASET_SIZE);generate(begin(data), end(data), mt19937(42));return data;
}int wmain()
{// Use std::sort to sort the data.auto data = GetData();wcout << L"Testing std::sort...";auto elapsed = time_call([&data] { sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_sort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_sort...";elapsed = time_call([&data] { parallel_sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_buffered_sort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_buffered_sort...";elapsed = time_call([&data] { parallel_buffered_sort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;// Use concurrency::parallel_radixsort to sort the data.data = GetData();wcout << L"Testing concurrency::parallel_radixsort...";elapsed = time_call([&data] { parallel_radixsort(begin(data), end(data)); });wcout << L" took " << elapsed << L" ms." <<endl;
} 
/* Sample output (on a computer that has four cores):Testing std::sort... took 2906 ms.Testing concurrency::parallel_sort... took 2234 ms.Testing concurrency::parallel_buffered_sort... took 1782 ms.Testing concurrency::parallel_radixsort... took 907 ms.
*/

本示例中假设在排序期间分配 O(N) 空间是可以接受的，parallel_radixsort 在此计算机配置下对这个数据集表现得最好。

windows C++-并行编程-并行算法(五) -选择排序算法

相关文章：

windows C++-并行编程-并行算法(五) -选择排序算法

【系统架构设计师-2014年真题】案例分析-答案及详解

windows C++-并行编程-并行算法(三)-分区工作

下载 llama2-7b-hf 全流程【小白踩坑记录】

Codeforces practice C++ 2024/9/11 - 2024/9/13

RabbitMQ创建交换机和队列——配置类注解

proteus+51单片机+AD/DA学习5

【Python机器学习】长短期记忆网络（LSTM）

【Go】使用Goland创建第一个Go项目

STM32学习笔记（一、使用DAP仿真器下载程序）

储能运维管理云平台解决方案EMS能量管理系统

网络药理学：16、速通流程版

P2515 [HAOI2010] 软件安装

51单片机快速入门之定时器和计数器

【计算机网络 - 基础问题】每日 3 题（一）

Unity全面取消Runtime费用安装游戏不再收版费

IDEA测试类启动报 “java: 常量字符串过长” 解决办法

计算机科学基础 -- 访存单元

Linux压缩、解压缩、查看压缩内容详解使用（tar、gzip、bzip2、xz、jar、war、aar）

StreamReader 和 StreamWriter提供自动处理字符编码的功能

浅谈 React Hooks

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

服务器硬防的应用场景都有哪些？

C++ 求圆面积的程序（Program to find area of a circle）

【python异步多线程】异步多线程爬虫代码示例

LeetCode - 199. 二叉树的右视图

2025年低延迟业务DDoS防护全攻略：高可用架构与实战方案

2.2.2 ASPICE的需求分析

LUA+Reids实现库存秒杀预扣减记录流水以及自己的思考

Pandas 可视化集成：数据科学家的高效绘图指南