Výsledky vyhľadávania - "统一计算设备架构(CUDA)"
-
1
基于GPU平台的有效字典压缩与解压缩技术
ISSN: 1673-9418Vydavateľské údaje: 华东师范大学 软件学院,上海 200062 2014Vydané v 计算机科学与探索 (2014)“…TP311.52; 压缩技术被广泛应用于数据存储和传输中,然而由于其内在的串行特性,大多数已有的基于字典的压缩与解压缩算法被设计在CPU上串行执行。为了探究使用图形处理…”
Získať plný text
Journal Article -
2
基于CUDA的并行布谷鸟搜索算法设计与实现
ISSN: 1673-9418Vydavateľské údaje: 桂林电子科技大学 电子工程与自动化学院,广西 桂林,541004%桂林电子科技大学 广西信息科学实验中心,广西 桂林,541004%桂林电子科技大学 计算机科学技术学院,广西 桂林,541004 2014Vydané v 计算机科学与探索 (2014)“…TP301; 布谷鸟搜索(cuckoo search,CS)算法是近几年发展起来的智能元启发式算法,已经被成功应用于多种优化问题中。针对CS算法在求解大数据、大规模复杂问题时,计算时间…”
Získať plný text
Journal Article -
3
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测
ISSN: 1671-251XVydavateľské údaje: 煤矿综采装备山西省重点实验室,山西太原 030024%中煤张家口煤矿机械有限责任公司,河北 张家口 076250 2025Vydané v 工矿自动化 (2025)“…TD634.2; 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法.首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰.其次,使用ORB算法…”
Získať plný text
Journal Article -
4
模板运算代码的自动生成与调优框架
ISSN: 1000-3428Vydavateľské údaje: 武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室,湖北武汉 430072 2024Vydané v 计算机工程 (2024)“…TP391; 针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架.在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机…”
Získať plný text
Journal Article -
5
GPGPU和CUDA统一内存研究现状综述
ISSN: 1000-3428Vydavateľské údaje: 华东师范大学数据科学与工程学院,上海 200062%之江实验室交叉创新研究院,浙江 杭州 310000 2024Vydané v 计算机工程 (2024)“…(CPU)最重要的协处理器之一.然而,GPU硬件配置在出厂后不容易更改且显存容量有限,在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响.统一计算设备架构(CUDA)6.0推出了统一内存,使GPGPU和CPU可以共享虚拟内存空间,以此来简化异构编程和扩展GPGPU可访问的内存空间.统一内存为GPGPU处理大数据集提供…”
Získať plný text
Journal Article -
6
基于CPU与GPU的异构模板计算优化研究
ISSN: 1000-3428Vydavateľské údaje: 清华大学 计算机科学与技术系,北京 100084 2023Vydané v 计算机工程 (2023)“…TP393; 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题.在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种…”
Získať plný text
Journal Article -
7
面向GPU的直方图统计图像增强并行算法
ISSN: 1673-9418Vydavateľské údaje: 郑州大学 计算机与人工智能学院,郑州 450001%郑州师范学院 信息科学与技术学院,郑州 450044%山东理工大学 建筑工程学院,山东 淄博 255000%郑州大学 计算机与人工智能学院,郑州 450001 2022Vydané v 计算机科学与探索 (2022)“…设备架构(CUDA)活动线程块和活动线程来并行处理不同的子图像块和像素点,提升了数据访问的效率.然后,采用内核配置参数优化和数据并行计算技术,实现了直方图统计图像增强算法在GPU平台上的并行化.最后,采用主机端和设备端间高效的数据传输模式,进一步缩短了系统在异构计算平台上的执行时间.研究表明,对于像幅大小不同的图像,图像…”
Získať plný text
Journal Article -
8
基于CUDA的光纤传像束光纤数量优化检测
ISSN: 1005-8788Vydavateľské údaje: 南京理工大学 电子工程与光电技术学院,南京 210094 2022Vydané v 光通信研究 (2022)“…算法可大幅度降低对阈值的选取要求,并有更高的检测效率.在统一计算设备架构(CUDA)的支持下,双边滤波提速约20倍,优化算法及整体运行减少近1/2时间…”
Získať plný text
Journal Article -
9
基于CUDA与CUBLAS的Tucker分解模块设计与实现
ISSN: 1000-3428Vydavateľské údaje: 中国电子科技集团公司第三十二研究所,上海,201808 2019Vydané v 计算机工程 (2019)“…TP391; 由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用, 使得Tucker分解算法成为目前重点研究对象.但是当前流行的Tucker分解算法需要对张量进行多次展开, 导致算法加速效率降低.针对上述问题, 提出一种应用于统一计算设备架构 (CUDA) 平台上的改进Tucker分解模块, 通过…”
Získať plný text
Journal Article -
10
基于GPU的高效稀疏矩阵存储格式研究
ISSN: 1000-3428Vydavateľské údaje: 上海工程技术大学电子电气工程学院,上海,201620 2018Vydané v 计算机工程 (2018)“…TN014; 针对基于GPU求解大规模稀疏线性方程组的问题,提出一种稀疏矩阵的存储格式HEC,并应用该格式在统一计算设备架构(CUDA)平台上实现不完全LU分解的预条件共轭梯度(ILUCG)法.该存储格式由ELL与CSR格式混合而成,将其以调用GPU kernel的方式实现ILUCG法并应用于大型稀疏线性系统的求解中…”
Získať plný text
Journal Article -
11
CUDA加速的DNA-蛋白质匹配及其优化
ISSN: 0258-7998Vydavateľské údaje: 西北工业大学自动化学院,陕西西安,710072 2013Vydané v 电子技术应用 (2013)“…设计实现了一种使用统一计算设备架构(CUDA)加速DNA-蛋白质匹配的方法。详细介绍了一种基于退火算法的DNA-蛋白质匹配方法和CUDA的特点,从计算的角度对匹配方法进行了分析。基于CUDA设计实现并行化方法,并根据CUDA的线程调度策略对并行方法进行了优化。实验结果表明,最大可获得15倍左右的加速比。…”
Získať plný text
Journal Article -
12
面向多尺度拓扑优化的渐进均匀化GPU并行算法研究
ISSN: 1008-9497Vydavateľské údaje: 华中科技大学 机械科学与工程学院/智能制造装备与技术全国重点实验室,湖北 武汉 430074%武汉轻工大学 数学与计算机学院,湖北 武汉 430023%上海理工大学 机械工程学院,上海 200093%武汉理工大学机电工程学院,湖北 武汉 430070 25.11.2023Vydané v 浙江大学学报(理学版) (25.11.2023)“…TP391; 针对多尺度结构拓扑设计计算效率低等问题,提出了一种基于水平集渐进均匀化的多尺度拓扑优化并行算法.基于通用图形处理器(graphics processing unit,GPU),通过水平…”
Získať plný text
Journal Article -
13
声子BTE应用的并行和优化研究
ISSN: 1673-9418Vydavateľské údaje: 上海交通大学 高性能计算中心,上海 200240%上海交通大学 密西根学院,上海 200240 01.08.2020Vydané v 计算机科学与探索 (01.08.2020)“…TP391; 声子玻尔兹曼输运方程(BTE)可以有效地模拟介观尺度下的导热问题,相比于随机性方法,以有限体积法为代表的确定性方法求解声子BTE方程被认为更有希望解决工程实际问…”
Získať plný text
Journal Article -
14
激光等离子体相互作用模拟的并行和加速研究
ISSN: 1673-9418Vydavateľské údaje: 东京工业大学 学术国际情报中心,日本 东京 2018Vydané v 计算机科学与探索 (2018)“…TP391; 随着生成超短激光脉冲技术的不断发展,对这种激光脉冲和等离子体相互作用进行动力学描述也变得越来越重要.PIC(particle-in-cell)是一种在等离子体物理中,研究充能粒…”
Získať plný text
Journal Article -
15
基于GPU加速的磁共振血管造影图像的并行分割与追踪算法
ISSN: 1000-4556Vydavateľské údaje: 华东师范大学物理与材料科学学院,上海市磁共振重点实验室,上海 200062%华东师范大学物理与材料科学学院,上海市磁共振重点实验室,上海 200062 2016Vydané v 波谱学杂志 (2016)“…O482.53; 在应用磁共振血管造影图像进行临床诊断时,临床医生往往需要提取感兴趣区域(Region Of Interest,ROI)的部分血管。这个工作传统上需要手工进行,费时费力。该文…”
Získať plný text
Journal Article -
16
CUSMART: effective parallelization of string matching algorithms using GPGPU accelerators
ISSN: 2095-9184, 2095-9230Vydavateľské údaje: Hangzhou Zhejiang University Press 01.06.2025Vydané v Frontiers of information technology & electronic engineering (01.06.2025)“…This study presents a parallel version of the string matching algorithms research tool (SMART) library, implemented on NVIDIA’s compute unified device…”
Získať plný text
Journal Article