Výsledky vyhledávání - 统一计算设备架构(CUDA)
-
1
基于CUDA的并行布谷鸟搜索算法设计与实现
ISSN: 1673-9418Vydáno: 桂林电子科技大学 电子工程与自动化学院,广西 桂林,541004%桂林电子科技大学 广西信息科学实验中心,广西 桂林,541004%桂林电子科技大学 计算机科学技术学院,广西 桂林,541004 2014Vydáno v 计算机科学与探索 (2014)“…,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。…”
Získat plný text
Journal Article -
2
基于GPU平台的有效字典压缩与解压缩技术
ISSN: 1673-9418Vydáno: 华东师范大学 软件学院,上海 200062 2014Vydáno v 计算机科学与探索 (2014)“…,GPU)对压缩与解压缩过程潜在性能的提升,结合合并内存访问与并行组装的技术,基于CUDA(compute unified device archi-tecture)平台研究了两种并行压缩与解压缩方法:基于字典的无状态压缩和基于字典的LZW压缩。实验结果表明,与传统的单核实现比较,所提方法能够显著改善已有的基于字典的串行压缩与…”
Získat plný text
Journal Article -
3
CUDA加速的DNA-蛋白质匹配及其优化
ISSN: 0258-7998Vydáno: 西北工业大学自动化学院,陕西西安,710072 2013Vydáno v 电子技术应用 (2013)“…设计实现了一种使用统一计算设备架构(CUDA)加速DNA-蛋白质匹配的方法。详细介绍了一种基于退火算法的DNA-蛋白质匹配方法和CUDA的特点,从计算的角度对匹配方法进行了分析。基于CUDA设计实现并行化方法,并根据CUDA的线程调度策略对并行方法进行了优化。实验结果表明,最大可获得15倍左右的加速比。…”
Získat plný text
Journal Article -
4
基于GPU的三维扩散方程在反应堆计算中的应用
ISSN: 0253-3219Vydáno: 中国科学院大学 北京100049%苏州工业职业技术学院软件与服务外包学院 苏州215000 2015Vydáno v 核技术 (2015)“…本文介绍了基于统一计算设备架构(Computeunmed Device Architecture,CuDA)的图形处理器(Graphic Processing Unit…”
Získat plný text
Journal Article -
5
基于GPU的电力系统并行潮流计算的实现
ISSN: 1674-3415Vydáno: 武汉大学电气工程学院,湖北,武汉,430072%武汉国测科技股份有限公司,湖北,武汉,430223 2010Vydáno v 电力系统保护与控制 (2010)“…TM74; 在研究GPU通用计算方法和潮流计算算法的基础上,针对GPU计算密集、高度并行化等特点,对潮流计算牛顿法进行了适当的简化,并应用统一计算设备架构(Compute Unified Device Architecture,CUDA)的开发平台,提出了一种基于GPU的并行潮流计算程序的设计方法.仿真计算结果表明此…”
Získat plný text
Journal Article -
6
基于CUDA的H.264并行解码器设计与实现
ISSN: 1000-3428Vydáno: 2016Vydáno v 计算机工程 (2016)“…针对H.264视频编解码标准复杂度高、运算量大的缺点,基于统一计算设备架构平台设计并实现CPU+GPU异构并行H.264解码器,利用GPU的并行计算能力和CPU的逻辑控制优势加快运行速度,提高解码性能。实验结果表明,与FFmpege中传统的串行解码器相比,利用GPU加速的H.264并行解码器能获得2倍~7倍的性能提升…”
Získat plný text
Journal Article -
7
基于混合架构的双通道实时相关器实现
ISSN: 1000-3428Vydáno: 中国科学院新疆天文台,乌鲁木齐,830011 2016Vydáno v 计算机工程 (2016)“…为满足多波束接收机、焦面阵和天线阵等超大数据量终端的处理需求,采用以GPU并行运算为处理核心的FPGA+CPU+GPU混合架构对天文相关器进行设计,利用严格时序的FPGA进行采样和预处理,基于统一计算设备架构平台开发实现GPU并行运算信号处理与CPU逻辑控制、存储和显示。测试结果表明,该相关器运行稳定、准确,通过调节混…”
Získat plný text
Journal Article -
8
GPGPU和CUDA统一内存研究现状综述
ISSN: 1000-3428Vydáno: 华东师范大学数据科学与工程学院,上海 200062%之江实验室交叉创新研究院,浙江 杭州 310000 2024Vydáno v 计算机工程 (2024)“…(CPU)最重要的协处理器之一.然而,GPU硬件配置在出厂后不容易更改且显存容量有限,在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响.统一计算设备架构(CUDA)6.0推出了统一内存,使GPGPU和CPU可以共享虚拟内存空间,以此来简化异构编程和扩展GPGPU可访问的内存空间.统一内存为GPGPU处理大数据集提供…”
Získat plný text
Journal Article -
9
基于CPU与GPU的异构模板计算优化研究
ISSN: 1000-3428Vydáno: 清华大学 计算机科学与技术系,北京 100084 2023Vydáno v 计算机工程 (2023)“…TP393; 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题.在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种…”
Získat plný text
Journal Article -
10
模板运算代码的自动生成与调优框架
ISSN: 1000-3428Vydáno: 武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室,湖北武汉 430072 2024Vydáno v 计算机工程 (2024)“…TP391; 针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架.在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机…”
Získat plný text
Journal Article -
11
基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测
ISSN: 1671-251XVydáno: 煤矿综采装备山西省重点实验室,山西太原 030024%中煤张家口煤矿机械有限责任公司,河北 张家口 076250 2025Vydáno v 工矿自动化 (2025)“…TD634.2; 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法.首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰.其次,使用ORB算法…”
Získat plný text
Journal Article -
12
基于CUDA的光纤传像束光纤数量优化检测
ISSN: 1005-8788Vydáno: 南京理工大学 电子工程与光电技术学院,南京 210094 2022Vydáno v 光通信研究 (2022)“…算法可大幅度降低对阈值的选取要求,并有更高的检测效率.在统一计算设备架构(CUDA)的支持下,双边滤波提速约20倍,优化算法及整体运行减少近1/2时间…”
Získat plný text
Journal Article -
13
基于CUDA与CUBLAS的Tucker分解模块设计与实现
ISSN: 1000-3428Vydáno: 中国电子科技集团公司第三十二研究所,上海,201808 2019Vydáno v 计算机工程 (2019)“…TP391; 由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用, 使得Tucker分解算法成为目前重点研究对象.但是当前流行的Tucker分解算法需要对张量进行多次展开, 导致算法加速效率降低.针对上述问题, 提出一种应用于统一计算设备架构 (CUDA) 平台上的改进Tucker分解模块, 通过…”
Získat plný text
Journal Article -
14
面向GPU的直方图统计图像增强并行算法
ISSN: 1673-9418Vydáno: 郑州大学 计算机与人工智能学院,郑州 450001%郑州师范学院 信息科学与技术学院,郑州 450044%山东理工大学 建筑工程学院,山东 淄博 255000%郑州大学 计算机与人工智能学院,郑州 450001 2022Vydáno v 计算机科学与探索 (2022)“…设备架构(CUDA)活动线程块和活动线程来并行处理不同的子图像块和像素点,提升了数据访问的效率.然后,采用内核配置参数优化和数据并行计算技术,实现了直方图统计图像增强算法在GPU平台上的并行化.最后,采用主机端和设备端间高效的数据传输模式,进一步缩短了系统在异构计算平台上的执行时间.研究表明,对于像幅大小不同的图像,图像…”
Získat plný text
Journal Article -
15
基于GPU的Landsat8实时解压缩处理技术
ISSN: 1000-3428Vydáno: 中国科学院遥感与数字地球研究所,北京,100094%中国科学院遥感与数字地球研究所,北京100094 2016Vydáno v 计算机工程 (2016)“…根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压缩方案相比,基于GPU的解压缩系统获得7.45倍的加速比,能够达到…”
Získat plný text
Journal Article -
16
弹目动态交会下的空中目标电磁散射特性并行计算方法
ISSN: 1673-5048Vydáno: 中国空空导弹研究院,河南洛阳 471009 2024Vydáno v 航空兵器 (2024)“…TJ760; 为改善弹目动态交会场景下空中目标电磁散射特性仿真时间长、效率低的现象,本文采用基于统一计算设备架构(Compute Unified Device Architecture,CUDA)编程,基于物理光学法和物理绕射理论的并行计算方法对空中目标电磁散射特性进行计算,通过与标准体、某复杂目标的电磁散射结果作对比…”
Získat plný text
Journal Article -
17
基于GPU的高效稀疏矩阵存储格式研究
ISSN: 1000-3428Vydáno: 上海工程技术大学电子电气工程学院,上海,201620 2018Vydáno v 计算机工程 (2018)“…TN014; 针对基于GPU求解大规模稀疏线性方程组的问题,提出一种稀疏矩阵的存储格式HEC,并应用该格式在统一计算设备架构(CUDA)平台上实现不完全LU分解的预条件共轭梯度(ILUCG)法.该存储格式由ELL与CSR格式混合而成,将其以调用GPU kernel的方式实现ILUCG法并应用于大型稀疏线性系统的求解中…”
Získat plný text
Journal Article -
18
动脉粥样硬化斑块生成的高效流固耦合不可压缩SPH模拟方法
ISSN: 1008-9497Vydáno: 汕头大学 工学院 计算机系,广东 汕头 515063%深圳证券信息有限公司,广东 深圳 518000%中山大学人工智能学院,广东 珠海 519000%桂林电子科技大学 计算机与信息安全学院,广西 桂林 541004 25.11.2023Vydáno v 浙江大学学报(理学版) (25.11.2023)“…)的斑块生成模拟方法.首先,基于流固耦合不可压缩SPH方法,将血液离散为不可压缩流体粒子,以控制血液流动的稳定性;然后,使用斑块生成模型对血液、单核细胞等粒子建模,对血液成分进行病理性分析,控制斑块生成;最后,通过流固耦合作用计算血液与斑块的物理特性,模拟斑块堵塞血流过程.为使模拟结果能够实时呈现,用统一计算设备架构(compute unified device architecture,CUDA…”
Získat plný text
Journal Article -
19
Highly efficient fluid-solid coupled incompressible SPH simulation method for atherosclerotic plaque generation
ISSN: 1008-9497Vydáno: Hangzhou Zhejiang University 01.11.2023Vydáno v Zhejiang da xue xue bao. Journal of Zhejiang University. Sciences edition. Li xue ban (01.11.2023)“…Atherosclerosis is a critical cause of cardiovascular disease and stroke. Simulating and visualizing this process is crucial to relevant medical research. To…”
Získat plný text
Journal Article -
20
一种基于Kepler架构GPU的通信仿真加速方法
ISSN: 1000-0801Vydáno: 中国通信学会 01.10.2015Vydáno v 电信科学 (01.10.2015)“…,统一计算设备架构)技术加速通信仿真中DFT(discreteFouriertransfotin,离散傅里叶变换)处理过程的方法。该方法的核心思想是利用线程级并行技术实现单条收发链路内部DFT运算的并行加速,并利用动态并行和Hyper-Q技术实现不同收发用户对之间链路处理过程的并行加速.从而最终达到加速仿真中DFT处理过程…”
Získat plný text
Journal Article