Výsledky vyhledávání - 统一计算设备架构((cuda OR puda))

  1. 1

    基于CUDA的H.264并行解码器设计与实现 Autor 陈勇 吴晓民 杨坚 奚宏生

    ISSN: 1000-3428
    Vydáno: 2016
    Vydáno v 计算机工程 (2016)
    “…针对H.264视频编解码标准复杂度高、运算量大的缺点,基于统一计算设备架构平台设计并实现CPU+GPU异构并行H.264解码器,利用GPU的并行计算能力和CPU的逻辑控制优势加快运行速度,提高解码性能。实验结果表明,与FFmpege中传统的串行解码器相比,利用GPU加速的H.264并行解码器能获得2倍~7倍的性能提升…”
    Získat plný text
    Journal Article
  2. 2

    基于混合架构的双通道实时相关器实现 Autor 裴鑫 聂俊 陈卯蒸 李健

    ISSN: 1000-3428
    Vydáno: 中国科学院新疆天文台,乌鲁木齐,830011 2016
    Vydáno v 计算机工程 (2016)
    “…为满足多波束接收机、焦面阵和天线阵等超大数据量终端的处理需求,采用以GPU并行运算为处理核心的FPGA+CPU+GPU混合架构对天文相关器进行设计,利用严格时序的FPGA进行采样和预处理,基于统一计算设备架构平台开发实现GPU并行运算信号处理与CPU逻辑控制、存储和显示。测试结果表明,该相关器运行稳定、准确,通过调节混…”
    Získat plný text
    Journal Article
  3. 3

    CUDA加速的DNA-蛋白质匹配及其优化 Autor 陈春雷 慕德俊 张慧翔 胡伟

    ISSN: 0258-7998
    Vydáno: 西北工业大学自动化学院,陕西西安,710072 2013
    Vydáno v 电子技术应用 (2013)
    “…设计实现了一种使用统一计算设备架构CUDA)加速DNA-蛋白质匹配的方法。详细介绍了一种基于退火算法的DNA-蛋白质匹配方法和CUDA的特点,从计算的角度对匹配方法进行了分析。基于CUDA设计实现并行化方法,并根据CUDA的线程调度策略对并行方法进行了优化。实验结果表明,最大可获得15倍左右的加速比。…”
    Získat plný text
    Journal Article
  4. 4

    基于GPU的三维扩散方程在反应堆计算中的应用 Autor 王飞飞 王海玲 俞海英

    ISSN: 0253-3219
    Vydáno: 中国科学院大学 北京100049%苏州工业职业技术学院软件与服务外包学院 苏州215000 2015
    Vydáno v 核技术 (2015)
    “…本文介绍了基于统一计算设备架构(Computeunmed Device Architecture,CuDA)的图形处理器(Graphic Processing Unit…”
    Získat plný text
    Journal Article
  5. 5

    基于CUDA的并行布谷鸟搜索算法设计与实现 Autor 韦向远, 杨辉华, 谢谱模

    ISSN: 1673-9418
    Vydáno: 桂林电子科技大学 电子工程与自动化学院,广西 桂林,541004%桂林电子科技大学 广西信息科学实验中心,广西 桂林,541004%桂林电子科技大学 计算机科学技术学院,广西 桂林,541004 2014
    Vydáno v 计算机科学与探索 (2014)
    “…,降低了算法计算过程中CPU与GPU的通信开销。对4个经典基准测试函数进行了仿真实验,结果表明,相比标准CS算法,基于CUDA架构的并行CS算法在求解收敛性一致的前提下,在求解速度上获得了高达110倍的计算加速比。…”
    Získat plný text
    Journal Article
  6. 6

    基于GPU平台的有效字典压缩与解压缩技术 Autor 覃子姗, 顾璠, 秦晓科, 陈铭松

    ISSN: 1673-9418
    Vydáno: 华东师范大学 软件学院,上海 200062 2014
    Vydáno v 计算机科学与探索 (2014)
    “…,GPU)对压缩与解压缩过程潜在性能的提升,结合合并内存访问与并行组装的技术,基于CUDA(compute unified device archi-tecture)平台研究了两种并行压缩与解压缩方法:基于字典的无状态压缩和基于字典的LZW压缩。实验结果表明,与传统的单核实现比较,所提方法能够显著改善已有的基于字典的串行压缩与…”
    Získat plný text
    Journal Article
  7. 7

    基于GPU的电力系统并行潮流计算的实现 Autor 夏俊峰, 杨帆, 李静, 郑秀玉

    ISSN: 1674-3415
    Vydáno: 武汉大学电气工程学院,湖北,武汉,430072%武汉国测科技股份有限公司,湖北,武汉,430223 2010
    Vydáno v 电力系统保护与控制 (2010)
    “…TM74; 在研究GPU通用计算方法和潮流计算算法的基础上,针对GPU计算密集、高度并行化等特点,对潮流计算牛顿法进行了适当的简化,并应用统一计算设备架构(Compute Unified Device Architecture,CUDA)的开发平台,提出了一种基于GPU的并行潮流计算程序的设计方法.仿真计算结果表明此…”
    Získat plný text
    Journal Article
  8. 8

    基于CUDA加速动态规划优化全景拼接的刮板输送机直线状态监测 Autor 李博, 侍守伊, 张建军, 夏蕊, 王学文, 崔卫秀, 倪强

    ISSN: 1671-251X
    Vydáno: 煤矿综采装备山西省重点实验室,山西太原 030024%中煤张家口煤矿机械有限责任公司,河北 张家口 076250 2025
    Vydáno v 工矿自动化 (2025)
    “…TD634.2; 为提高井下复杂恶劣环境下刮板输送机直线状态监测精度和实时性,提出了一种基于统一计算设备架构(CUDA)加速动态规划优化全景拼接的刮板输送机直线状态监测方法.首先,同步2路摄像头获取的刮板输送机图像的帧数、分辨率参数,对输入的视频流进行暗通道清晰化处理,以消除井下煤尘、水雾等的干扰.其次,使用ORB算法…”
    Získat plný text
    Journal Article
  9. 9

    GPGPU和CUDA统一内存研究现状综述 Autor 庞文豪, 王嘉伦, 翁楚良

    ISSN: 1000-3428
    Vydáno: 华东师范大学数据科学与工程学院,上海 200062%之江实验室交叉创新研究院,浙江 杭州 310000 2024
    Vydáno v 计算机工程 (2024)
    “…(CPU)最重要的协处理器之一.然而,GPU硬件配置在出厂后不容易更改且显存容量有限,在处理大数据集时显存容量不足的缺点对计算性能造成较大的影响.统一计算设备架构(CUDA)6.0推出了统一内存,使GPGPU和CPU可以共享虚拟内存空间,以此来简化异构编程和扩展GPGPU可访问的内存空间.统一内存为GPGPU处理大数据集提供…”
    Získat plný text
    Journal Article
  10. 10

    基于CUDA的光纤传像束光纤数量优化检测 Autor 张永杰, 陈文建, 李武森

    ISSN: 1005-8788
    Vydáno: 南京理工大学 电子工程与光电技术学院,南京 210094 2022
    Vydáno v 光通信研究 (2022)
    “…算法可大幅度降低对阈值的选取要求,并有更高的检测效率.在统一计算设备架构(CUDA)的支持下,双边滤波提速约20倍,优化算法及整体运行减少近1/2时间…”
    Získat plný text
    Journal Article
  11. 11

    弹目动态交会下的空中目标电磁散射特性并行计算方法 Autor 陈潭辉, 霍力君, 李喆

    ISSN: 1673-5048
    Vydáno: 中国空空导弹研究院,河南洛阳 471009 2024
    Vydáno v 航空兵器 (2024)
    “…TJ760; 为改善弹目动态交会场景下空中目标电磁散射特性仿真时间长、效率低的现象,本文采用基于统一计算设备架构(Compute Unified Device Architecture,CUDA)编程,基于物理光学法和物理绕射理论的并行计算方法对空中目标电磁散射特性进行计算,通过与标准体、某复杂目标的电磁散射结果作对比…”
    Získat plný text
    Journal Article
  12. 12

    基于CUDA与CUBLAS的Tucker分解模块设计与实现 Autor 周琦, 柴小丽, 马克杰, 俞则人

    ISSN: 1000-3428
    Vydáno: 中国电子科技集团公司第三十二研究所,上海,201808 2019
    Vydáno v 计算机工程 (2019)
    “…TP391; 由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用, 使得Tucker分解算法成为目前重点研究对象.但是当前流行的Tucker分解算法需要对张量进行多次展开, 导致算法加速效率降低.针对上述问题, 提出一种应用于统一计算设备架构 (CUDA) 平台上的改进Tucker分解模块, 通过…”
    Získat plný text
    Journal Article
  13. 13

    基于CPU与GPU的异构模板计算优化研究 Autor 李博, 黄东强, 贾金芳, 吴利, 王晓英, 黄建强

    ISSN: 1000-3428
    Vydáno: 清华大学 计算机科学与技术系,北京 100084 2023
    Vydáno v 计算机工程 (2023)
    “…TP393; 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题.在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种…”
    Získat plný text
    Journal Article
  14. 14

    模板运算代码的自动生成与调优框架 Autor 刘金硕, 文尧

    ISSN: 1000-3428
    Vydáno: 武汉大学国家网络安全学院空天信息安全与可信计算教育部重点实验室,湖北武汉 430072 2024
    Vydáno v 计算机工程 (2024)
    “…TP391; 针对现有模板代码生成方法不支持多图形处理器(GPU)、调优不充分等问题,提出一种由领域专用语言(DSL)描述的模板代码的自动生成与调优框架.在代码自动生成阶段,该框架能够自动解析上层提供的描述语言,构建计算图进而生成模板运算的统一计算设备架构(CUDA)核函数,同时根据单GPU或多GPU环境生成不同的主机…”
    Získat plný text
    Journal Article
  15. 15

    动脉粥样硬化斑块生成的高效流固耦合不可压缩SPH模拟方法 Autor 汪飞, 李伟鸿, 杨彧, 姜大志, 赵宝全, 罗笑南

    ISSN: 1008-9497
    Vydáno: 汕头大学 工学院 计算机系,广东 汕头 515063%深圳证券信息有限公司,广东 深圳 518000%中山大学人工智能学院,广东 珠海 519000%桂林电子科技大学 计算机与信息安全学院,广西 桂林 541004 25.11.2023
    Vydáno v 浙江大学学报(理学版) (25.11.2023)
    “…)的斑块生成模拟方法.首先,基于流固耦合不可压缩SPH方法,将血液离散为不可压缩流体粒子,以控制血液流动的稳定性;然后,使用斑块生成模型对血液、单核细胞等粒子建模,对血液成分进行病理性分析,控制斑块生成;最后,通过流固耦合作用计算血液与斑块的物理特性,模拟斑块堵塞血流过程.为使模拟结果能够实时呈现,用统一计算设备架构(compute unified device architecture,CUDA…”
    Získat plný text
    Journal Article
  16. 16

    Highly efficient fluid-solid coupled incompressible SPH simulation method for atherosclerotic plaque generation Autor Wang, Fei, Li, Weihong, Yang, Yu, Jiang, Dazhi, Zhao, Baoquan, Luo, Xiaonan

    ISSN: 1008-9497
    Vydáno: Hangzhou Zhejiang University 01.11.2023
    “…Atherosclerosis is a critical cause of cardiovascular disease and stroke. Simulating and visualizing this process is crucial to relevant medical research. To…”
    Získat plný text
    Journal Article
  17. 17

    面向GPU的直方图统计图像增强并行算法 Autor 肖汉, 孙陆鹏, 李彩林, 周清雷

    ISSN: 1673-9418
    Vydáno: 郑州大学 计算机与人工智能学院,郑州 450001%郑州师范学院 信息科学与技术学院,郑州 450044%山东理工大学 建筑工程学院,山东 淄博 255000%郑州大学 计算机与人工智能学院,郑州 450001 2022
    Vydáno v 计算机科学与探索 (2022)
    “…设备架构(CUDA)活动线程块和活动线程来并行处理不同的子图像块和像素点,提升了数据访问的效率.然后,采用内核配置参数优化和数据并行计算技术,实现了直方图统计图像增强算法在GPU平台上的并行化.最后,采用主机端和设备端间高效的数据传输模式,进一步缩短了系统在异构计算平台上的执行时间.研究表明,对于像幅大小不同的图像,图像…”
    Získat plný text
    Journal Article
  18. 18

    基于CUDA的H.264并行解码器设计与实现 Autor 陈勇, 吴晓民, 杨坚, 奚宏生

    ISSN: 1000-3428
    Vydáno: 中国科学技术大学自动化系,合肥,230027 2016
    Vydáno v 计算机工程 (2016)
    “…TP37; 针对H.264视频编解码标准复杂度高、运算量大的缺点,基于统一计算设备架构平台设计并实现CPU+GPU异构并行H.264解码器,利用GPU的并行计算能力和CPU的逻辑控制优势加快运行速度,提高解码性能.实验结果表明,与FFmpege中传统的串行解码器相比,利用GPU加速的H.264并行解码器能获得2倍~7倍…”
    Získat plný text
    Journal Article
  19. 19

    基于GPU的LLVM程序分析信息并行提取 Autor 马冬冬 衷璐洁 朱敬茹

    ISSN: 1000-3428
    Vydáno: 首都师范大学信息工程学院,北京,100048 2017
    Vydáno v 计算机工程 (2017)
    “…LLVM中间表示(IR)中包含大量的程序分析原始信息,传统基于CPU的程序分析信息提取方法大多采用串行的循环迭代方式处理较大规模程序,可扩展性较差。为此,结合图像处理器(GPU)的通用计算优势,提出一种基于统一计算设备架构的LLVM平台程序分析信息并行提取方法,在CPU上实现程序特征分析及IR预处理、存储结构设计及提取…”
    Získat plný text
    Journal Article
  20. 20

    基于GPU的Landsat8实时解压缩处理技术 Autor 杨仁忠 张洁 韦宏卫 石璐

    ISSN: 1000-3428
    Vydáno: 中国科学院遥感与数字地球研究所,北京,100094%中国科学院遥感与数字地球研究所,北京100094 2016
    Vydáno v 计算机工程 (2016)
    “…根据Landsat8卫星下行数据的特点,结合RICE无损数据压缩算法和CUDA编程技术,提出一种基于图像处理单元(GPU)的实时解压缩处理系统方案,采用统一计算设备架构和流水线式解压缩结构进行任务分解及CUDA优化。测试结果表明,与基于CPU的解压缩方案相比,基于GPU的解压缩系统获得7.45倍的加速比,能够达到…”
    Získat plný text
    Journal Article