
学位论文简介
稀疏张量由于能够更加紧凑地表示数据,同时保留了重要的信息,因此受到了广泛的关注。然而,高维且稀疏的特性对计算和存储造成了巨大挑战,传统的数据处理方法无法有效处理稀疏张量数据。因此,本研究主要围绕CPU-GPU异构平台上稀疏张量运算的并行算法设计和性能优化展开研究工作,取得了以下主要创新性研究成果:
针对内存限制类型的张量运算中计算效率问题,设计了一种名为IAP-SpTV的创新性方法。IAP-SpTV的独特之处在于其适应性,不仅适用于各类数据类型和硬件环境,还能够巧妙地最大程度地重叠计算和数据传输,从而极大增强了计算性能和效率。
针对批量计算类型的张量运算中的批量处理的过程,专注于CPU-GPU异构平台,为SpTTM精心设计了一系列专门的异构并行算法,以适应不同硬件架构的独特特性。这项创新性的设计不仅显著提高了计算速度,同时也优化了计算资源的高效利用。
针对高维计算类型的张量运算中的高维特性,设计了一种名为BCB-SpTC的独特性方法。该方法不仅在充分发挥了新一代GPU性能优势的同时,也显著加速了高维稀疏数据的并行计算。
针对序贯计算类型的张量运算中计算依赖问题,提出了一种名为HLSTO的方法以应对SpTMCM在新兴计算核心TCU上的挑战。这一方法极具灵活性,能够充分利用GPU上不同计算核心的优势,从而实现对连续张量乘法运算的性能加速。
主要学术成果
Haotian Wang, Wangdong Yang, Rong Hu, Renqiu Ouyang, Kenli Li, Keqin Li. A Novel Parallel Algorithm for Sparse Tensor Matrix Chain Multiplication via TCU-acceleration[J]. IEEE Transactions on Parallel and Distributed Systems, 2023, 34(8): 2419-2432. (第一作者,JCR 1区,SCI 2区,CCF A类期刊,IF:5.3)
Haotian Wang, Wangdong Yang, Rong Hu, Renqiu Ouyang, Kenli Li, Keqin Li. IAP-SpTV: An Input-aware Adaptive Pipeline SpTV via GCN on CPU-GPU[J]. Journal of Parallel and Distributed Computing, 2023, 181C:104741. (第一作者,JCR 1区,SCI 2区,CCF B类期刊,IF:3.8)
Haotian Wang, Wangdong Yang, Renqiu Ouyang, Rong Hu, Kenli Li, Keqin Li. A Heterogeneous Parallel Computing Approach Optimizing SpTTM on CPU-GPU via GCN[J]. ACM Transactions on Parallel Computing, 2023, 10(2): 1-23. (第一作者,ACM Trans 源刊,IF:1.6)
Haotian Wang, Huigui Rong, Qun Zhang, Daibo Liu, Chunhua Hu, Yupeng Hu. Good or Mediocre? A Deep Reinforcement Learning Approach for Taxi Revenue Efficiency Optimization[J]. IEEE Transactions on Network Science and Engineering, 2020, 7(4): 3018-3027. (第一作者,JCR 1区,SCI 3区,IF:6.6)
阳王东, 王昊天, 张宇峰, 林圣乐, 蔡沁耘. 异构混合并行计算综述[J]. 计算机科学, 2021, 48(12): 24-28.(第二作者,CSCD中文核心收录,CCF B类中文期刊)