
学位论文简介
目前,对于互联网用户和应用而言,对于数据内容的关注程度已经远胜于数据位置,因此涌现出诸多基于数据内容的网络应用和架构设计。在这样一种互联网设计理念下,基于数据内容的路由查找和模式匹配是影响网络性能的两大核心关键技术,而如今这两项关键技术难以平衡匹配速度、存储开销和更新性能。为此,本文从算法设计和异构协同设计两个角度入手展开如下几点工作:
(1)提出了一种基于多核加速的最长数据名前缀匹配算法,将前缀分长度保存于不同的哈希表中,并且以二分搜索的方式查找这些哈希表,此外每个哈希表都关联着一个Bloom过滤器用以保存前缀标记。对于Bloom过滤器和哈希表的查找分别采用“任务并行”和“数据并行”的方式进行多核加速,在不增加额外存储开销的情况下实现算法加速。
(2)提出了一种低假阳性率的混合计数Bloom过滤器(HyCBF)数据结构,基于此提出了一种二分搜索算法HyBS。HyCBF采用特征比特位图降低二分搜索中的查找回溯,并为HyBS提供更为丰富的查找指示信息,优化其二分搜索的探测效率。此外,还针对提出了一种针对二分搜索法的“自底向上”快速更新算法。本文还将算法集成到了开源数据包处理平台上,实现了算法的系统部署。
(3)针对多数据名模式匹配(MNPM)问题提出了一种组件化数据名多模式匹配算法CWM。CWM是针对传统多模式匹配存在的存储开销大、更新效率低以及查找性能不足的问题,利用数据名组件化的结构特点,基于后缀筛选的思想并结合滑动窗口方法,设计出一套基于哈希表的高效多数据名模式匹配算法。该算法支持动态更新和快速构建,具有快速匹配和低存储开销的特点。
(4)基于可编程交换机和通用服务器,提出了一种结合可编程ASIC和通用CPU的异构协同加速系统,针对数据名查找算法进行功能拆解,有选择性地将其中重要功能卸载到可编程交换机中,大幅度减少CPU部分的计算开销,进而实现了数据名查找的加速,提高了系统的整体吞吐能力。
主要学术成果
学术论文:
许可, 李彦彪, 谢高岗, 张大方. 基于混合计数布隆过滤器的高效数据名查找方法[J]. 计算机研究与发展, 2023, 60(5):1136-1150. (CCF-A类中文期刊)
Ke Xu, Dafang Zhang, Yanbiao Li. Longest name prefix match on multi-core processor[C]. International Conference on High Performance Computing and Communications, Zhangjiajie, China, 2019:1035-1042. (CCF-C类会议)
发明专利:
李彦彪, 谢高岗, 许可. 一种针对GPU加速多步长前缀树的更新序列维护方法:中国,ZL2020111595353.2[P]. 2020-12-29. (已授权)
许可, 李彦彪, 谢高岗,张大方. 一种用于数据名匹配的多模式匹配方法:中国,202311109724.5. 2023-12-5. (实审中)