文章目录
- Abstract
- 1 Introduction
- 2 图上的贪婪算法的通用表述
Abstract
为NP-hard组合优化问题设计好的启发式或近似算法通常需要大量的专业知识和试错。我们能否自动化这个具有挑战性、乏味的过程,而不是学习算法呢?在许多实际应用中,通常是相同的优化问题一次又一次地被解决,保持相同的问题结构,但数据不同。这为学习利用这些重复问题结构的启发式算法提供了机会。在本文中,我们提出了一种独特的结合强化学习和图嵌入的方法来解决这一挑战。学习到的贪婪策略表现得像一个元算法,它逐步构建解,行动由捕捉当前解状态的图嵌入网络的输出决定。我们展示了我们的框架可以应用于多种图上的优化问题,并为最小顶点覆盖、最大割和旅行商问题学习了有效的算法。
1 Introduction
在社交网络、交通、电信和调度等多个应用领域中出现的图组合优化问题都是NP-hard的,因此多年来吸引了理论和算法设计界的极大兴趣。实际上,在Karp关于可归约性的重要论文[19]中提到的21个问题里,有10个是图优化问题的决策版本,而其他11个问题(如集覆盖问题)大多数也可以自然地在图上表述。解决NP-hard图优化问题的传统方法主要有三种:精确算法、近似算法和启发式算