当前位置: 首页 > news >正文

【leetcode】最长公共子路径问题

滚动hash

滚动哈希(rolling hash)也叫 Rabin-Karp 字符串哈希算法,它是将某个字符串看成某个进制下的整数,并将其对应的十进制整数作为hash值。

滚动hash算法的推导

假设有一个长度为n的数组a[0],a[1],a[2],…a[n-1],数组中的最大值为ma, 我们选取进制k满足k>ma,将数组a看成是n位k进制整数,那么其对应的10进制整数为:

∑ i = 0 n − 1 a [ i ] ∗ k n − 1 − i \sum_{i=0}^{n-1} a[i] * k^{n-1-i} i=0n1a[i]kn1i

这样一来,在子数组长度固定的前提下,给定进制 k,子数组与其十进制值满足「一一对应」的关系,即不会有两个不同的子数组,它们的十进制值相同。因此滚动哈希得到的哈希值是可以表示原子数组的。

滚动哈希的一大优势在于,如果我们需要求出一个数组中长度为 len 的所有子数组的哈希值,需要的时间仅为线性,即如果我们已经计算出数组中以 j 开始的子数组的哈希值:

h a s h ( j ) = ∑ i = 0 l e n − 1 a [ j + i ] ∗ k l e n − 1 − i hash(j) = \sum_{i=0}^{len-1} a[j+i] * k^{len-1-i} hash(j)=i=0len1a[j+i]klen1i

那么要计算以 j+1 开始的子数组的哈希值,我们通过公式推导:

h a s h ( j + 1 ) = ∑ i = 0 l e n − 1 a [ j + 1 + i ] ∗ k l e n − 1 − i = ∑ i = 1 l e n a [ j + i ] ∗ k l e n − i = k ( ∑ i = 1 l e n a [ j + i ] ∗ k l e n − 1 − i ) = k ( h a s h ( j ) − a [ j ] ∗ k l e n − 1 + a [ j + l e n ] ∗ k − 1 ) = k ∗ h a s h ( j ) − a [ j ] ∗ k l e n + a [ j + l e n ] \begin{aligned} hash(j+1) &= \sum_{i=0}^{len-1} a[j+1+i] * k^{len-1-i} \\ &= \sum_{i=1}^{len} a[j+i]*k^{len-i} \\ &= k(\sum_{i=1}^{len} a[j+i]*k^{len-1-i}) \\ &= k(hash(j) - a[j]*k^{len-1} + a[j+len]*k^{-1}) \\ &= k*hash(j) - a[j]*k^{len} + a[j+len] \end{aligned} hash(j+1)=i=0len1a[j+1+i]klen1i=i=1lena[j+i]kleni=k(i=1lena[j+i]klen1i)=k(hash(j)a[j]klen1+a[j+len]k1)=khash(j)a[j]klen+a[j+len]

就可以在 ϕ ( 1 ) \phi(1) ϕ(1)的时间内得到该值。

利用滚动hash算法计算最长公共子路径的代码示例如下:

请添加图片描述

上述代码的执行效率较低,以下代码通过二分法优化,可以有效降低代码的时间复杂度:

def longest_common_subpath_2(n: int, paths: List[List[int]]) -> int:mod = (10 ** 9 + 7) * (10 ** 9 + 9)base = 10 ** 6 + 3# get min len of pathsmin_len = len(min(paths, key=lambda x: len(x)))def check(x: int) -> bool:k = pow(base, x, mod)hash_values = defaultdict(int)for path in paths:cnt = Counter()hash_value = 0for i in range(x):hash_value = (hash_value * base + path[i]) % modcnt[hash_value] += 1hash_values[hash_value] += 1for i in range(x, len(path)):hash_value = (hash_value * base + path[i] - path[i - x] * k) % modif hash_value not in cnt:cnt[hash_value] += 1hash_values[hash_value] += 1return max(hash_values.values(), default=0) == len(paths)l, r, ans = 1, min_len, 0while l <= r:mid = (l + r) >> 1if check(mid):ans = midl = mid + 1else:r = mid - 1return ans
http://www.xdnf.cn/news/188497.html

相关文章:

  • 从大众传媒到数字生态:开源AI智能名片链动2+1模式S2B2C商城小程序驱动的营销革命
  • prompt提示词编写技巧
  • Context7 MCP:提供实时、版本特定的文档以解决AI幻觉问题
  • Go 语言入门:(一) 环境安装
  • 大语言模型(LLMs)微调技术总结
  • web 基础与 http 协议
  • 【JAVA ee初阶】多线程(3)
  • es+kibana---集群部署
  • MYOJ_1349:(洛谷P3951)[NOIP 2017 提高组] 小凯的疑惑(数学公式套用,两步搞定代码)
  • 快速上手QEMU:创建你的第一个虚拟机实例
  • 深入浅出限流算法(一):简单但有“坑”的固定窗口计数器
  • 大数据应用开发和项目实战
  • 第五章、SpringBoot与消息通信(三)
  • 线性代数——行列式⭐
  • 任意波形发生器——2路同步DA模拟量输出卡
  • 项目管理 - 1.Maven
  • [特殊字符] SpringCloud项目中使用OpenFeign进行微服务远程调用详解(含连接池与日志配置)
  • stm32week13
  • Swiper 在 Vue 中的使用指南
  • 02《小地图实时》Unity
  • 榕壹云信用租赁系统:基于ThinkPHP+MySQL+UniApp的全链路免押租赁解决方案
  • [ACTF2020 新生赛]Include [ACTF2020 新生赛]Exec
  • 基于ffmpeg的音视频编码
  • 电路研究9.3.2——合宙Air780EP中的AT开发指南:HTTP(S)-PDP的研究
  • 【图论 拓扑排序 bfs】P6037 Ryoku 的探索|普及+
  • SpeedyAutoLoot
  • DeepSeek+Dify之五工作流引用API案例
  • 在自动驾驶数据闭环中的特征工程应用
  • VSCode 查看文件的本地修改历史
  • 大模型(LLMs)加速篇