本文最后更新于 123 天前,如有失效请评论区留言。
class Node:
__slots__ = 'son', 'fail', 'last', 'len', 'cost'
def __init__(self):
self.son = [None] * 26
self.fail = None # 当 cur.son[i] 不能匹配 target 中的某个字符时,cur.fail.son[i] 即为下一个待匹配节点(等于 root 则表示没有匹配)
self.last = None # 后缀链接(suffix link),用来快速跳到一定是某个 words[k] 的最后一个字母的节点(等于 root 则表示没有)
self.len = 0
self.cost = inf
class AhoCorasick:
def __init__(self):
self.root = Node()
def put(self, s: str, cost: int) -> None:
cur = self.root
for b in s:
b = ord(b) - ord('a')
if cur.son[b] is None:
cur.son[b] = Node()
cur = cur.son[b]
cur.len = len(s)
cur.cost = min(cur.cost, cost)
def build_fail(self) -> None:
self.root.fail = self.root.last = self.root
q = deque()
for i, son in enumerate(self.root.son):
if son is None:
self.root.son[i] = self.root
else:
son.fail = son.last = self.root # 第一层的失配指针,都指向根节点 ∅
q.append(son)
# BFS
while q:
cur = q.popleft()
for i, son in enumerate(cur.son):
if son is None:
# 虚拟子节点 cur.son[i],和 cur.fail.son[i] 是同一个
# 方便失配时直接跳到下一个可能匹配的位置(但不一定是某个 words[k] 的最后一个字母)
cur.son[i] = cur.fail.son[i]
continue
son.fail = cur.fail.son[i] # 计算失配位置
# 沿着 last 往上走,可以直接跳到一定是某个 words[k] 的最后一个字母的节点(如果跳到 root 表示没有匹配)
son.last = son.fail if son.fail.len else son.fail.last
q.append(son)