久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

您的位置:首頁技術(shù)文章
文章詳情頁

詳解KMP算法以及python如何實(shí)現(xiàn)

瀏覽:2日期:2022-07-10 17:12:52

算法思路

Knuth-Morris-Pratt(KMP)算法是解決字符串匹配問題的經(jīng)典算法,下面通過一個(gè)例子來演示一下:

給定字符串'BBC ABCDAB ABCDABCDABDE',檢查里面是否包含另一個(gè)字符串'ABCDABD'。

1.從頭開始依次匹配字符,如果不匹配就跳到下一個(gè)字符

詳解KMP算法以及python如何實(shí)現(xiàn)

詳解KMP算法以及python如何實(shí)現(xiàn)

2.直到發(fā)現(xiàn)匹配字符,然后經(jīng)過一個(gè)內(nèi)循環(huán)嚴(yán)查字符串是否匹配

詳解KMP算法以及python如何實(shí)現(xiàn)

3.發(fā)現(xiàn)最后一個(gè)D不匹配,下面就該思考應(yīng)該把字符串向右移動多少個(gè)位置呢?傳統(tǒng)做法可能是移動一格,KMP算法就創(chuàng)新在這里。KMP算法通過查詢一個(gè)Partial Match Table(表內(nèi)存有字符串信息),然后計(jì)算出需要移動的步數(shù),這個(gè)表后面會介紹怎么來的。

詳解KMP算法以及python如何實(shí)現(xiàn)

這里我們看到D前面是B,查表得到第二個(gè)B對應(yīng)的是2,所以 移動數(shù) = 已匹配字符數(shù) - 查表所得數(shù) 也就是 6 - 2 = 4, 需要向右移動四格。

詳解KMP算法以及python如何實(shí)現(xiàn)

下面也是重復(fù)這個(gè)步驟

詳解KMP算法以及python如何實(shí)現(xiàn)

直到發(fā)現(xiàn)匹配或者字符長度超出(未發(fā)現(xiàn)匹配)。

Partial Match Table

那么這個(gè)查詢的表是怎么來的呢?仍然以'ABCDABD'為例

詳解KMP算法以及python如何實(shí)現(xiàn)

- 'A'的前綴和后綴都為空集,共有元素的長度為0;

- 'AB'的前綴為[A],后綴為[B],共有元素的長度為0;

- 'ABC'的前綴為[A, AB],后綴為[BC, C],共有元素的長度0;

- 'ABCD'的前綴為[A, AB, ABC],后綴為[BCD, CD, D],共有元素的長度為0;

- 'ABCDA'的前綴為[A, AB, ABC, ABCD],后綴為[BCDA, CDA, DA, A],共有元素為'A',長度為1;

- 'ABCDAB'的前綴為[A, AB, ABC, ABCD, ABCDA],后綴為[BCDAB, CDAB, DAB, AB, B],共有元素為'AB',長度為2;

- 'ABCDABD'的前綴為[A, AB, ABC, ABCD, ABCDA, ABCDAB],后綴為[BCDABD, CDABD, DABD, ABD, BD, D],共有元素的長度為0。

python實(shí)現(xiàn)

def partial_table(p): ’’’’’partial_table('ABCDABD') -> [0, 0, 0, 0, 1, 2, 0]’’’ prefix = set() res = [0] for i in range(1, len(p)): prefix.add(p[:i]) postfix = {p[j:i + 1] for j in range(1, i + 1)} #print(p[:i+1],prefix,postfix,prefix & postfix or {’’}) res.append(len((prefix & postfix or {’’}).pop())) return resdef kmp_match(s, p): m = len(s); n = len(p) cur = 0 # 起始指針cur table = partial_table(p) while cur <= m - n: #只去匹配前m-n個(gè) for i in range(n): if s[i + cur] != p[i]:cur += max(i - table[i - 1], 1) # 有了部分匹配表,我們不只是單純的1位1位往右移,可以一次移動多位break else: return True # loop從 break 中退出時(shí),else 部分不執(zhí)行。 return Falseprint partial_table1('ABCDABD')print kmp_match('BBC ABCDAB ABCDABCDABDE', 'ABCDABD')

以上就是詳解KMP算法以及python如何實(shí)現(xiàn)的詳細(xì)內(nèi)容,更多關(guān)于python實(shí)現(xiàn)KMP算法的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 青海省| 进贤县| 绥芬河市| 大冶市| 卢湾区| 文安县| 临沂市| 万宁市| 淄博市| 军事| 永年县| 德令哈市| 四川省| 克山县| 新郑市| 新闻| 衡水市| 光山县| 新兴县| 藁城市| 中宁县| 出国| 博爱县| 青岛市| 定陶县| 闸北区| 泉州市| 沁源县| 朝阳县| 大同县| 永嘉县| 明水县| 松原市| 玛纳斯县| 兴仁县| 新蔡县| 甘德县| 双牌县| 赞皇县| 冷水江市| 新和县|