kmp算法 next[]數組的兩種求法

next數組兩種求法

image.png

一、求法的文字描述

(1)第一種求法:根據前一個字符的next值求字符串記作 p;next 數組記作 next;

約定:

  • 下標從 1 開始算,注意,不是從 0 開始算

  • 字符串長度 >2

  • 1)第一個字母的 next 值置 0 (nesxt[1] = 0),第二個字母的 next 值置 1(next[2] = 1)

  • 2)從第 3 個開始,計算第 i 個位置的 next 值時,檢查

p[i-1]== p[next[i-1]] ?(即這兩個值是否相等)

解釋:第 i 個位置的前一個位置的值(即 p[i-1])與以該位置的next 值(即 next[i-1])為下標的值(即 p[next[i-1]])是否相等

若相等,則 next[i] = next[i-1] + 1

若不等,則繼續往回找,檢查

p[i-1]== p[next[next[i-1]]] ?

若相等,則 next[i] = next[next[i-1]] + 1

若不等,則繼續往回找,直到找到下標為 1 還不等(即字符串第一個元素),直接賦值 next[i] = 1

(2)第二種求法:根據最大公共元素長度求

首先附上講解的博文地址,里面有詳細講解

  • 1)算出每一個字母前綴后綴的最大公共元素長度
  • 2)最大公共元素長度整體向后移動一個長度,最前面的元素值填 -1,即為 next 數組的第一版本
  • 3)(如果你需要的 next 數組第一個值為 -1,這步就可以省略了)next 數組的每一個值分別+1,即求得 next 數組。

前綴后綴的最大公共元素長度

  • 前綴:即從第一個字母開始往后看到最后一個字母(不包括)為止的字符串的以第一個字母開頭的子串(比如 "abab" 的前綴有a,ab,aba);

  • 后綴:即從最后一個字母開始往前看到第一個字母(不包括)為止的字符串的以最后一個字符為末尾的子串(比如 "abab" 的后綴有b,ab,bab);

  • 最大公共子串長度:也就是前綴和后綴擁有的相同子串的最大長度;

    以"abab"為例:

模式串的各個子串 前綴 后綴 最大公共元素長度
a 0
ab a b 0
aba a,ab a,ba 1
abab a,ab,aba b,ab,bab 2

二、實例

現在求字符串 P = "ababaaababaa"

(1) 對于上面的第一種解法

  1. 初始化
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1

2)求下標為3的字符的next值

  • P[3-1] = P[2] = 'b';
  • next[3-1] = next[2] = 1 ;
  • P[next[3-1]] = P[1] = 'a';
  • P[3-1] != P[next[3-1]] ,但是此時已經回溯到了第一個元素
  • ∴ 直接P[3] = 1 ;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1

3)求下標為 4 的字符的 next 值

  • P[4-1] = P[3] = 'a';
  • next[4-1] = next[3] = 1 ;
  • P[next[4-1]] = P[1] = 'a';
  • P[4-1] == P[next[4-1]] ;
  • ∴ next[4] = next[4-1] + 1 = 2 ;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2

4)求下標為 5 的字符的 next 值

  • P[5-1] = P[4] = 'b';
  • next[5-1] = next[4] = 2 ;
  • P[next[5-1]] = P[2] = 'b';
  • P[5-1] == P[next[5-1]] ;
  • ∴ next[5] = next[5-1] + 1 = 3 ;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3

5)求下標為 6 的字符的 next 值

  • P[6-1] = P[5] = 'a';
  • next[6-1] = next[5] = 3;
  • P[next[6-1]] = P[3] = 'a';
  • P[6-1] == P[next[6-1]];
  • 所以 next[6] = next[6 - 1] + 1 = 4;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4

6)求下標為 7 的字符的 next 值

  • P[7-1] = P[6] = 'a';
  • next[7-1] = next[6] = 4;
  • P[next[7-1]] = P[4] = 'b';
  • P[7-1] != P[next[7-1]] 并且現在還沒有回溯到第一個,繼續
  • next[next[7-1]] = next[4] = 2;
  • P[next[next[7-1]]] = P[2] = 'b';
  • P[7-1] != P[next[next[7-1]]] 并且現在還沒有回溯到第一個,繼續
  • next[next[next[7-1]]] = 1;
  • P[next[next[next[7-1]]] = 'a';
  • P[7-1] == P[next[next[next[7-1]]]];
  • 所以next[7] = next[next[next[7-1]]] + 1 = next[2] + 1 = 2
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2

7)求下標為 8 的字符的 next 值

  • P[8-1] = P[7] = 'a';
  • next[8-1] = next[7] = 2;
  • p[next[8-1]] = P[2] = 'b';
  • P[8-1] != P[next[8-1]] 并且現在還沒有回溯到第一個,繼續
  • next[next[8-1]] = 1;
  • P[next[next[8-1]]] = p[1] = 'a';
  • P[8-1] == P[next[next[8-1]]];
  • 所以next[8] = next[next[8-1]] + 1 = 2;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2

8)求下標為 9 的字符的 next 值

  • 推導過程同4) => next[10] = next[10-1] + 1 = 4 ;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2 3

9)求下標為 10 的字符的 next 值

  • 推導過程同4) => next[10] = next[10-1] + 1 = 4 ;
P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2 3 4

10)求下標為 11 的字符的 next 值
推導過程同4) => next[11] = next[11-1] + 1 = 5 ;

P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2 3 4 5

11)求下標為 12 的字符的 next 值
推導過程同4) => next[12] = next[12-1] + 1 = 6;

P a b a b a a a b a b a a
下標 1 2 3 4 5 6 7 8 9 10 11 12
next 0 1 1 2 3 4 2 2 3 4 5 6

(2) 對于上面的第二種解法

image.png

1)算出每一個字母前綴后綴的最大公共子串長度

P a b a b a a a b a b a a
前后綴最大公共子串長度 0 0 1 2 3 1 1 2 3 4 5

2)最大公共子串長度整體向后移動一個長度,最前面的元素值填 -1,即為 next 數組的第一版本

P a b a b a a a b a b a a
前后綴最大公共子串長度 -1 0 0 1 2 3 1 1 2 3 4 5

三、代碼實現

void getnext(seqstring *p, int next[])
{
    int i, j;
    next[0] = -1;
    i = 0; j = -1;
    while (i < p->length)
    {
        if (j == -1 || p->str[i] == p->str[j])
        {
            ++i;
            ++j;
            next[i] = j;
        }
        else
            j = next[j];
    }
    for (i = 0; i < p->length; i++)
        printf("%d ", next[i]);
}

四、驗證

#include "stdio.h"
#include "stdlib.h"
#define MAXSIZE 100

typedef struct {
    char str[MAXSIZE];
    int length;
}seqstring;

void getnext(seqstring *p, int next[])
{
    int i, j;
    next[0] = -1;
    i = 0; j = -1;
    while (i < p->length)
    {
        if (j == -1 || p->str[i] == p->str[j])
        {
            ++i;
            ++j;
            next[i] = j;
        }
        else
            j = next[j];
    }
    for (i = 0; i < p->length; i++)
        printf("%d ", next[i]);
}

int main()
    {
    int i, j = 0;
    seqstring str;
    str.length = 0;
    printf("請輸入字符串的長度:\n");
    scanf("%d", &j);
    getchar();
    for (i = 0; i < j; i++)
    {
        scanf("%c", &str.str[i]);
        str.length++;
    }
    int next[] = { 0 };
    getnext(&str, next);
    system("pause");
    return 0;
}
234
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372

推薦閱讀更多精彩內容