從0開始自制解釋器——實(shí)現(xiàn)簡(jiǎn)單的加法計(jì)算器

為什么要學(xué)習(xí)編譯器和解釋器呢?文中的作者給出的答案有下面幾個(gè):

  1. 為了深入理解計(jì)算機(jī)是如何工作的:一個(gè)顯而易見的道理就是,如果你不懂編譯器和解釋器是如何工作的那么你就不明白計(jì)算機(jī)是如何工作的
  2. 編譯器和解釋器用到的一些原理和編程技巧以及算法在其他地方也可以用到。學(xué)習(xí)編譯器和解釋器能夠?qū)W到并強(qiáng)化這些技巧的運(yùn)用
  3. 為了方便日后能編寫自己的編程語(yǔ)言或者專用領(lǐng)域的特殊語(yǔ)言

接下來(lái)我們就從0開始一步一步的構(gòu)建自己的解釋器。跟著教程先制作一個(gè)簡(jiǎn)單的加法計(jì)算器,為了保證簡(jiǎn)單,這個(gè)加法計(jì)算器能夠解析的表達(dá)式需要滿足下面幾點(diǎn):

  1. 目前只支持加法運(yùn)算
  2. 目前只支持兩個(gè)10以內(nèi)的整數(shù)的計(jì)算
  3. 表達(dá)式之間不能有空格
  4. 只能計(jì)算一次加法

舉一個(gè)例子來(lái)說(shuō),它可以計(jì)算諸如"1+2"、"5+6" 這樣的表達(dá)式,但是不能計(jì)算像 "11+20"(必須是10以內(nèi))、"1.1+2"(需要兩個(gè)數(shù)都是整數(shù))、"1 + 2"(中間不能有空格)、"1+2+3"(只能計(jì)算一次加法)

有了這些限制,我們很容易就能實(shí)現(xiàn)出來(lái)。

實(shí)現(xiàn)的算法

假設(shè)我們要計(jì)算表達(dá)式 5+6。這里主要的步驟是通過(guò)字符串保存表達(dá)式,然后通過(guò)索引依次訪問(wèn)每個(gè)字符,分別找到兩個(gè)整數(shù)和加法運(yùn)算符,最后實(shí)現(xiàn)兩個(gè)整數(shù)相加的操作。

第一步,我們的索引在表達(dá)式字符串的開始位置,解析得到當(dāng)前位置的字符是一個(gè)整數(shù),我們給它打上標(biāo)記,類型為整形,值為5。


1.png

第二步,索引向前推進(jìn),解析當(dāng)前位置的字符是一個(gè)+。還是給它打上標(biāo)記,類型為plus,值為+

2.png

第三步,索引繼續(xù)前進(jìn),解析到當(dāng)前位置的字符是一個(gè)整數(shù),我們給它打上標(biāo)記,類型為整形,值為6


3.png

最后一步,根據(jù)得到的兩個(gè)整數(shù)以及要執(zhí)行的算術(shù)運(yùn)算,我們將兩個(gè)數(shù)直接進(jìn)行相加得到最終結(jié)果

具體的代碼

首先我們定義這個(gè)標(biāo)記的類型,目前支持整數(shù)以及加法的標(biāo)記

typedef enum e_TokenType
{
    CINT = 0, //整型
    PLUS //加法運(yùn)算符
}ETokenType;

// 這里因?yàn)橹恢С?0以內(nèi)的整數(shù),所以表示計(jì)算數(shù)字的字符只有一個(gè),加上字符串最后的結(jié)束標(biāo)記,字符數(shù)組只需要兩個(gè)即可
typedef struct Token
{
    ETokenType type; //類型
    char value[2]; //值
}Token, *LPTOKEN;

接著定義一些全局變量來(lái)保存算術(shù)運(yùn)算的表達(dá)式和當(dāng)前指針的索引

char* g_pszUserBuf = NULL;
char* g_pPosition = NULL;

接著我們定義一個(gè)函數(shù)來(lái)模擬上述說(shuō)到的不斷解析每一個(gè)字符的過(guò)程

bool get_next_token(LPTOKEN pToken)
{
    char* sz = g_pPosition;
    g_pPosition++;
    pToken->value[0] = '\0';
    if (*sz >= '0' && *sz <= '9')
    {
        pToken->type = CINT;
        pToken->value[0] = *sz;
        return true;
    }
    else if (*sz == '+')
    {
        pToken->type = PLUS;
        pToken->value[0] = *sz;
        return true;
    }
    else
    {
        pToken->value[0] = '\0';
        return false;
    }
}

最后我們定義一個(gè)函數(shù)來(lái)執(zhí)行獲取每個(gè)標(biāo)記并最終計(jì)算結(jié)果的操作

int expr()
{
    int val1 = 0, val2 = 0;
    Token token = { 0 };
    if (get_next_token(&token) && token.type == CINT)
    {
        val1 = atoi(token.value);
    }
    else
    {
        printf("首個(gè)字符必須是整數(shù)");
        return -1;
    }

    if (get_next_token(&token) && token.type == PLUS)
    {
    }
    else
    {
        printf("第二個(gè)字符必須是操作符,并且當(dāng)前只支持 + 運(yùn)算");
        return -1;
    }

    if (get_next_token(&token) && token.type == CINT)
    {
        val2 = atoi(token.value);
    }

    printf("%d+%d=%d\n", val1, val2, val1 + val2);
}

main函數(shù)里面我們只需要建立一個(gè)緩沖來(lái)保存字符,并且在循環(huán)中不斷等待用戶輸入,完成解析并輸出結(jié)果即可

// 重制當(dāng)前解析環(huán)境
void reset()
{
    memset(g_pszUserBuf, 0x00, 16 * sizeof(char));
    scanf_s("%s", g_pszUserBuf);
    g_pPosition = g_pszUserBuf;
}

int main()
{
    g_pszUserBuf = (char*)malloc(16 * sizeof(char));
    while (1)
    {
        printf(">>>");
        reset();
        if (strcmp(g_pszUserBuf, "exit") == 0)
        {
            break;
        }
        expr();
    }
    return 0;
}

最終執(zhí)行的結(jié)果如下


4.png

最后的總結(jié)

程序我們已經(jīng)寫完了,你可能覺(jué)得這個(gè)程序太簡(jiǎn)單了,只能做這點(diǎn)事情。別著急,后面將會(huì)逐步的去完善這個(gè)程序。以便它能實(shí)現(xiàn)更加復(fù)雜的運(yùn)算。

最后我們來(lái)引入一些概念性的東西:

  1. 我們將輸入內(nèi)容按照一定規(guī)則打上的標(biāo)記被稱之為Token
  2. 上述get_next_token函數(shù)體現(xiàn)的將一段字符串分割并打上有意義的標(biāo)簽的過(guò)程被稱為詞法分析。
  3. 解釋器工作的第一步就是將輸入的字符串按照一定的規(guī)則轉(zhuǎn)換為一系列有意義的標(biāo)記。完成這個(gè)工作的組件被稱之為詞法分析器,也可以被稱為掃描器或者分詞器
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,460評(píng)論 6 538
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 99,067評(píng)論 3 423
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人,你說(shuō)我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,467評(píng)論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,468評(píng)論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 72,184評(píng)論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 55,582評(píng)論 1 325
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,616評(píng)論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,794評(píng)論 0 289
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 49,343評(píng)論 1 335
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 41,096評(píng)論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 43,291評(píng)論 1 371
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,863評(píng)論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,513評(píng)論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,941評(píng)論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,190評(píng)論 1 291
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 52,026評(píng)論 3 396
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 48,253評(píng)論 2 375

推薦閱讀更多精彩內(nèi)容