? ? 總的來(lái)說(shuō),最近還是沒(méi)有什么碼字的心情,所以這個(gè)文章總體來(lái)說(shuō)就是一個(gè)備忘。
什么變化?
? ? 最近幾年,人工智能在Transformer方面的成果,以“算力壓制”的效果,以結(jié)果、效果直接顛覆了很多基于知識(shí)學(xué)習(xí)、規(guī)則學(xué)習(xí)時(shí)代的智能規(guī)則。
? ? 其中對(duì)于之前我提出的一些難題,也有了更多的破解的可能性。
前情回顧
? ? 2017年,算起來(lái)是7年前,寫(xiě)了一篇文章,[《外一篇 人工智能與基因工程》](http://www.lxweimin.com/p/2e194f76aee7),其中提到了人類基因信息的特點(diǎn),其類似于《天書(shū)》的結(jié)構(gòu)中,對(duì)于文字與語(yǔ)意的研究,提出了語(yǔ)意與文字、聲音之間,存在非常多的結(jié)構(gòu)問(wèn)題。
? ? 這種結(jié)構(gòu)問(wèn)題、關(guān)鍵字詞問(wèn)題,在之前的規(guī)則學(xué)習(xí)、深度學(xué)習(xí)的人工智能技術(shù)階段,是非常難處理的一件事情。
新的時(shí)代
? ? 但是,Transformer模型以及GPT的能力,讓我們看到“通過(guò)信息表象理解含義”這件事情有了比較大的進(jìn)步。
? ? Transformer模型以及GPT,基于對(duì)海量文字的學(xué)習(xí),形成了對(duì)語(yǔ)意的理解,并且在理解語(yǔ)意的基礎(chǔ)上,能夠生成符合預(yù)期的文字表達(dá)。這種為什么會(huì)生成這樣一句話的詳細(xì)規(guī)則,是人類無(wú)法理解的。
? ? 那么擴(kuò)展到基因領(lǐng)域。之前提到了:
? ? 曾經(jīng)的歷史上,有過(guò)人把人類基因普,比喻成為:“記載人類遺傳信息的’天書(shū)’”。
? ? 這篇“天書(shū)”的主要結(jié)構(gòu),是DNA,組成DNA的主要結(jié)構(gòu)是四種脫氧核苷酸(dAMP、dTMP、dCMP、dGMP)。
? ? 類比到我們所熟悉的環(huán)境中:
? ? 一個(gè)細(xì)胞核內(nèi)的所有染色體,就是一套記錄個(gè)人信息的“書(shū)”。
? ? 每一條染色體,就是一本自成體系的“書(shū)”。
? ? 而這本書(shū)的文檔類型不是Word、不是Excel,是DNA。
? ? 這本書(shū)中的字,由四個(gè)筆畫(huà)橫豎撇捺(dAMP、dTMP、dCMP、dGMP)。”
展望
? ? Transformer模型,基于強(qiáng)大的參數(shù)和算力,通過(guò)“閱讀”大量的文字,能夠理解語(yǔ)意。
? ? 那么,通過(guò)“閱讀”大量的基因圖譜,能夠理解基因含義。
? ? 現(xiàn)在是否已經(jīng)有人收集了大量的基因圖譜,開(kāi)展這種訓(xùn)練?
? ?感覺(jué)不需要多久的將來(lái),很可能有一場(chǎng)生物攻擊……
Wollaston
2024年4月20日
于 連云港