什么是進程和線程
有一定基礎的小伙伴們肯定都知道進程和線程。
進程是什么呢?
直白地講,進程就是應用程序的啟動實例。比如我們運行一個游戲,打開一個軟件,就是開啟了一個進程。
進程擁有代碼和打開的文件資源、數據資源、獨立的內存空間。
線程又是什么呢?
線程從屬于進程,是程序的實際執行者。一個進程至少包含一個主線程,也可以有更多的子線程。
線程擁有自己的棧空間。
有人給出了很好的歸納:
對操作系統來說,線程是最小的執行單元,進程是最小的資源管理單元。
無論進程還是線程,都是由操作系統所管理的。
Java中線程具有五種狀態:
初始化
可運行
運行中
阻塞
銷毀
這五種狀態的轉化關系如下:
但是,線程不同狀態之間的轉化是誰來實現的呢?是JVM嗎?
并不是。JVM需要通過操作系統內核中的TCB(Thread Control Block)模塊來改變線程的狀態,這一過程需要耗費一定的CPU資源。
進程和線程的痛點
線程之間是如何進行協作的呢?
最經典的例子就是生產者/消費者模式:
若干個生產者線程向隊列中寫入數據,若干個消費者線程從隊列中消費數據。
這段代碼做了下面幾件事:
1.定義了一個生產者類,一個消費者類。
2.生產者類循環100次,向同步隊列當中插入數據。
3.消費者循環監聽同步隊列,當隊列有數據時拉取數據。
4.如果隊列滿了(達到5個元素),生產者阻塞。
5.如果隊列空了,消費者阻塞。
上面的代碼正確地實現了生產者/消費者模式,但是卻并不是一個高性能的實現。為什么性能不高呢?原因如下:
1.涉及到同步鎖。
2.涉及到線程阻塞狀態和可運行狀態之間的切換。
3.涉及到線程上下文的切換。
以上涉及到的任何一點,都是非常耗費性能的操作。
這個時候我們的主角 攜程,啊!!! 不對不是這個攜程,是協程!!! 就要登場了。
協程,英文Coroutines,是一種比線程更加輕量級的存在。正如一個進程可以擁有多個線程一樣,一個線程也可以擁有多個協程。協程的調度完全由用戶控制。協程擁有自己的寄存器上下文和棧。協程調度切換時,將寄存器上下文和棧保存到其他地方,在切回來的時候,恢復先前保存的寄存器上下文和棧,直接操作棧則基本沒有內核切換的開銷,可以不加鎖的訪問全局變量,所以上下文的切換非常快。協程與線程主要區別是它將不再被內核調度,而是交給了程序自己而線程是將自己交給內核調度,所以也不難理解golang中調度器的存在。
最重要的是,協程不是被操作系統內核所管理,而完全是由程序所控制(也就是在用戶態執行)。
這樣帶來的好處就是性能得到了很大的提升,不會像線程切換那樣消耗資源。
這段代碼十分簡單,即使沒用過python的小伙伴應該也能基本看懂。
代碼中創建了一個叫做consumer的協程,并且在主線程中生產數據,協程中消費數據。
其中yield?是python當中的語法。當協程執行到yield關鍵字時,會暫停在那一行,等到主線程調用send方法發送了數據,協程才會接到數據繼續執行。
但是,yield讓協程暫停,和線程的阻塞是有本質區別的。協程的暫停完全由程序控制,線程的阻塞狀態是由操作系統內核來進行切換。
因此,協程的開銷遠遠小于線程的開銷。
協程的應用
有哪些編程語言應用到了協程呢?我們舉幾個栗子:
Lua語言
Lua從5.0版本開始使用協程,通過擴展庫coroutine來實現。
Python語言
正如剛才所寫的代碼示例,python可以通過 yield/send 的方式實現協程。在python 3.5以后,?async/await 成為了更好的替代方案。
Go語言
Go語言對協程的實現非常強大而簡潔,可以輕松創建成百上千個協程并發執行。
Java語言
如上文所說,Java語言并沒有對協程的原生支持,但是某些開源框架模擬出了協程的功能,有興趣的小伙伴可以看一看Kilim框架的源碼:
https://github.com/kilim/kilim