【轉】深入理解JDBC的超時設置

原文:http://www.cubrid.org/blog/dev-platform/understanding-jdbc-internals-and-timeout-configuration/

恰當的JDBC超時設置能夠有效地減少服務失效的時間。本文將對數據庫的各種超時設置及其設置方法做介紹。

真實案例:應用服務器在遭到DDos攻擊后無法響應

在遭到DDos攻擊后,整個服務都垮掉了。由于第四層交換機不堪重負,網絡變得無法連接,從而導致業務系統也無法正常運轉。安全組很快屏蔽了所有的DDos攻擊,并恢復了網絡,但業務系統卻還是無法工作。 通過分析系統的thread dump發現,業務系統停在了JDBC API的調用上。20分鐘后,系統仍處于WAITING狀態,無法響應。30分鐘后,系統拋出異常,服務恢復正常。

為什么我們明明將query timeout設置成了3秒,系統卻持續了30分鐘的WAITING狀態?為什么30分鐘后系統又恢復正常了?

當你對理解了JDBC的超時設置后,就能找到問題的答案。

為什么我們要了解JDBC

當遇到性能問題或系統出錯時,業務系統和數據庫通常是我們最關心的兩個部分。在公司里,這兩個部分是交由兩個不同的部門來負責的,因此各個部門都會集中精力地在自身領域內尋找問題,這樣的話,在業務系統和數據庫之間的部分就會成為一個盲區。對于Java應用而言,這個盲區就是DBCP數據庫連接池和JDBC,本文將集中介紹JDBC。

什么是JDBC

JDBC是Java應用中用來連接關系型數據庫的標準API。Sun公司一共定義了4種類型的JDBC,我們主要使用的是第4種,該類型的Driver完全由Java代碼實現,通過使用socket與數據庫進行通信。

圖1 JDBC Type 4.

第4種類型的JDBC通過socket對字節流進行處理,因此也會有一些基本網絡操作,類似于HttpClient這種用于網絡操作的代碼庫。當在網絡操作中遇到問題的時候,將會消耗大量的cpu資源,并且失去響應超時。如果你之前用過HttpClient,那么你一定遇到過未設置timeout造成的錯誤。同樣,第4種類型的JDBC,若沒有合理地設置socket timeout,也會有相同的錯誤——連接被阻塞。

接下來,就讓我們來學習一下如何正確地設置socket timeout,以及需要考慮的問題。

**應用與數據庫間的timeout層級 **


圖2 Timeout Class.

上圖展示了簡化后應用與數據庫間的timeout層級。(譯者注:WAS/BLOC是作者公司的具體應用名稱,無需深究) 高級別的timeout依賴于低級別的timeout,只有當低級別的timeout無誤時,高級別的timeout才能確保正常。例如,當socket timeout出現問題時,高級別的statement timeout和transaction timeout都將失效。

我們收到的很多評論中提到:

即使設置了statement timeout,當網絡出錯時,應用也無法從錯誤中恢復。

statement timeout無法處理網絡連接失敗時的超時,它能做的僅僅是限制statement的操作時間。網絡連接失敗時的timeout必須交由JDBC來處理。

JDBC的socket timeout會受到操作系統socket timeout設置的影響,這就解釋了為什么在之前的案例中,JDBC連接會在網絡出錯后阻塞30分鐘,然后又奇跡般恢復,即使我們并沒有對JDBC的socket timeout進行設置。

DBCP連接池位于圖2的左側,你會發現timeout層級與DBCP是相互獨立的。DBCP負責的是數據庫連接的創建和管理,并不干涉timeout的處理。當連接在DBCP中創建,或是DBCP發送校驗query檢查連接有效性的時候,socket timeout將會影響這些過程,但并不直接對應用造成影響。

當在應用中調用DBCP的getConnection()方法時,你可以設置獲取數據庫連接的超時時間,但是這和JDBC的timeout毫不相關。

圖3 Timeout for Each Levels.

什么是Transaction Timeout

transaction timeout一般存在于框架(Spring, EJB)或應用級。

transaction timeout或許是個相對陌生的概念,簡單地說,transaction timeout就是“Statement Timeout * N(需要執行的statement數量) + @(垃圾回收等其他時間)”。transaction timeout用來限制執行statement的總時長。

例如,假設執行一個statement需要0.1秒,那么執行少量statement不會有什么問題,但若是要執行100,000個statement則需要10,000秒(約7個小時)。這時,transaction timeout就派上用場了。EJB CMT (Container Managed Transaction)就是一種典型的實現,它提供了多種方法供開發者選擇。但我們并不使用EJB,Spring的transaction timeout設置會更常用一些。在Spring中,你可以使用下面展示的XML或是在源碼中使用@Transactional注解來進行設置。

<tx:attributes>  
        <tx:method name=“…” timeout=“3″/>  
</tx:attributes>  

Spring提供的transaction timeout配置非常簡單,它會記錄每個事務的開始時間和消耗時間,當特定的事件發生時就會對消耗時間做校驗,當超出timeout值時將拋出異常。

Spring中,數據庫連接被保存在ThreadLocal里,這被稱為事務同步(Transaction Synchronization),與此同時,事務的開始時間和消耗時間也被保存下來。當使用這種代理連接創建statement時,就會校驗事務的消耗時間。

EJB CMT的實現方式與之類似,其結構本身也十分簡單。 當你選用的容器或框架并不支持transaction timeout這一特性,你可以考慮自己來實現。transaction timeout并沒有標準的API。Lucy框架的1.5和1.6版本都不支持transaction timeout,但是你可以通過使用Spring的Transaction Manager來達到與之同樣的效果。 假設某個事務中包含5個statement,每個statement的執行時間是200ms,其他業務邏輯的執行時間是100ms,那么transaction timeout至少應該設置為1,100ms(200 * 5 + 100)。

什么是Statement Timeout?

statement timeout用來限制statement的執行時長,timeout的值通過調用JDBC的java.sql.Statement.setQueryTimeout(int timeout) API進行設置。不過現在開發者已經很少直接在代碼中設置,而多是通過框架來進行設置。 以iBatis為例,statement timeout的默認值可以通過sql-map-config.xml中的defaultStatementTimeout 屬性進行設置。同時,你還可以設置sqlmap中select,insert,update標簽的timeout屬性,從而對不同sql語句的超時時間進行獨立的配置。 如果你使用的是Lucy1.5或1.6版本,通過設置queryTimeout屬性可以在datasource層面對statement timeout進行設置。 statement timeout的具體值需要依據應用本身的特性而定,并沒有可供推薦的配置。

JDBC的statement timeout處理過程
不同的關系型數據庫,以及不同的JDBC驅動,其statement timeout處理過程會有所不同。其中,Oracle和MS SQLServer的處理相類似,MySQL和CUBRID類似。

Oracle JDBC Statement的QueryTimeout處理過程

  1. 通過調用Connection的createStatement()方法創建statement
  1. 調用Statement的executeQuery()方法
  2. statement通過自身connection將query發送給Oracle數據庫
  3. statement在OracleTimeoutPollingThread(每個classloader一個)上進行注冊
  4. 達到超時時間
  5. OracleTimeoutPollingThread調用OracleStatement的cancel()方法
  6. 通過connection向正在執行的query發送cancel消息
圖4 Query Timeout Execution Process for Oracle JDBC Statement.

JTDS (MS SQLServer) Statement的QueryTimeout處理過程

  1. 通過調用Connection的createStatement()方法創建statement
  1. 調用Statement的executeQuery()方法
  2. statement通過自身connection將query發送給MS SqlServer數據庫
  3. statement在TimerThread上進行注冊
  4. 達到超時時間
  5. TimerThread調用JtdsStatement實例中的TsdCore.cancel()方法
  6. 通過ConnectionJDBC向正在執行的query發送cancel消息
圖5 QueryTimeout Execution Process for JTDS (MS SQLServer) Statement.

MySQL JDBC Statement的QueryTimeout處理過程(5.0.8)

  1. 通過調用Connection.createStatement()方法創建statement
  1. 調用Statement.executeQuery()方法
  2. statement通過自身connection將query發送給MySQL數據庫
  3. statement創建一個新的timeout-execution線程用于超時處理
  4. 5.1版本后改為每個connection分配一個timeout-execution線程
  5. 向timeout-execution線程進行注冊
  6. 達到超時時間
  7. timeout-execution線程創建一個和statement配置相同的connection
  8. 使用新創建的connection向超時query發送cancel query(KILL QUERY “connectionId”)
圖6 QueryTimeout Execution Process for MySQL JDBC Statement (5.0.8).

CUBRID JDBC Statement的QueryTimeout處理過程

  1. 通過調用Connection的createStatement()方法創建statement
  1. 調用Statement的executeQuery()方法
  2. statement通過自身connection將query發送給CUBRID數據庫
  3. statement創建一個新的timeout-execution線程用于超時處理
  4. 5.1版本后改為每個connection分配一個timeout-execution線程 6. 向timeout-execution線程進行注冊
  5. 達到超時時間
  6. TimerThread調用JtdsStatement實例中的TsdCore.cancel()方法
  7. timeout-execution線程創建一個和statement配置相同的connection
  8. 使用新創建的connection向超時query發送cancel消息
圖7 QueryTimeout Execution Process for CUBRID JDBC Statement.

什么是JDBC的socket timeout?

第4種類型的JDBC使用socket與數據庫連接,數據庫并不對應用與數據庫間的連接超時進行處理。 JDBC的socket timeout在數據庫被突然停掉或是發生網絡錯誤(由于設備故障等原因)時十分重要。由于TCP/IP的結構原因,socket沒有辦法探測到網絡錯誤,因此應用也無法主動發現數據庫連接斷開。如果沒有設置socket timeout的話,應用在數據庫返回結果前會無期限地等下去,這種連接被稱為dead connection。 為了避免dead connections,socket必須要有超時配置。socket timeout可以通過JDBC設置,socket timeout能夠避免應用在發生網絡錯誤時產生無休止等待的情況,縮短服務失效的時間。

不推薦使用socket timeout來限制statement的執行時長,因此socket timeout的值必須要高于statement timeout,否則,socket timeout將會先生效,這樣statement timeout就變得毫無意義,也無法生效。

下面展示了socket timeout的兩個設置項,不同的JDBC驅動其配置方式會有所不同。

  • socket連接時的timeout:通過Socket.connect(SocketAddress endpoint, int timeout)設置
  • socket讀寫時的timeout:通過Socket.setSoTimeout(int timeout)設置

通過查看CUBRID,MySQL,MS SQL Server (JTDS)和Oracle的JDBC驅動源碼,我們發現所有的驅動內部都是使用上面的2個API來設置socket timeout的。

下面是不同驅動的socket timeout配置方式。

JDBC Driver connectTimeout配置項 socketTimeout配置項 url格式 示例
MySQL Driver connectTimeout(默認值:0,單位:ms) socketTimeout(默認值:0,單位:ms) jdbc:mysql://[host:port],[host:port]…/[database][?propertyName1][=propertyValue1][&propertyName2][=propertyValue2]… jdbc:mysql://xxx.xx.xxx.xxx:3306/database?connectTimeout=60000&socketTimeout=60000
MS-SQL DriverjTDS Driver loginTimeout(默認值:0,單位:s) socketTimeout(默認值:0,單位:s) jdbc:jtds:<server_type>://<server>[:<port>][/<database>][;<property>=<value>[;...]] jdbc:jtds:sqlserver://server:port/database;loginTimeout=60;socketTimeout=60
Oracle Thin Driver oracle.net.CONNECT_TIMEOUT (默認值:0,單位:ms) oracle.jdbc.ReadTimeout(默認值:0,單位:ms) 不支持通過url配置,只能通過OracleDatasource.setConnectionProperties() API設置,使用DBCP時可以調用BasicDatasource.setConnectionProperties()或BasicDatasource.addConnectionProperties()進行設置 -
CUBRID Thin Driver 無獨立配置項(默認值:5,000,單位:ms) 無獨立配置項(默認值:5,000,單位:ms) - -
  • connectTimeoutsocketTimeout的默認值為0時,timeout不生效。
  • 除了調用DBCP的API以外,還可以通過properties屬性進行配置。

通過properties屬性進行配置時,需要傳入key為“connectionProperties”的鍵值對,value的格式為“[propertyName=property;]*”。下面是iBatis中的properties配置。
Xml代碼

<transactionManager type=“JDBC”>  
  <dataSource type=“com.nhncorp.lucy.db.DbcpDSFactory”>  
     ….  
     <property name=“connectionProperties” value=“oracle.net.CONNECT_TIMEOUT=6000;oracle.jdbc.ReadTimeout=6000″/>   
  </dataSource>  
</transactionManager>  

操作系統的socket timeout配置

如果不設置socket timeout或connect timeout,應用多數情況下是無法發現網絡錯誤的。因此,當網絡錯誤發生后,在連接重新連接成功或成功接收到數據之前,應用會無限制地等下去。但是,通過本文開篇處的實際案例我們發現,30分鐘后應用的連接問題奇跡般的解決了,這是因為操作系統同樣能夠對socket timeout進行配置。公司的Linux服務器將socket timeout設置為了30分鐘,從而會在操作系統的層面對網絡連接做校驗,因此即使JDBC的socket timeout設置為0,由網絡錯誤造成的數據庫連接問題的持續時間也不會超過30分鐘。

通常,應用會在調用Socket.read()時由于網絡問題被阻塞住,而很少在調用Socket.write()時進入waiting狀態,這取決于網絡構成和錯誤類型。當Socket.write()被調用時,數據被寫入到操作系統內核的緩沖區,控制權立即回到應用手上。因此,一旦數據被寫入內核緩沖區,Socket.write()調用就必然會成功。但是,如果系統內核緩沖區由于某種網絡錯誤而滿了的話,Socket.write()也會進入waiting狀態。這種情況下,操作系統會嘗試重新發包,當達到重試的時間限制時,將產生系統錯誤。在我們公司,重新發包的超時時間被設置為15分鐘。

至此,我已經對JDBC的內部操作做了講解,希望能夠讓大家學會如何正確的配置超時時間,從而減少錯誤的發生。
最后,我將列出一些常見的問題。

FAQ

Q1. **我已經使用Statement.setQueryTimeout()方法設置了查詢超時,但在網絡出錯時并沒有產生作用。 **
? 查詢超時僅在socket timeout生效的前提下才有效,它并不能用來解決外部的網絡錯誤,要解決這種問題,必須設置JDBC的socket timeout。

Q2. ** transaction timeout,statement timeout和socket timeout和DBCP的配置有什么關系? **
? 當通過DBCP獲取數據庫連接時,除了DBCP獲取連接時的waitTimeout配置以外,其他配置對JDBC沒有什么影響。

Q3. 如果設置了JDBC的socket timeout,那DBCP連接池中處于IDLE狀態的連接是否也會在達到超時時間后被關閉?
? 不會。socket的設置只會在產生數據讀寫時生效,而不會對DBCP中的IDLE連接產生影響。當DBCP中發生新連接創建,老的IDLE連接被移除,或是連接有效性校驗的時候,socket設置會對其產生一定的影響,但除非發生網絡問題,否則影響很小。

Q4. **socket timeout應該設置為多少? **
? 就像我在正文中提的那樣,socket timeout必須高于statement timeout,但并沒有什么推薦值。在發生網絡錯誤的時候,socket timeout將會生效,但是再小心的配置也無法避免網絡錯誤的發生,只是在網絡錯誤發生后縮短服務失效的時間(如果網絡恢復正常的話)。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,797評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,179評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,628評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,642評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,444評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,948評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,040評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,185評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,717評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,602評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,794評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,316評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,045評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,418評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,671評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,414評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,750評論 2 370

推薦閱讀更多精彩內容

  • 這是最近讀到的講關于 JDBC 的超時問題最透徹的文章,原文是http://www.cubrid.org/blog...
    預流閱讀 11,552評論 4 19
  • 背景 項目中應用服務直接通過jdbc連接impala做數據查詢,其他遇到一個問題,查詢impala時因為沒有設置查...
    胖imp閱讀 9,741評論 0 4
  • 數據庫連接池在J2EE領域是一個不可缺失的組件,盡管DRUID越來越流行,但是DBCP作為一個老牌的數據庫連接池一...
    新棟BOOK閱讀 1,742評論 0 7
  • JDBC概述 在Java中,數據庫存取技術可分為如下幾類:JDBC直接訪問數據庫、JDO技術、第三方O/R工具,如...
    usopp閱讀 3,546評論 3 75
  • 最近備戰京東雙11,在配置MySQL的超時配置發現有很多地方可以設置。這么多超時的配置有什么影響,以及配置會有什么...
    LinkedKeeper閱讀 20,107評論 0 0