大體上,對HIBERNATE性能調優的主要斟酌點以下:
? 數據庫設計調劑
? HQL優化
? API的正確使用(如根據不同的業務類型選用不同的集合及查詢API)
? 主配置參數(日志,查詢緩存,fetch_size, batch_size等)
? 映照文件優化(ID生成策略,2級緩存,延遲加載,關聯優化)
? 1級緩存的管理
? 針對2級緩存,還有許多獨有的策略
? 事務控制策略。
1、 數據庫設計
a) 下降關聯的復雜性
b) 盡可能不使用聯合主鍵
c) ID的生成機制,不同的數據庫所提供的機制其實不完全1樣
d) 適當的冗余數據,不過分尋求高范式
2、 HQL優化
HQL如果拋開它同HIBERNATE本身1些緩存機制的關聯,HQL的優化技能同普通的SQL優化技能1樣,可以很容易在網上找到1些經驗之談。
3、 主配置
a) 查詢緩存,同下面講的緩存不太1樣,它是針對HQL語句的緩存,即完全1樣的語句再次履行時可以利用緩存數據。但是,查詢緩存在1個交易系統(數據變更頻繁,查詢條件相同的機率其實不大)中可能會起反作用:它會白白耗費大量的系統資源但卻難以派上用處。
b) fetch_size,同JDBC的相干參數作用類似,參數其實不是越大越好,而應根據業務特點去設置
c) batch_size同上。
d) 生產系統中,切紀要關掉SQL語句打印。
4、 緩存
a) 數據庫級緩存:這級緩存是最高效和安全的,但不同的數據庫可管理的層次其實不1樣,比如,在ORACLE中,可以在建表時指定將全部表置于緩存當中。
b) SESSION緩存:在1個HIBERNATE SESSION有效,這級緩存的可干預性不強,大多于HIBERNATE自動管理,但它提供清除緩存的方法,這在大批量增加/更新操作是有效的。比如,同時增加10萬條記錄,按常規方式進行,極可能會發現OutofMemeroy的異常,這時候可能需要手動清除這1級緩存:Session.evict和Session.clear
c) 利用緩存:在1個SESSIONFACTORY中有效,因此也是優化的重中之重,因此,各類策略也斟酌的較多,在將數據放入這1級緩存之前,需要斟酌1些條件條件:
i. 數據不會被第3方修改(比如,是不是有另外一個利用也在修改這些數據?)
ii. 數據不會太大
iii. 數據不會頻繁更新(否則使用CACHE可能適得其反)
iv. 數據會被頻繁查詢
v. 數據不是關鍵數據(如觸及錢,安全等方面的問題)。
緩存有幾種情勢,可以在映照文件中配置:read-only(只讀,適用于很少變更的靜態數據/歷史數據),nonstrict-read-write,read-write(比較普遍的情勢,效力1般),transactional(JTA中,且支持的緩存產品較少)
d) 散布式緩存:同c)的配置1樣,只是緩存產品的選用不同,在目前的HIBERNATE中可供選擇的不多,oscache, jboss cache,目前的大多數項目,對它們的用于集群的使用(特別是關鍵交易系統)都持守舊態度。在集群環境中,只利用數據庫級的緩存是最安全的。
5、 延遲加載
a) 實體延遲加載:通過使用動態代理實現
b) 集合延遲加載:通過實現自有的SET/LIST,HIBERNATE提供了這方面的支持
c) 屬性延遲加載:
6、 方法選用
a) 完成一樣1件事,HIBERNATE提供了可供選擇的1些方式,但具體使用甚么方式,可能用性能/代碼都會有影響。顯示,1次返回10萬條記錄(List/Set/Bag/Map等)進行處理,極可能致使內存不夠的問題,而如果用基于游標(ScrollableResults)或Iterator的結果集,則不存在這樣的問題。
b) Session的load/get方法,前者會使用2級緩存,而后者則不使用。
c) Query和list/iterator,如果去仔細研究1下它們,你可能會發現很多成心思的情況,2者主要區分(如果使用了Spring,在HibernateTemplate中對應find,iterator方法):
i. list只能利用查詢緩存(但在交易系統中查詢緩存作用不大),沒法利用2級緩存中的單個實體,但list查出的對象會寫入2級緩存,但它1般只生成較少的履行SQL語句,很多情況就是1條(無關聯)。
ii. iterator則可以利用2級緩存,對1條查詢語句,它會先從數據庫中找出所有符合條件的記錄的ID,再通過ID去緩存找,對緩存中沒有的記錄,再構造語句從數據庫中查出,因此很容易知道,如果緩存中沒有任何符合條件的記錄,使用iterator會產生N+1條SQL語句(N為符合條件的記錄數)
iii. 通過iterator,配合緩存管理API,在海量數據查詢中可以很好的解決內存問題,如:
while(it.hasNext()){
YouObject object = (YouObject)it.next();
session.evict(youObject);
sessionFactory.evice(YouObject.class, youObject.getId());
}
如果用list方法,極可能就出OutofMemory毛病了。
iv. 通過上面的說明,我想你應當知道如何去使用這兩個方法了。
7、 集合的選用
在HIBERNATE 3.1文檔的“19.5. Understanding Collection performance”中有詳細的說明。
8、 事務控制
事務方面對性能有影響的主要包括:事務方式的選用,事務隔離級別和鎖的選用
a) 事務方式選用:如果不觸及多個事務管理器事務的話,不需要使用JTA,只有JDBC的事務控制就能夠。
b) 事務隔離級別:參見標準的SQL事務隔離級別
c) 鎖的選用:悲觀鎖(1般由具體的事務管理器實現),對長事務效力低,但安全。樂觀鎖(1般在利用級別實現),如在HIBERNATE中可以定義VERSION字段,明顯,如果有多個利用操作數據,且這些利用不是用同1種樂觀鎖機制,則樂觀鎖會失效。因此,針對不同的數據應有不同的策略,同前面許多情況1樣,很多時候我們是在效力與安全/準確性上找1個平衡點,不管如何,優化都不是1個純技術的問題,你應當對你的利用和業務特點有足夠的了解。
9、 批量操作
即便是使用JDBC,在進行大批數據更新時,BATCH與不使用BATCH有效力上也有很大的差別。我們可以通過設置batch_size來讓其支持批量操作。
舉個例子,要批量刪除某表中的對象,如“delete Account”,打出來的語句,會發現HIBERNATE找出了所有ACCOUNT的ID,再進行刪除,這主要是為了保護2級緩存,這樣效力肯定高不了,在后續的版本中增加了bulk delete/update,但這也沒法解決緩存的保護問題。也就是說,由于有了2級緩存的保護問題,HIBERNATE的批量操作效力其實不盡如人意!
從前面許多要點可以看出,很多時候我們是在效力與安全/準確性上找1個平衡點,不管如何,優化都不是1個純技術的問題,你應當對你的利用和業務特點有足夠的了解,1般的,優化方案應在架構設計期就基本肯定,否則可能致使沒必要的返工,導致項目延期,而作為架構師和項目經理,還要面對開發人員可能的抱怨,必竟,我們對用戶需求更改的控制力不大,但技術/架構風險是應當在早期意想到并制定好相干的對策。
還有1點要注意,利用層的緩存只是錦上添花,永久不要把它當救命稻草,利用的根基(數據庫設計,算法,高效的操作語句,恰當API的選擇等)才是最重要的。