您當前位置：首頁 > 數據庫 > 數據庫應用 > 大偏移量下Redis、MongoDB分頁/排名性能比較

大偏移量下Redis、MongoDB分頁/排名性能比較

來源：程序員人生發布時間：2014-12-19 08:32:37 閱讀次數：3536次

題目其實其實不太準確，由于數據庫其實不會提供分頁、排名等功能，提供的只是數據的存取，分頁排名這些都是我們基于數據庫的實用案例而已。但是不管是Redis還是MongoDB，通常都有1些常規的做分頁和排名的方法。本文就通過1些測試數據來向大家介紹Redis和MongoDB（和傳統關系型數據庫）在這方面的性能差別。

分頁

首先我們來做1個分頁，在MongoDB中示例數據以下所未：

db.scores.find(); {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 1, name: 'user_1'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 2, name: 'user_2'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 3, name: 'user_3'} {lid: ObjectId("4fe506dabb2bfa742d000001"), score: 4, name: 'user_4'}

其中lid字段用于辨別不同的緯度，主要用在挑選上，在測試collection中，1共有5個不同的lid值，每個對應1,200,000條數據，1共6,000,000條數據。索引在lid 和 score上。（下面的查詢能使用到索引）

然后我們進行下面的性能測試：

collection = Mongo::Connection.new.db('test').collection('scores') Benchmark.bmbm do |x| x.report("mongo small") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 20).to_a end end x.report("mongo medium") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 1000).to_a end end x.report("mongo large") do 100.times do |i| collection.find({:lid => lids.sample}, {:fields => {:_id => false, :score => true, :user => true}}).sort({:score => ⑴}).limit(20).skip(i * 10000).to_a end end end

上面分別對skip條數比較小，中等大小和非常大3種情況進行了測試。而limit指定獲得的數據都1樣是20條。這3種情況下的測試結果分別是：0.6 秒， 17 秒，173 秒。

我們可以看到，對MongoDB來講，skip的大小嚴重影響性能，應當嚴格避免特別大的skip操作。

下面我們將類似的數據用Redis的Sorted Sets進行存儲。并進行相應的性能測試

redis = Redis.new(:driver => :hiredis) Benchmark.bmbm do |x| x.report("redis small") do 100.times do |i| start = i * 20 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end x.report("redis medium") do 100.times do |i| start = i * 1000 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end x.report("redis large") do 100.times do |i| start = i * 10000 redis.zrevrange(lids.sample, start, start + 20, :with_scores => true) end end

這里skip的值和上面MongoDB中是1樣的，那末Redis的表現如何呢。這3種情況下的測試結果分別是：0.028 秒， 0.025 秒， 0.028 秒。

采取類似于MongoDB的數據結構存儲在PostgreSQL中并進行相同的測試，其結果比MongoDB還要差1點。具體結果以下：

mongo small   0.6
mongo medium   17
mongo large   173
redis small   0.028
redis medium   0.025
redis large   0.028
pg small   1
pg medium   122
pg large   650

排名

排名功能與分頁功能類似，不同的是排名是通過計算大于某個值的條數來做的。

比如：

//sql select count(*) from scores where lid = $1 and score > $2 //mongo db.scores.find({lid: lid, score: {$gt: score}}).count()

由于排名和分頁實現原理上類似，所以結果實際上差不多。測試結果以下：

mongo top rank   1.155847
mongo average 22.291007

redis top rank   0.169442
redis average 0.162205

pg top rank 0.714144
pg average   21.771570

結論

上面做了對照，那末本文要說1個甚么問題呢？

首先，在MongoDB中，盡可能避免進行比較大的skip操作，比如在分頁中，如果你能知道需要獲得數據的上1條score是多少，那末可能能夠用下面的方法來獲得你要的數據，而不是通過1次很大的skip操作。

db.scores.find({lid: lid, score: {$lt: last_score}}).sort({score: ⑴}).limit(20)

另外，如果你需要進行比較大的skip操作或count比較大的數量，那末可以斟酌采取Redis的Sorted Sets來做。

后記

本文在微博上引發了1些技術朋友的討論，對對照的問題這里做1個說明。

我們知道，Redis是內存數據庫，而MongoDB不是，所以有朋友質疑這里的對照是不是只是內存與磁盤的對照。實際上這1說法不無道理，上面的測試數據出自原作者文章，其文章也并未提及MongoDB是不是都在內存中。根據我個人的實驗結果，當數據全部能夠在內存中時，確切不會出現如本文中所說的 MongoDB性能嚴重差異。但是，隨著skip的變大，操作時間還是在顯著變長，而Redis的Sorted Sets則相對穩定。

同時也歡迎更多實驗對照數據和原理分析的討論。感謝大家。

生活不易，碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生