文章詳情頁

淺析MySQL的基數(shù)統(tǒng)計(jì)

瀏覽：2日期：2023-10-08 16:17:10

一、基數(shù)是啥？Cardinality指的就是MySQL表中某一列的不同值的數(shù)量。

如果這一類是唯一索引，那基數(shù) = 行數(shù)。

如果這一列是sex，枚舉類型只有男女，那它是基數(shù)就是2

Cardinality越高，列就越有成為索引的價(jià)值。MySQL執(zhí)行計(jì)劃也會(huì)基于Cardinality選擇索引。

通過下面的方式可以看到表中各列的基數(shù)。

淺析MySQL的基數(shù)統(tǒng)計(jì)

比如這個(gè)經(jīng)典的例子：有一列為sex，那對(duì)于sex列中存儲(chǔ)的值來說非男即女，它的基數(shù)最大就是2。那也就完全沒有必要為sex建立索引。因?yàn)椋瑸榱颂嵘慊趕ex的查詢速度，MySQL會(huì)為你選擇的這個(gè)新索引創(chuàng)建一棵全新的B+Tree。但你sex只有兩種值，對(duì)于MySQL來說，即使它為你指定的列建立了B+Tree索引，真正執(zhí)行查詢時(shí)，最多進(jìn)行一次二分查詢，剩下的操作只能是遍歷，所以為sex創(chuàng)建索引意義不大。

二、InnoDB更新基數(shù)的時(shí)機(jī)？參數(shù)：innodb_stats_auto_recalc控制MySQL是否主動(dòng)重新計(jì)算這些持久性的信息。默認(rèn)為1表示true，0表示false。默認(rèn)情況下當(dāng)表中的行變化超過10%時(shí)，重新計(jì)算基數(shù)信息。

三、基數(shù)是估算出來

基數(shù)并不會(huì)實(shí)時(shí)更新！而且它是通過采樣估算出來的值！

至于基數(shù)的公式是怎樣的，可能并不重要。

重要的是你得知道，他是通過隨機(jī)采樣數(shù)據(jù)頁的方式統(tǒng)計(jì)出來的一個(gè)估算值。

而且隨機(jī)采樣的頁數(shù)可以通過參數(shù)innodb_stats_persistent_sample_pages 設(shè)置，默認(rèn)值是20。

這就意味著基數(shù)值并不準(zhǔn)確，甚至你每次計(jì)算的結(jié)果相擦還是蠻大的。

四、持久化基數(shù)

可以通過參數(shù)innodb_stats_persistent 控制是否持久化基數(shù)，默認(rèn)為off。

當(dāng)然你可以為一個(gè)單獨(dú)的表設(shè)置 STATS_PERSISTENT=1 那么它的 innodb_stats_persistent將自動(dòng)被啟用。

開啟它的好處是：重啟MySQL不會(huì)再重復(fù)計(jì)算這個(gè)值，加快重啟速度。

五、如何主動(dòng)更新基數(shù)？

執(zhí)行下面的SQL時(shí)都會(huì)觸發(fā)InnoDB更新基數(shù)（即使你并沒有意識(shí)到它會(huì)更新基數(shù)）。

所以盡量選擇一個(gè)業(yè)務(wù)低峰期

analyze table tableName;

淺析MySQL的基數(shù)統(tǒng)計(jì)

如果因?yàn)椴蓸拥臄?shù)量太少了，計(jì)算的基數(shù)錯(cuò)的離譜。那很可能會(huì)導(dǎo)致MySQL的優(yōu)化器選錯(cuò)索引。這是你可以將這個(gè)值適當(dāng)調(diào)大。但是增加太多可能會(huì)導(dǎo)致 ANALYZE TABLE運(yùn)行緩慢。

反之， ANALYZE TABLE運(yùn)行太慢。你可以適度調(diào)整參數(shù)innodb_stats_persistent_sample_pages 的值。但是這又可能導(dǎo)致基數(shù)計(jì)算的不準(zhǔn)確。

如果沒有辦法平衡兩者的關(guān)系。可以考慮減少表中索引列的數(shù)量或限制分區(qū)的數(shù)量以降低 ANALYZE TABLE復(fù)雜性。表的主鍵中的列數(shù)也很重要，因?yàn)橹麈I列被附加到每個(gè)非唯一索引中。

參考：

https://dev.mysql.com/doc/refman/5.7/en/innodb-persistent-stats.html

https://dev.mysql.com/doc/refman/5.7/en/innodb-analyze-table-complexity.html

以上就是淺析MySQL的基數(shù)統(tǒng)計(jì)的詳細(xì)內(nèi)容，更多關(guān)于MySQL 基數(shù)統(tǒng)計(jì)的資料請(qǐng)關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

上一條：MySQL的查詢緩存和Buffer Pool下一條：解決docker重啟redis,mysql數(shù)據(jù)丟失的問題

相關(guān)文章：

1. 50種方法巧妙優(yōu)化你的SQL Server數(shù)據(jù)庫2. 從各個(gè)方面產(chǎn)品對(duì)比SYBASE & ORACLE3. Oracle與Access表之間的導(dǎo)入和導(dǎo)出4. 恢復(fù)從 Access 2000、 Access 2002 或 Access 2003 中數(shù)據(jù)庫刪除表的方法5. IBM 數(shù)據(jù)庫 DB2 9 的九大新特性（1）6. 建立合理的索引提高SQL Server的性能7. DB2中的數(shù)據(jù)值加密（1）8. Oracle 中檢查臨時(shí)表空間的方法9. IBM DB2通用數(shù)據(jù)庫和信息管理10. 全面解析DB2 V9.1復(fù)制技術(shù)的新特性和改進(jìn)

排行榜

					
					50種方法巧妙優(yōu)化你的SQL Server數(shù)據(jù)庫
從各個(gè)方面產(chǎn)品對(duì)比SYBASE & ORACLE
DB2中的數(shù)據(jù)值加密（1）
建立合理的索引提高SQL Server的性能
恢復(fù)從 Access 2000、 Access 2002 或 Access 2003 中數(shù)據(jù)庫刪除表的方法
Oracle與Access表之間的導(dǎo)入和導(dǎo)出
IBM 數(shù)據(jù)庫 DB2 9 的九大新特性（1）
Oracle 中檢查臨時(shí)表空間的方法
MySQL select、insert、update批量操作語句代碼實(shí)例
IBM DB2通用數(shù)據(jù)庫和信息管理
MySQL雙主（主主）架構(gòu)配置方案
				

熱門標(biāo)簽

久久r热视频,国产午夜精品一区二区三区视频,亚洲精品自拍偷拍,欧美日韩精品二区

淺析MySQL的基數(shù)統(tǒng)計(jì)