mysql中大数据进行查询优化的注意事项

介绍

这篇文章主要介绍mysql中大数据进行查询优化的注意事项,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!

mysql中大数据查询优化的注意:1,对查询进行优化,应尽量避免全表扫描;2,应尽量避免在哪里子句中对字段进行null值判断;3、在和不在也要慎用;4、应尽量避免在哪里子句中使用或来连;5、尽量避免使用游标。

<强> mysql中大数据查询优化的方法:

1。对查询进行优化,应尽量避免全表扫描,首先应考虑在位置及顺序,涉及的列上建立索引。

2。应尽量避免在哪里子句中对字段进行null值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:选择id从t num为空可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:

从t, num选择id=0

3。应尽量避免在哪里子句中使用!=或& lt;在操作符,否则引擎将放弃使用索引而进行全表扫描。

4。应尽量避免在哪里子句中使用或来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:从t num=10或num选择id=20可以这样查询:

从t, num选择id=10 union all从t, num选择id=20

5。在和不在也要慎用,否则会导致全表扫描,如:从t num在选择id(1、2、3)对于连续的数值,能之间用就不要用在了:

从t在1和3之间num选择id

6。下面的查询也将导致全表扫描:从t选择id,名称如“%李%”若要提高效率,可以考虑全文检索。

7。如果在哪里子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时,它必须在编译时进行选择。然而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句将进行全表扫描:<代码>从t, num=@num选择id> 从t和选择id(索引(索引名))num=@num

8。应尽量避免在哪里子句中对字段进行表达式操作,这将导致引擎放弃使用索引而进行全表扫描。如:<代码>从t, num/2选择id=100> 从t, num选择id=100 * 2

9。应尽量避免在哪里子句中对字段进行函数操作,这将导致引擎放弃使用索引而进行全表扫描。如:从t,选择id字符串(名称、1、3)=癮bc”,名称以abc开头的id应改为:

从t选择id,名称如“abc %”

10。不要在哪里子句中的“=弊蟊呓泻?算术运算或其他表达式运算,否则系统将可能无法正确使用索引。

11。在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致。

12。不要写一些没有意义的查询,如需要生成一个空表结构:

选择col1 col2到# t从1=0

这类代码不会返回任何结果集,但是会消耗系统资源的,应改成这样:

<代码>创建表# t(…)

13。很多时候用存在代替在是一个好的选择:

从num在选择num(从b选择num)

用下面的语句替换:

从哪里选择num存在(选择1从b num=a.num)

14。并不是所有索引对查询都有效,SQL是根据表中数据来进行查询优化的,当索引列有大量数据重复时,SQL查询可能不会去利用索引,如一表中有字段性,男,女几乎各一半,那么即使在性上建了索引也对查询效率起不了作用。

15。索引并不是越多越好,索引固然可以提高相应的选择的效率,但同时也降低了插入及更新的效率,因为插入或更新时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有必要。

16。应尽可能的避免更新集群索引数据列,因为集群索引数据列的顺序就是表记录的物理存储顺序,一旦该列值改变将导致整个表记录的顺序的调整,会耗费相当大的资源。若应用系统需要频繁更新集群索引数据列,那么需要考虑是否应将该索引建为集群索引。

17。尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型,这会降低查询和连接的性能,并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了。

mysql中大数据进行查询优化的注意事项