SQL 优化极简法则与优化方法.docx

资源描述

《SQL 优化极简法则与优化方法.docx》由会员分享，可在线阅读，更多相关《SQL 优化极简法则与优化方法.docx（11页珍藏版）》请在三一办公上搜索。

1、目录法则一：只返回需要的结果法则二：确保查询使用了正确的索引法则三：尽量避免使用子查询法则四：不要使用OFFSET实现分页法则五：了解SQ1.子句的逻辑执行顺序总结方法SQ1.作为关系型数据库的标准语言，是IT从业人员必不可少的技能之一。SQ1.本身并不难学，编写查询语句也很容易，但是想要编写出能够高效运行的查询语句却有一定的难度。查询优化是一个复杂的工程,涉及从硬件到参数配置、不同数据库的解析器、优化器实现、SQ1.语句的执行顺序、索引以及统计信息的采集等，甚至应用程序和系统的整体架构。本文介绍几个关键法则，可以帮助我们编写高效的SQ1.查询；尤其是对于初学者而言，这些法则至少可以避免我们写

2、出性能很差的查询语句。以下法则适用于各种关系型数据库，包括但不限于:MySQ1.OracleSQ1.ServerPostgreSQ1.以及SQ1.ite等。法则一：只返回需要的结果一定要为查询语句指定WHERE条件，过滤掉不需要的数据行。通常来说，O1.TP系统每次只需要从大量数据中返回很少的几条记录；指定查询条件可以帮助我们通过索引返回结果，而不是全表扫描。绝大多数情况下使用索引时的性能更好，因为索引(B-树、B+树、B*树)执行的是二进制搜索，具有对数时间复万(1003)条记录只需要3层B-树即可完成索引。通过索引查找数据时需要读取3次索引数据(每次磁盘IO读取整个分支节点)，加上1次磁盘

3、IO读取数据即可得到查询结果。相反，如果采用全表扫描，需要执行的磁盘IO次数可能高出几个数量级。当数据量增加到1亿(1004)时，B-树索引只需要再增加1次索引IO即可；而全表扫描则需要再增加几个数量级的10。同理，我们应该避免使用SE1.ECT*FROM,因为它表示查询表中的所有字段。这种写法通常导致数据库需要读取更多的数据，同时网络也需要传输更多的数据，从而导致性能的下降。法则二：确保查询使用了正确的索引如果缺少合适的索引，即使指定了查询条件也不会通过索引查找数据。因此,我们首先需要确保创建了相应的索引。一般来说，以下字段需要创建索引：经常出现在WHERE条件中的字段建立索引可以避免全表扫

4、描；将ORDERBY排序的字段加入到索引中，可以避免额外的排序操作；多表连接查询的关联字段建立索引，可以提高连接查询的性能；将GRoUPBY分组操作字段加入到索引中，可以利用索引完成分组。即使创建了合适的索引，如果SQ1.语句写的有问题，数据库也不会使用索引。导致索引失效的常见问题包括：在WHERE子句中对索引字段进行表达式运算或者使用函数都会导致索引失效，这种情况还包括字段的数据类型不匹配，例如字符串和整数进行比较；使用1.IKE匹配时，如果通配符出现在左侧无法使用索引。对于大型文本数据的模糊匹配，应该考虑数据库提供的全文检索功能，甚至专门的全文搜索引擎(Elasticsearch等)；如果

5、WHERE条件中的字段上创建了索引，尽量设置为NOTNU1.1.；不是所有数据库使用1SNOTNU1.1.判断时都可以利用索引。执行计划(executionplan,也叫查询计划或者解释计划)是数据库执行SQ1.语句的具体步骤，例如通过索引还是全表扫描访问表中的数据，连接查询的实现方式和连接的顺序等。如果SQ1.语句性能不够理想，我们首先应该查看它的执行计划，通过执行计划(EXP1.AlN)确保查询使用了正确的索引。法则三：尽量避免使用子查询以MySQ1.为例，以下查询返回月薪大于部门平均月薪的员工信息：ExplainanalyzeSE1.ECTemp_id,emp_nameFROMemplo

6、yeeeWHEREsalary(SE1.ECTAVG(salary)FROMemployeeWHEREdept_id=e.dept_id);Filter:(e.salary(select#2)(cost=2.75rows=25)(actualtime=0.232.4.401rows=6loops=1)Tablescanone(cost=2.75rows=25)(actualtime=0.099.0.190rows=251oops=1)Select#2(subqueryincondition;dependent)Aggregatezavg(employee.salary)(actualtime=

7、0.147.0.149rows=lloops=25)Indexlookuponemployeeusingidx_emp_dept(dept_id=e.dept_id)(cost=1.12rows=5)(actualtime=0.068.0.104rows=7loops=25)从执行计划可以看出，MySQ1.中采用的是类似Nested1.oopJoin实现方式；子查询循环了25次，而实际上可以通过一次扫描计算并缓存每个部门的平均月薪。以下语句将该子查询替换为等价的JOIN语句，实现了子查询的展开(SubqueryUnnest)：ExplainanalyzeSE1.ECTe.emp_id,e.em

8、p_nameFROMemployeeeJoIN(SE1.ECTdept_id,AVG(SaIary)ASdept_aVerageFROMemployeeGROUPBYdeptJd)tONe.dept_id=t.dept_idWHEREe.salaryt.dept-average;Nestedloopinnerjoin(actualtime=0.722.2.354rows=61oops=l)Tablescanone(cost=2.75rows=25)(actualtime=0.096.0.205rows=251oops=l)Filter:(e.salaryt.dept_average)(actu

9、altime=0.068.0.076rows=01oops=25)Indexlookupontusing(dept_id=e.dept_id)(actualtime=0.011.0.015rows=lloops=25)Materialize(actualtime=0.048.0.057rows=lloops=25)Groupaggregate:avg(employee.salary)(actualtime=0.228.0.510rows=51oops=l)Indexscanonemployeeusingidx_emp_dept(cost=2.75rows=25)(actualtime=0.18

10、1.0.348rows=251oops=1)改写之后的查询利用了物化(MaterialiZation)技术，将子查询的结果生成一个内存临时表；然后与employee表进行连接。通过实际执行时间可以看出这种方式更快。以上示例在Oraele和SQ1.SerVer中会自动执行子查询展开，两种写法效果相同；在PostgreSQ1.中与MySQ1.类似，第一个语句使用Nested1.oopJoin,改写为Jc)IN之后使用HaShJOin实现，性能更好。另外，对于IN和EXISTS子查询也可以得出类似的结论。由于不同数据库的优化器能力有所差异，我们应该尽量避免使用子查询，考虑使用JolN进行重写。法则四

11、：不要使用OFFSET实现分页分页查询的原理就是先跳过指定的行数，再返回TOP-N记录。分页查询的示意图如下：分页查询数据库一般支持FETCH/1.IMIT以及OFFSET实现Top-N排行榜和分页查询。当表中的数据量很大时，这种方式的分页查询可能会导致性能问题。以MySQ1.为例：-MySQ1.SE1.ECT*FROMlarge_tableORDERBYid1.imit100ffsetn;以上查询随着OFFSET的增加，速度会越来越慢；因为即使我们只需要返回10条记录，数据库仍然需要访问并且过滤掉N(比如1000000)行记录，即使通过索引也会涉及不必要的扫描操作。对于以上分页查询，更好的方

12、法是记住上一次获取到的最大id,然后在下一次查询中作为条件传入：-MySQ1.SE1.ECT*FROMlarge_tableWHEREidlastJdORDERBYid1.IMIT10;如果id字段上存在索引，这种分页查询的方式可以基本不受数据量的影响。法则五：了解SQ1.子句的逻辑执行顺序以下是SQ1.中各个子句的语法顺序，前面括号内的数字代表了它们的逻辑执行顺序：(6)SE1.ECTDISTlNCTA1.1.col1,co12,agg_func(col3)ASalias(l)FROMtlJOINt2(2)ON(join_conditions)(3)WHEREwhere_conditions

13、(4)GR0UPBYcoll,co!2(5)HAVINGhaving_condition(7)UNIONA1.1.(8)0RDERBYcollASC,col2DESC(9)0FFSETmRoWSFETCHNEXTnUm_rOWSROWSoN1.Y;也就是说，SQ1.并不是按照编写顺序先执行SE1.ECT,然后再执行FROM子句。从逻辑上讲，SQ1.语句的执行顺序如下：首先，FROM和JOIN是SQ1.语句执行的第一步。它们的逻辑结果是一个笛卡尔积，决定了接下来要操作的数据集。注意逻辑执行顺序并不代表物理执行顺序，实际上数据库在获取表中的数据之前会使用ON和WHERE过滤条件进行优化访问；其次，

14、应用ON条件对上一步的结果进行过滤并生成新的数据集；然后，执行WHERE子句对上一步的数据集再次进行过滤。WHERE和ON大多数情况下的效果相同，但是外连接查询有所区别，我们将会在下文给出示例；接着，基于GROUPBY子句指定的表达式进行分组；同时，对于每个分组计算聚合函数agg_func的结果。经过GROUPBY处理之后，数据集的结构就发生了变化，只保留了分组字段和聚合函数的结果；如果存在GROUPBY子句，可以利用HAVING针对分组后的结果进一步进行过滤，通常是针对聚合函数的结果进行过滤；接下来，SE1.ECT可以指定要返回的列；如果指定了DISTINeT关键字，需要对结果集进行去重操作

15、。另外还会为指定了AS的字段生成别名；如果还有集合操作符(UNION、INTERSECTEXCEPT)和其他的SE1.ECT语句，执行该查询并且合并两个结果集。对于集合操作中的多个SE1.ECT语句，数据库通常可以支持并发执行；然后，应用ORDERBY子句对结果进行排序。如果存在GROUPBY子句或者DISTlNCT关键字，只能使用分组字段和聚合函数进行排序；否则，可以使用FROM和JOIN表中的任何字段排序；最后，OFFSET和FETCH(1.IMITTOP)限定了最终返回的行数。了解SQ1.逻辑执行顺序可以帮助我们进行SQ1.优化。例如WHERE子句在HAVING子句之前执行，因此我们应该

16、尽量使用WHERE进行数据过滤，避免无谓的操作；除非业务需要针对聚合函数的结果进行过滤。除此之外，理解SQ1.的逻辑执行顺序还可以帮助我们避免一些常见的错误，例如以下语句：-错误示例SE1.ECTemp_nameASempnameFROMemployeeWHEREemPname=张飞；该语句的错误在于WHERE条件中引用了列别名；从上面的逻辑顺序可以看出，执行WHERE条件时还没有执行SE1.ECT子句，也就没有生成字段的别名。另外一个需要注意的操作就是GRoUPBY,例如：-GROUPBY错误示例SE1.ECTdeptJd,emp_name,AVG(salary)FROMemployeeGR

17、OUPBYdeptJd;由于经过GRoUPBY处理之后结果集只保留了分组字段和聚合函数的结果，示例中的emp_name字段已经不存在；从业务逻辑上来说，按照部门分组统计之后再显示某个员工的姓名没有意义。如果需要同时显示员工信息和所在部门的汇总，可以使用窗口函数。如果使用了GRoUPBY分组，之后的SE1.ECT、ORDERBY等只能引用分组字段或者聚合函数；否则，可以引用FROM和JOIN表中的任何字段。还有一些逻辑问题可能不会直接导致查询出错，但是会返回不正确的结果；例如外连接查询中的ON和WHERE条件。以下是一个左外连接查询的示例：SE1.ECTe.emp_name,d.dept_nam

18、eFROMemployeee1.EFTJOINdepartmentdON(e.dept_id=d.dept_id)WHEREe.emp_name=，张飞：emp_namedept_name张飞行政管理SE1.ECTe.emp_name,d.dept_nameFROMemployeee1.EFTJolNdePartmentde)N(e.dept_id=d.dept_idANDe.emp_name=张飞)；emp_namedept_name刘备NU1.1.关羽NU1.1.张飞行政管理部诸葛亮NU1.1.第一个查询在ON子句中指定了连接的条件，同时通过WHERE子句找出了“张飞”的信息。第二个查询将

19、所有的过滤条件都放在ON子句中，结果返回了所有的员工信息。这是因为左外连接会返回左表中的全部数据，即使ON子句中指定了员工姓名也不会生效;而WHERE条件在逻辑上是对连接操作之后的结果进行过滤。总结SQ1.优化本质上是了解优化器的的工作原理，并且为此创建合适的索引和正确的语句；同时，当优化器不够智能的时候，手动让它智能。SQ1.优化方法一、查询SQ1.尽量不要使用SeleCt*,而是具体字段1、反例SE1.ECT*FROMuser2、正例SE1.ECTid,username,telFROMuser3、理由节省资源、减少网络开销。可能用到覆盖索引，减少回表，提高查询效率。注意：为节省时间，下面的

20、样例字段都用*代替了。二、避免在where子句中使用or来连接条件1反例SE1.ECT*FROMuserWHEREid=1ORsalary=50002、正例(1)使用UnionallSE1.ECT*FROMuserWHEREid=1UnionallSE1.ECT*FROMuserWHEREsalary=5000(2)分开两条SQ1.写SE1.ECT*FROMuserWHEREid=1SE1.ECT*FRMuserWHEREsalary=50003、理由使用Or可能会使索引失效，从而全表扫描；对于Or没有索引的SaIary这种情况，假设它走了id的索引，但是走到salary查询条件时，它还得全表

21、扫描；也就是说整个过程需要三步：全表扫描+索引扫描+合并。如果它一开始就走全表扫描，直接一遍扫描就搞定；虽然mysql是有优化器的，出于效率与成本考虑，遇到。r条件，索引还是可能失效的；三、尽量使用数值替代字符串类型1、正例主键(id)：Primarykey优先使用数值类型int,tinyint性别(SeX)：O代表去，1代表男；数据库没有布尔类型，mysql推荐使用tinyint2、理由因为引擎在处理查询和连接时会逐个比较字符串中每一个字符；而对于数字型而言只需要比较一次就够了；字符会降低查询和连接的性能，并会增加存储开销。四、使用varchar代替char1、反例addresschar(1

22、00)DEFAU1.TNU1.1.COMMENT也址2、正例addressVarchar(100)DEFAUErNU1.1.COMMENT地址3、理由varchar变长字段按数据内容实际长度存储，存储空间小，可以节省存储空间；Char按声明大小存储，不足补空格；其次对于查询来说，在一个相对较小的字段内搜索，效率更高；五、技术延伸，char与varchar2的区别？1Char的长度是固定的，而VarChar2的长度是可以变化的。比如,存储字符串“101”，MTchar(10),表示你存储的字符将占10个字节(包括7个空字符)，在数据库中它是以空格占位的，而同样的VarChar2(10)则只占用3

23、个字节的长度，10只是最大值，当你存储的字符小于10时，按实际长度存储。2、char的效率比varchar2的效率稍高。3、何时用char,何时用varchar2?char和varchar2是一对矛盾的统一体，两者是互补的关系，varchar2比char节省空间，在效率上比char会稍微差一点，既想获取效率，就必须牺牲一点空问，这就是我们在数据库设计上常说的“以空间换效率:varchar2虽然比Char节省空间，但是假如一个VarChar2列经常被修改，而且每次被修改的数据的长度不同，这会引起“行迁移”现象，而这造成多余的I/O,是数据库设计中要尽力避免的，这种情况下用Char代替VarCha

24、r2会更好一些。char中还会自动补齐空格，因为你insert到一个char字段自动补充了空格的,但是SeIeCt后空格没有删除，因此ChaI类型查询的时候一定要记得使用trim,这是写本文章的原因。如果开发人员细化使用rpad()技巧将绑定变量转换为某种能与Char字段相比较的类型(当然，与截断trim数据库列相比，填充绑定变量的做法更好一些，因为对列应用函数trim很容易导致无法使用该列上现有的索引),可能必须考虑到经过一段时间后列长度的变化。如果字段的大小有变化，应用就会受到影响，因为它必须修改字段宽度。正是因为以上原因，定宽的存储空间可能导致表和相关索引比平常大出许多，还伴随着绑定变量

25、问题，所以无论什么场合都要避免使用Char类型。六、Where中使用默认值代替null1、反例SE1.ECT*FROMuserWHEREageISNOTNU1.1.2、正例SE1.ECT*FROMuserWHEREage03、理由并不是说使用了isnull或者isnotnull就会不走索引了，这个跟mysql版本以及查询成本都有关；如果mysql优化器发现，走索引比不走索引成本还要高，就会放弃索引，这些条件!=,isnull,isnotnull经常被认为让索引失效；其实是因为一般情况下，查询的成本高，优化器自动放弃索引的；如果把null值，换成默认值，很多时候让走索引成为可能，同时，表达意思也

26、相对清晰一点；七、避免在Where子句中使用!二或o操作符1、反例SE1.ECT*FROMuserWHEREsalary!=5(X)0SE1.ECT*FROMuserWHEREsalary50002、理由使用!=和很可能会让索引失效应尽量避免在Where子句中使用!二或。操作符，否则引擎将放弃使用索引而进行全表扫描实现业务优先，实在没办法，就只能使用，并不是不能使用八、innerjoinleftjoinrightjoin,优先使用innerjoin三种连接如果结果相同，优先使用innerjoin,如果使用leftjoin左边表尽量小。innerjoin内连接，只保留两张表中完全匹配的结果集；l

27、eftjoin会返回左表所有的行，即使在右表中没有匹配的记录；rightjoin会返回右表所有的行，即使在左表中没有匹配的记录；为什么？如果innerjoin是等值连接，返回的行数比较少，所以性能相对会好一点；使用了左连接，左边表数据结果尽量小，条件尽量放到左边处理，意味着返回的行数可能比较少；这是mysql优化原则，就是小表驱动大表，小的数据集驱动大的数据集，从而让性能更优；九、提高groupby语句的效率1、反例先分组，再过滤selectjob,avg(salary)fromemployeegroupbyjobhavingjob=develop,orjob=test,;2、正例先过滤，后分

28、组selectjob,avg(salary)fromemployeewherejob=,develop,orjob=,test,groupbyjob;3、理由可以在执行到该语句前，把不需要的记录过滤掉十、清空表时优先使用truncatetruncatetable在功能上与不带where子句的delete语句相同：二者均删除表中的全部行。但truncatetable比delete速度快，且使用的系统和事务日志资源少。delete语句每次删除一行，并在事务日志中为所删除的每行记录一项。truncatetable通过释放存储表数据所用的数据页来删除数据，并且只在事务日志中记录页的释放。truncat

29、etable删除表中的所有行，但表结构及其列、约束、索引等保持不变。新行标识所用的计数值重置为该列的种子。如果想保留标识计数值，请改用DE1.ETEo如果要删除表定义及其数据，请使用droptable语句。对于由foreignkey约束引用的表，不能使用truncatetable,而应使用不带Where子句的DE1.ETE语句。由于truncatetable不记录在日志中，所以它不能激活触发器。truncatetable不能用于参与了索引视图的表。H、操作delete或者UPdate语句，加个Iimit或者循环分批次删除1、降低写错SQ1.的代价清空表数据可不是小事情，一个手抖全没了，删库跑路

30、？如果加limit,删错也只是丢失部分数据，可以通过binlog日志快速恢复的。2、SQ1.效率很可能更高SQ1.中加了Iimit1.如果第一条就命中目标return,没有Iimit的话，还会继续执行扫描表。3、避免长事务delete执行时,如果age加了索引，MySQ1.会将所有相关的行加写锁和间隙锁，所有执行相关行会被锁住，如果删除数量大，会直接影响相关业务无法使用。4、数据量大的话，容易把CPU打满如果你删除数据量很大时，不加Iimit限制一下记录数，容易把CPU打满，导致越删越慢。5、锁表一次性删除太多数据，可能造成锁表，会有IOCkWaittimeOUteXCeed的错误，所以建议分

31、批操作。十二、UNloN操作符UNION在进行表链接后会筛选掉重复的记录，所以在表链接后会对所产生的结果集进行排序运算，删除重复的记录再返回结果。实际大部分应用中是不会产生重复的记录，最常见的是过程表与历史表UNloN。如：selectusername,telfromuserunionSelectdepartmentnamefromdepartment这个SQ1.在运行时先取出两个表的结果，再用排序空间进行排序删除重复的记录，最后返回结果集，如果表数据量大的话可能会导致用磁盘进行排序。推荐方案：采用UNlONA1.1.操作符替代UNlON,因为UNIoNA1.1.操作只是简单的将两个结果合并后

32、就返回。十三、批量插入性能提升1、多条提交INSERTINTOUSer(id,username)VA1.UES(l,编程)；INSERTlNTOUSer(id,username)VA1.UES(2,妲己)；2、批量提交INSERTlNTOUSer(id,username)VA1.UES(l,编程)(2：妲己,)；3、理由默认新增SQ1.有事务控制，导致每条都需要事务开启和事务提交，而批量处理是一次事务开启和提交，效率提升明显，达到一定量级，效果显著，平时看不出来十四、表连接不宜太多，索引不宜太多，一般5个以内1、表连接不宜太多，一般5个以内关联的表个数越多，编译的时间和开销也就越大每次关联内存

33、中都生成一个临时表应该把连接表拆开成较小的几个执行，可读性更高如果一定需要连接很多表才能得到数据，那么意味着这是个糟糕的设计了阿里规范中，建议多表联查三张表以下2、索引不宜太多，一般5个以内索引并不是越多越好，虽其提高了查询的效率，但却会降低插入和更新的效率；索引可以理解为一个就是一张表，其可以存储数据，其数据就要占空间；索引表的数据是排序的，排序也是要花时间的；insert或update时有可能会重建索引，如果数据量巨大，重建将进行记录的重新排序，所以建索引需要慎重考虑，视具体情况来定；一个表的索引数最好不要超过5个，若太多需要考虑一些索引是否有存在的必要；十五、避免在索引列上使用内置函数1

34、、反例SE1.ECT*FROMuserWHEREDATE_ADD(birthday,INTERVA1.7DAY)=NOW0;2、正例SE1.ECT*FROMuserWHEREbirthday=DATE_ADD(NOW(),lNTERVA1.7DAY)；3、理由使用索引列上内置函数，索引失效。十六、组合索引排序时应按照组合索引中各列的顺序进行排序，即使索引中只有一个列是要排序的，否则排序性能会比较差。createindexIDX_USERNAME_TE1.onuser(deptid,position,createtime);selectusername,telfromuserwheredepti

35、d=1andposition=ava开发orderbydeptid,position,Createtimedesc;实际上只是善询出符合deptid=1andposition=,java开发，条件的记录并按createtime降序排序，但写成Orderbycreatetimedesc性能较差。十七、复合索引最左特性1、创建复合索引A1.TERTAB1.EemployeeADDlNDEXidx_name_salary（name,salary）2、满足复合索引的最左特性，哪怕只居部分，复合索引生效SE1.ECT.FROMemployeeWHERENAME=编程3、没有出现左边的字段，则不满足最左特

36、性，索引失效SE1.ECT*FRMemployeeWHEREsalary=50004、复合索引全使用，按左侧顺序出现name,salary,索引生效SE1.ECT*FROMemployeeWHERENAME=编程ANDsalary=50005、虽然违背了最左特性，但MySQ1.执行SQ1.时会进行优化，底层进行颠倒优化SE1.ECT*FROMemployeeWHEREsalary=5000ANDNAME=编程6、理由复合索引也称为联合索引，当我们创建一个联合索引的时候，如（kl,k2,k3）,相当于创建了（kl）、（kl,k2）和（kl,k2,k3）三个索引，这就是最左匹配原则。联合索引不满足

37、最左原则，索引一般会失效。十八、优化Iike语句模糊查询，程序员最喜欢的就是使用like,但是like很可能让你的索引失效。1反例SeleCt*fromcityswherenamelike%大连，（不使用索引）SeleCt*fromcityswherenamelike%大连（不使用索引）2、正例SeleCt*fromcityswherenamelike大连（使用索引）。3、理由首先尽量避免模糊查询，如果必须使用，不采用全模糊查询，也应尽量采用右模糊查询，即like；.%，是会使用索引的；左模糊like，%.J无法直接使用索引，但可以利用reverse+functionindex的形式，变化成l

38、ike；.%，；全模糊查询是无法优化的，一定要使用的话建议使用搜索引擎。十九、使用explain分析你SQ1.执行计划1、typesystem：表仅有一行，基本用不到；const：表最多一行数据配合，主键查询时触发较多；eqef：对于每个来自于前面的表的行组合，从该表中读取一行。这可能是最好的联接类型，除了ConSt类型；ref：对于每个来自于前面的表的行组合，所有有匹配索引值的行将从这张表中读取；range：只检索给定范围的行，使用一个索引来选择行。当使用=、=、V=、ISNU1.1.、.BETWEEN或者IN操作符，用常量比较关键字列时，可以使用range；index：该联接类型与A1.1

39、.相同，除了只有索引树被扫描。这通常比A1.1.快，因为索引文件通常比数据文件小；all：全表扫描；性能排名：systemconsteq-refrefrangeindexallo实际Sql优化中，最后达到ref或range级别。2、EXtra常用关键字Usingindex：只从索引树中获取信息，而不需要回表查询；Usingwhere:WHERE子句用于限制哪一个行匹配下一个表或发送到客户。除非你专门从表中索取或检查所有行，如果Extra值不为Usingwhere并且表联接类型为A1.1.或index,查询可能会有一些错误。需要回表查询。Usingtemporary：mysql常建一个临时表来容

40、纳结果，典型情况如查询包含可以按不同情况列出列前GROUPBY和ORDERBY子句时；二十、一些其它优化方式1、设计表的时候，所有表和字段都添加相应的注释。2、SQ1.书写格式，关键字大小保持一致，使用缩进。3、修改或删除重要数据前，要先备份。4、很多时候用exists代替in是一个好的选择。5、Where后面的字段，留意其数据类型的隐式转换。未使用索引SE1.ECT*FROMuserWHERENAME=I10因为不加单引号时，是字符串跟数字的比较，它们类型不匹配；MySQ1.会做隐式的类型转换，把它们转换为数值类型再做比较；6、尽量把所有列定义为NoTNU1.1.NOTNU1.1.列更节省空

41、间，NU1.1.列需要一个额外字节作为判断是否为NU1.1.的标志位。NU1.1.列需要注意空指针问题，NU1.1.列在计算和比较的时候,需要注意空指针问题。7、伪删除设计8、数据库和表的字符集尽量统一使用UTF8可以避免乱码问题；可以避免，不同字符集比较转换，导致的索引失效问题。9、selectcount(*)fromtable；这样不带任何条件的COUnt会引起全表扫描，并且没有任何业务意义，是一定要杜绝的。10、避免在where中对字段进行表达式操作SQ1.解析时，如果字段相关的是表达式就进行全表扫描；字段干净无表达式，索引生效。11、关于临时表避免频繁创建和删除临时表，以减少系统表资源

42、的消耗；在新建临时表时，如果一次性插入数据量很大，那么可以使用SeleCtintO代替Createtable,避免造成大量log；如果数据量不大，为了缓和系统表的资源，应先Createtable,然后insert；如果使用到了临时表，在存储过程的最后务必将所有的临时表显式删除。先truncatetable,然后droptable,这样可以避免系统表的较长时间锁定。12、索引不适合建在有大量重复数据的字段上，比如性别，排序字段应创建索引13、去重distinct过滤字段要少带distinct的语句占用cpu时间高于不带distinct的语句当查询很多字段时，如果使用distinct,数据库引擎就会对数据进行比较，过滤掉重复数据然而这个比较、过滤的过程会占用系统资源，如CPU时间14、尽量避免大事务操作，提高系统并发能力15、所有表必须使用InnOdb存储引擎Innodb支持事务，支持行级锁，更好的恢复性，高并发下性能更好，所以呢，没有特殊要求（即Innodb无法满足的功能如：列存储，存储空间数据等）的情况下，所有表必须使用InnOdb存储引擎。16、尽量避免使用游标因为游标的效率较差，如果游标操作的数据超过1万行，那么就应该考虑改写。

展开阅读全文