网站导航网学 原创论文 原创专题 网站设计 最新系统 原创论文 论文降重 发表论文 论文发表 UI设计定制 论文答辩PPT格式排版 期刊发表 论文专题
返回网学首页
网学原创论文
最新论文 推荐专题 热门论文 论文专题
当前位置: 网学 > 设计资源 > 数据库 > 正文

优化SQL语句in和notin的替代方案

论文降重修改服务、格式排版等 获取论文 论文降重及排版 论文发表 相关服务

用IN写出来的SQL的优点是比较容易写及清晰易懂,这比较适合现代软件开发的风格。

但是用IN的SQL性能总是比较低的,从SQL执行的步骤来分析用IN的SQL与不用IN的SQL有以下区别:

SQL试图将其转换成多个表的连接,如果转换不成功则先执行IN里面的子查询,再查询外层的表记录,如果转换成功则直接采用多个表的连接方式查询。由此可见用IN的SQL至少多了一个转换的过程。一般的SQL都可以转换成功,但对于含有分组统计等方面的SQL就不能转换了。 推荐在业务密集的SQL当中尽量不采用IN操作符

NOT IN 此操作是强列推荐不使用的,因为它不能应用表的索引。推荐用NOT EXISTS 或(外连接+判断为空)方案代替

  在数据库中有两个表,一个是当前表Info(id,PName,remark,impdate,upstate),一个是备份数据表bakInfo(id,PName,remark,impdate,upstate),将当前表数据备份到备份表去,就涉及到not in 和in 操作了:

  首先,添加10万条测试数据

  1. create procedure AddData 
  2. as 
  3. declare @id int  
  4. set @id=0 
  5. while(@id<100000) 
  6. begin 
  7.     insert into dbo.Info(id,PName,remark,impdate,upstate) 
  8.     values(@id,convert(varchar,@id)+'0','abc',getdate(),0) 
  9.     set @id=@id+1 
  10. end  
  11.  
  12. exec AddData 

使用not in 和in操作:

  1. SET STATISTICS TIME ON 
  2. GO 
  3. --备份数据 
  4. insert into bakInfo(id,PName,remark,impdate,upstate) 
  5. select id,PName,remark,impdate,upstate from dbo.Info 
  6. where id not in(select id from dbo.bakInfo) 
  7. GO 
  8. SET STATISTICS TIME OFF 

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 0 毫秒,占用时间 = 3 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 453 毫秒,占用时间 = 43045 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 
  8. --更改当前表状态 
  9. update  Info set upstate=1 where id in(select id from dbo.bakInfo) 

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 62 毫秒,占用时间 = 79 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 188 毫秒,占用时间 = 318 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 
  8. --删除当前表数据 
  9. delete from Info where upstate=1 and id in(select id from dbo.bakInfo) 

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 183 毫秒,占用时间 = 183 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 187 毫秒,占用时间 = 1506 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 

使用join连接替代方案:

  1. SET STATISTICS TIME ON 
  2. GO 
  3. --备份数据 
  4. insert into bakInfo(id,PName,remark,impdate,upstate) 
  5. select id,PName,remark,impdate,upstate from 
  6. (SELECT     Info.id,Info.PName, Info.remark, Info.impdate,Info.upstate, bakInfo.id AS bakID 
  7. FROM         Info left JOIN 
  8. bakInfo ON Info.id = bakInfo.id ) as t 
  9. where t.bakID is null and t.upstate=0 
  10. GO 
  11. SET STATISTICS TIME OFF

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 247 毫秒,占用时间 = 247 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 406 毫秒,占用时间 = 475 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 
  1. --更改当前表状态 
  2. update Info set upstate=1 
  3. FROM         Info INNER JOIN 
  4. bakInfo ON Info.id = bakInfo.id 

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 4 毫秒,占用时间 = 4 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 219 毫秒,占用时间 = 259 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 
  1. --删除当前表数据 
  2. delete from Info 
  3. FROM         Info INNER JOIN 
  4. bakInfo ON Info.id = bakInfo.id 
  5. where  Info.upstate=1 

此操作执行时间:

  1. SQL Server 分析和编译时间: 
  2. CPU 时间 = 177 毫秒,占用时间 = 177 毫秒。 
  3. SQL Server 执行时间: 
  4. CPU 时间 = 219 毫秒,占用时间 = 550 毫秒。 
  5. (100000 行受影响) 
  6. SQL Server 分析和编译时间: 
  7. CPU 时间 = 0 毫秒,占用时间 = 1 毫秒。 

可以看出使用join方案比使用not in 和in执行时间要短很多了

  • 上一篇资讯: 项目小结之数据库设计
  • 下一篇资讯: 行列转换等经典SQL语句
  • 设为首页 | 加入收藏 | 网学首页 | 原创论文 | 计算机原创
    版权所有 网学网 [Myeducs.cn] 您电脑的分辨率是 像素
    Copyright 2008-2020 myeducs.Cn www.myeducs.Cn All Rights Reserved 湘ICP备09003080号 常年法律顾问:王律师