【网学网提醒】:网学会员为广大网友收集整理了,在SQL中删除重复记录(多种方法),希望对大家有所帮助!
学习sql有一段时间了,发现在我建了一个用来测试的表(没有建索引)中出现了许多的重复记录。后来总结了一些删除重复记录的方法,在Oracle中,可以通过唯一rowid实现删除重复记录;还可以建临时表来实现...这个只提到其中的几种简单实用的方法,希望可以和大家分享(以表employee为例)。SQL>descemployee
NameNull?-------------------------------------------------------------------
Type
emp_idemp_name
NUMBER(10)VARCHAR2(20)
salary
NUMBER(10,2)
可以通过下面的语句查询重复的记录:
SQL>select*fromemployee;
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
1sunshine
10000
2semon
20000
2semon
20000
3xyz
30000
2semon
20000
SQL>selectdistinct*fromemployee;
SQL>selectdistinct*fromemployee;
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
2semon
20000
3xyz
30000
SQL>
select*fromemployeegroupbyemp_id,emp_name,salaryhavingcount(*)>1
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
2semon
20000
SQL>select*fromemployeee1
whererowidin(selectmax(rowid)fromemployee2wheree1.emp_id=e2.emp_idand
e1.emp_name=e2.emp_nameande1.salary=e2.salary);
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
3xyz
30000
2semon
20000
2.删除的几种方法:
(1)通过建立临时表来实现
SQL>createtabletemp_empas(selectdistinct*fromemployee)
SQL>truncatetableemployee;(清空employee表的数据)
SQL>insertintoemployeeselect*fromtemp_emp;
(再将临时表里的内容插回来)
(2)通过唯一rowid实现删除重复记录.在Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、行上。块、在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大或最小rowid的就可以了,其余全部删除。
SQL>deletefromemployeee2whererowidnotin(selectmax(e1.rowid)fromemployeee1where
e1.emp_id=e2.emp_idande1.emp_name=e2.emp_nameande1.salary=e2.salary);--这里用min(rowid)也可以。
SQL>deletefromemployeee2whererowid<(selectmax(e1.rowid)fromemployeee1wheree1.emp_id=e2.emp_idande1.emp_name=e2.emp_nameand
e1.salary=e2.salary);
(3)也是通过rowid,但效率更高。
SQL>deletefromemployeewhererowidnotin(selectmax(t1.rowid)fromemployeet1groupby
t1.emp_id,t1.emp_name,t1.salary);--这里用min(rowid)也可以。
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
3xyz
30000
2
semon
20000
SQL>descemployee
NameNull?-------------------------------------------------------------------
Type
emp_idemp_name
NUMBER(10)VARCHAR2(20)
salary
NUMBER(10,2)
可以通过下面的语句查询重复的记录:
SQL>select*fromemployee;
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
1sunshine
10000
2semon
20000
2semon
20000
3xyz
30000
2semon
20000
SQL>selectdistinct*fromemployee;
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
2semon
20000
3xyz
30000
SQL>
select*fromemployeegroupbyemp_id,emp_name,salaryhavingcount(*)>1
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
2semon
20000
SQL>select*fromemployeee1
whererowidin(selectmax(rowid)fromemployee2wheree1.emp_id=e2.emp_idand
e1.emp_name=e2.emp_nameande1.salary=e2.salary);
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
3xyz
30000
2semon
20000
2.删除的几种方法:
(1)通过建立临时表来实现
SQL>createtabletemp_empas(selectdistinct*fromemployee)
SQL>truncatetableemployee;(清空employee表的数据)
SQL>insertintoemployeeselect*fromtemp_emp;
(再将临时表里的内容插回来)
(2)通过唯一rowid实现删除重复记录.在Oracle中,每一条记录都有一个rowid,rowid在整个数据库中是唯一的,rowid确定了每条记录是在Oracle中的哪一个数据文件、行上。块、在重复的记录中,可能所有列的内容都相同,但rowid不会相同,所以只要确定出重复记录中那些具有最大或最小rowid的就可以了,其余全部删除。
SQL>deletefromemployeee2whererowidnotin(selectmax(e1.rowid)fromemployeee1where
e1.emp_id=e2.emp_idande1.emp_name=e2.emp_nameande1.salary=e2.salary);--这里用min(rowid)也可以。
SQL>deletefromemployeee2whererowid<(selectmax(e1.rowid)fromemployeee1wheree1.emp_id=e2.emp_idande1.emp_name=e2.emp_nameand
e1.salary=e2.salary);
(3)也是通过rowid,但效率更高。
SQL>deletefromemployeewhererowidnotin(selectmax(t1.rowid)fromemployeet1groupby
t1.emp_id,t1.emp_name,t1.salary);--这里用min(rowid)也可以。
EMP_IDEMP_NAME
SALARY
------------------------------------------------------------
1sunshine
10000
3xyz
30000
2semon
20000
本文来自CSDN博客,转载请blog.csdn.net/hedylin/archive/2005/08/29/467762.aspx
标
明
出
处
: