我们经常在创建数据的时候会添加数据后,,发现有些字段我们应该用唯一的数据。
所以删除多余的数据。1、可以重新清空,重新插入。2、删除多余的数据。
一、查询重复的数据
以一个字段为参考:
SELECT name FROM `yi18_hospital` Group by name having count(name)>1
这里是查看重复的数据ID ,
SELECT name FROM `yi18_hospital` Group by name having count(name)>1 语句就是查询
重复的数据 name 有哪些。然后再列出全部重复数据。
二、取得保留重复内容
取得重复内容最小ID
SELECT min(id) FROM `yi18_hospital` Group by name having count(*)>1
这里就是取得重复数据想保留的最小ID数据,当然也可以按照自己的情况选择。
三、删除重复的数据
这里的思路就是删除重复的数据,但保留的内容除外
DELETE FROM `yi18_hospital` WHERE
name IN(SELECT name FROM `yi18_hospital` Group by name having count(name)>1)
AND
id not in (SELECT min(id) FROM `yi18_hospital` Group by name having count(*)>1)
以为一切OK,但MySQL还是不支持这样的操作,操作的时候提示
You can't specify target table 'yi18_hospital' for update in FROM clause
错误提示就是说,不能先select出同一表中的某些值,再update这个表(在同一语句中)
四、修改删除重复数据
按照错误提示,也上面的思路,我们可以创建一个临时表来使用。下面有两种方式:
1、一个存储重复数据表,一个保留内容表。
create table tmp_name as SELECT name FROM `yi18_hospital` Group by name having count(name)>1;
create table tmp_id as SELECT min(id) FROM `yi18_hospital` Group by name having count(name)>1
DELETE FROM `yi18_hospital` WHERE name IN(SELECT * FROM `tmp_name`)
AND id not in (SELECT * FROM `tmp_id`)
drop table tmp_name;
drop table tmp_id;
2、创建两个临时表,然后删除临时表,,当然也可以使用直接创建一个需要保留的临时表
create table tmp as select min(id) as id from table group by name;
delete from table where id not in (select id from tmp);
drop table tmp;
其实删除重复数据有很多方式,,这里只是说了一点删除数据的思路,
该贴由hui.chen转至本版2014-11-5 16:11:48