posts - 33, comments - 11, trackbacks - 0

数据库中有个大表，需要查找其中的名字有重复的记录id，以便比较。

如果仅仅是查找数据库中name不重复的字段，很容易

SELECT min(`id`),`name`   
FROM `table`   
GROUP BY `name`;

但是这样并不能得到说有重复字段的id值。（只得到了最小的一个id值）

查询哪些字段是重复的也容易

SELECT `name`,count(`name`) as count   
FROM `table`   
GROUP BY `name` HAVING count(`name`) >1   
ORDER BY count DESC;

但是要一次查询到重复字段的id值，就必须使用子查询了，于是使用下面的语句来实现MySQL大表重复字段查询。

SELECT `id`,`name`   
FROM `table`   
WHERE `name` in (   
   SELECT `name`   
   FROM `table`   
   GROUP BY `name` HAVING count(`name`) >1  
);

但是这条语句在mysql中效率太差，感觉mysql并没有为子查询生成零时表。

于是使用先建立零时表

create table `tmptable` as (  
   SELECT `name`   
   FROM `table`   
   GROUP BY `name` HAVING count(`name`) >1  
);

然后使用多表连接查询

SELECT a.`id`, a.`name`   
FROM `table` a, `tmptable` t   
WHERE a.`name` = t.`name`;

结果这次结果很快就出来了。

用 distinct去重复

SELECT distinct a.`id`, a.`name`   
FROM `table` a, `tmptable` t   
WHERE a.`name` = t.`name`;

posted on 2012-05-25 14:15 方涛升阅读(285) 评论(0) 编辑收藏所属分类: j2ee


只有注册用户登录后才能发表评论。




网站导航: 博客园博客园最新博文博问管理
相关文章: MySQL大表重复字段的查询方法输入流和输出流 MyEclipse5.5注册机 java将Word/Excel/PDF文件转换成HTML整理 apche与多个tomcat整合 ssh+taglib实现分页用JS在页面上显示当前的时间根据分割符截取字符串 java错误大集合 JSP中嵌套IF语句

2012年5月

日

一

二

三

四

五

六

随笔分类

随笔档案