一次SQL如何查重及去重的实战记录一次SQL如何查重及去重的实战

前言
??1.distinct
??2.groupby
??3.row_number窗口函数
??4.删除重复数据

第一步：找出重复的数据
第二步：删除重复的数据

总结

前言在使用SQL提数的时候，常会遇到表内有重复值的时候，就需要做去重，本文归类了常用方法。

?? 1.distinct

题目：现在运营需要查看用户来自于哪些学校，请从用户信息表中取出学校的去重数据

示例:user_profile

文章图片

mysql>SELECT DISTINCT university FROM user_profile;
根据示例，查询返回以下结果

文章图片

小贴士：

SQL中关键词distinct去重：
英语中distinct 代表独一无二的意思，
他在SQL表示去重的意思：比如本题中university这一列出现了两次北京大学，
使用distinct进行去重查询后，则北京大学只出现一次。
distinct 通常效率较低
distinct 使用中，放在 select 后边，对后面所有的字段的值统一进行去重

拓展：

题目：现在运营需要查看用户的总数
select count(distinct university) from user_profile;

?? 2.group by 举个栗子，现有这样一张表 task

文章图片

备注：
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意：一个任务对应多条订单

题目：列出任务总数
根据示例，查询方法如下：
第1步：列出 task_id 的所有唯一值（去重后的记录,null也是值）

select task_idfrom Taskgroup by task_id;

第二步：任务总数

select count(task_id) task_numfrom (select task_idfrom Taskgroup by task_id) tmp;

?? 3.row_number 窗口函数举个栗子，现有这样一张表 task

文章图片

备注：
task_id: 任务id;
order_id: 订单id;
start_time: 开始时间
注意：一个任务对应多条订单

题目：查询整个表重复的数据
根据示例，查询方法如下：
– 在支持窗口函数的 sql 中使用

select count(case when rn=1 then task_id else null end) task_numfrom (select task_id, row_number() over (partition by task_id order by start_time) rnfrom Task) tmp;

小贴士：
MySQL8.0 中可以利用 ROW_NUMBER()，DENSE_RANK()，RANK() 三个窗口函数来实现排序
需要注意的一点是 as 后的别名，千万不要与前面的函数名重名，否则会报错
下面给出这三种函数实现排名的案例：
–三条语句对于上面三种排名

select xuehao,score, ROW_NUMBER() OVER(order by score desc) as row_r from scores_tb; select xuehao,score, DENSE_RANK() OVER(order by score desc) as dense_r from scores_tb; select xuehao,score, RANK() over(order by score desc) as r from scores_tb;

– 一条语句也可以查询出不同排名

SELECT xuehao,score,ROW_NUMBER() OVER w AS ‘row_r',DENSE_RANK() OVER w AS ‘dense_r',RANK() OVER w AS ‘r'FROM scores_tbWINDOW w AS (ORDER BY score desc);

?? 4.删除重复数据创建测试数据
我们创建一个人员信息表并在里面插入一些重复的数据

CREATE TABLE Person(id int auto_increment primary key comment ‘主键',Name VARCHAR(20) NULL,Age INT NULL,Address VARCHAR(20) NULL,Sex CHAR(2) NULL);

INSERT INTO Person(ID,Name,Age,Address,Sex)VALUES( 1, ‘张三', 18, ‘北京路18号', ‘男' ),( 2, ‘李四', 19, ‘北京路29号', ‘男' ),( 3, ‘王五', 19, ‘南京路11号', ‘女' ),( 4, ‘张三', 18, ‘北京路18号', ‘男' ),( 5, ‘李四', 19, ‘北京路29号', ‘男' ),( 6, ‘张三', 18, ‘北京路18号', ‘男' ),( 7, ‘王五', 19, ‘南京路11号', ‘女' ),( 8, ‘马六', 18, ‘南京路19号', ‘女' );

文章图片

题目：数据库中存在重复记录，删除保留其中一条
我们发现除了自增长ID不同以为，有几条其他字段都重复的数据出现

第一步：找出重复的数据

mysql>SELECT MAX(ID) ID,Name,Age,Address,SexFROM PersonGROUP BY Name,Age,Address,SexHAVING COUNT(1)>1

文章图片

小贴士：
HAVING将分组后统计出来的数量大于1的数据行，就是我们要找的重复数据
上面用Max函数或者Min函数均可，只是为了保证取出来的数据的唯一性。

第二步：删除重复的数据
其实我们数据库中最后要保留的结果就是第二步中查询出来的数据，
我们把其他的数据删除即可。
怎么删除呢？我们使用ID来排除。

DELETE FROM PersonWHERE EXISTS(SELECT * FROM (SELECTMAX(ID) ID,Name,Age,Address,SexFROM PersonGROUP BY Name,Age,Address,SexHAVING COUNT(1)>1) TWHERE Person.Name=T.NameAND Person.Age=T.AgeAND Person.Address=T.AddressAND Person.Sex=T.SexAND Person.ID
执行完后重新查询Person表结果如下
马六因为只有一条记录，所以没有参与去重，直接显示。

文章图片

总结 【一次SQL如何查重及去重的实战记录】到此这篇关于SQL如何查重及去重的文章就介绍到这了,更多相关SQL查重去重内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

推荐阅读

婕珞芙晨露蔷薇面膜怎么样婕路芙晨露蔷薇面膜可以分两次用吗

猪肉各部位的区别猪肉哪个部位是一等肉

最早指南车发明人指南车发明者

银天下行情分析系统软件下载

redis跳跃表查找数据的过程 redis哪块用到跳表

华为荣耀play3有没有指纹解锁（华为荣耀play3有指纹解锁吗）

amdk15支持什么cpu，amdk15主板支持的cpu

女性揉地筋的好处主要有这些好处

汽车原厂互联映射什么意思

常年不在家冰箱怎么办？如何维护和保养？

怎样识别变频空调和定频空调空调开一天多少钱

七绝（云水一梦惹东风）

新办企业个税申报密码申报个税在哪个软件，企业个税能用手机申报吗

运动会通讯稿300字

美的SC861A吸尘器不充电的解决方法

刘海屏|iPhone 14强势曝光：是不是后悔手里的iPhone 13买早了？

iphone|从12999元跌至10488元，12G+512G，华为顶级旗舰现货供应不用抢购

绝地求生刺激战场国际服绝地求生刺激战场国际服下载方法有哪些

无症状感染者会一直不发病吗

泰顺云雾茶是什么茶泰顺雾云农庄

使用Mybatis如何实现删除多个数据

如何进行数据挖掘（）

二本毕业，我是如何逆袭成为BAT年薪40W的Java工程师的（）

pandas|pandas 如何筛选某一行包含字符串_Pandas过滤dataframe中包含特定字符串的数据方法...

java|ios 按时间排序_如何按应用而不是时间对iOS通知进行排序

#|Win10 如何修改默认软件安装路径

c盘怎么清理到最干净|c盘怎么清理到最干净_C盘快满了不敢乱删，该如何清理（这里给你最详细的方法！...）

win10默认安装路径修改_如何修改Win10默认存储路径（）

腾讯云MLVB技术如何在移动直播服务中突出重围之基础概念

如何写一份好的吸引人的简历