数据仓库|本号精华合集(三)

点击蓝色“有关SQL”关注我哟
加个“星标”,天天与10000人一起快乐成长
数据仓库|本号精华合集(三)
文章图片

写在前面
终身学习从来都不是一句空话。有些人 25 岁的时候已经死了,等到 70 岁才埋。一句玩笑话,却满满都是哲理。狭隘的学习,是谋生本事的学习,专指一门技能,比如编程,外语,营销等。放眼广义的学习,是指通识的学习,跨界的学习。
有些朋友,高中就开始注重这样的积累。他们喜欢读报,读各类课外书,谈天说地,古今中外,趣文要事都能信手拈来,并且还振振有词会为这些报道做些解说。那摇头晃脑的模样,仿佛就一说书先生。更让人弄不明白的是,但凡这些同学,高考几乎都是清一色的重点大学。
10年后,同学聚会,爱发言,爱表达的还是这些同学们。不过话题变得更加严肃,社会时政,民生科学。我猜测,这些同学大学过后,依然还走在自学的道路上,这仿佛是一种习惯,刻在了他们的日程表上。
细心去发现,每个人或多或少都会在学习一些新东西。学车,学潜泳,学着自由行,每天看会头条,每天看会杂志报刊。只是发现没有,有些看过的东西留下来了,有些去年看的,今年忘了。
为了忘却的记忆,我在这里留下一些个人思想印迹,提醒自己曾经思考过的那些问题。希望过去难倒过我的问题,以后不再是问题,过去想不通的问题,持续思考过后,能大彻大悟。
SQL 技能类
SQL 是本公众号的垂直主题。在数据库开发一线工作多年后,有了些心得,理所当然写出来是有感觉的。所以前期的主题大部分都是数据库相关,有开发有管理。开发被我视作外功,想要长进,必须多做题找感觉;而管理则是内功,知道内部原理才能让 SQL 跑得更加通畅。仅仅写完 SQL,是第一步,能让 10W+ 用户同时跑自己写的 SQL 并且还能控制在 2s 内快速响应,那才是真本事。
SQL 开发
SQL 开发跟普通的程序开发,没有太多的差异,都是遵循一定编码范式,调用计算机的资源完成一些计算。只是 SQL 更擅长于处理规范化组织起来的数据。见识到足够多的开发范例,并且加以训练,就能顺手处理 90% 的任务。另外的 10% 是特定领域和极限情况下碰到的需求,届时自己摸索即可。
虽然 SQL 程序看似不难,但经常会碰到自己当时明白的问题,再次碰到之后,却怎么也想不到思路的情况。难道碰到行列转换的时候,大家敲一遍就能保证程序运行无错嘛?碰到需要在数据库中添加 Dll, Jar 库的时候,能保证使用的 c#, Java 编译一次通过,跑到生产上没有 Bug 嘛!
所以还是老实的记录下,碰到的有趣案例。记录下来,不仅仅下次可以拿来就用,碰到需要在脑袋中装配思路的大型难题,可以让大脑考虑更深层次的计算。
MySQL常备工具列表

MySQL 简史

SQL Update 留给我们的坑,不可不防
翻样的 SQL 去重
SQL 解数据分片求独占算法讨论
0 秒实现 100 年数据的自动生成
一道有趣的 SQL 题,不来解一下嘛

秒懂 [行列] 转换

SQL Pivot 的花式操作

真以为自己懂 Group By 了?

SQL 去除多列值交叉重复

SQL 求解每月周末天数 ( 附代码 Markdown 处理)

SQL 类型转换失效得到的一些启示

kNN 算法的 SQL 实现

SQL 实现广度优先搜索,你会了吗?

Halloween Problem in SQL

Cross Apply 与 Outer Apply 区别

Cross Apply 与 Inner Join 的对抗

自动化赋值的 SQL 语句

编程实例 - 字符串分词查找解决办法

数据分析的头疼事 - SQL 去重

价值 100 RMB 的一道 SQL 题

求累计数的小例子
不知道 SQL Server Tally Table ?
SQL SERVER T-SQL Programming 之一

SQL Server T-SQL Programming 之二

SQL Server T-SQL Programming 之三
SQL Server T-SQL Programming 之四
可以拿来吊打面试官的 SQL Join (一)

可以拿来吊打面试官的 SQL Join (二)

可以拿来吊打面试官的 SQL Join (三)

可以拿来吊打面试官的 SQL Join ( 四 )- 突破篇

GroupBy 用法的三重境界,面试终结者

怎样评价一个几千行的 SQL 存储过程

如何写好上千行的 SQL 存储过程(附代码规范)

动态 SQL 你还敢用?

回忆当年阿里的一道 SQL 面试题,亿级表合并

仅一题,看出你对 SQL 编程的领悟力

10 场年薪 60W 的 DBA 面试,被问到最多的 10 道题

Foreign Key 一定是无用的吗?

阿里面试题亿级表合并引发的思考之 SQL Bloom Filter(一)

阿里面试题亿级表合并引发的思考之 SQL Bloom Filter(二)
别让SQL中的空字符串毁了你一个下午
不可不知的SQL绝技之无中生有
花 6 小时,写了份 Toad For SQL 指南,助你乘风破浪

如何给 SQL 存储过程埋点?

对不起,你以为的SQL进阶,只是别人眼中的入门

如何回答好面试题,存储过程用还是不用?

传说中 6 个月都未必能全解开的 3 道 SQL 题,来挑战下?

如何提高阅读 SQL 源代码的快感
SQL 调优三板斧,拿好拿稳了


SQL 高可用
管理设计的领域非常广,而这一块窃以为是用好数据库的关键技术。不懂调优和故障排除,无异于拿着小米步枪冲在前线,而对方都是 AK47 和 M16.
为什么读懂执行计划对你是那么重要

亿万级表的索引重建策略

25K 月薪的 SQL Server DBA 面试一题

数据文件移库之后,SQL 查询变慢

6 图助你理解 SQL 优化策略

99% 的人都不知道的 SQL Update 奥秘
如何让你的 SQL 执行的飞起?

执行计划的 3 种看法, 2 个操作, 4 点误区

【实战篇】执行计划3种看法,2种操作,4个误区

SQL Join 不可不知的一点优化策略
禁用 SQL 游标,告诉你外面听不到的原因

数据库索引设计(基础篇)

数据库面试时,常问的 Selectivity 和 Cardinality 到底是什么

2000 万的表,索引怎么建 ?

SQL 中判断条件的先后顺序,会引起索引失效么?

用上索引就一定比全表扫描快?

SQL Join 中,表位置对性能的影响

移动下SQL中的表位置,性能提高18倍

SQL 运行缓慢的探究 - 执行计划的解析

你会引导查询引擎改写 SQL 执行计划吗

揭秘数据库性能杀手 - 等待

揭秘数据库性能杀手 - 等待(赋脚本)

SQL 压力测试实战篇

SQL 人要敢于说不

【万字详解】SQL 优化引擎内幕

数据库面试基础题之执行计划

我在面试数据库工程师候选人时,常问的一些题

数据应用系统的压力测试方案

网站测速的数据可视化

SQL Server 性能测试指标分析

用好三张 DMV, 检测 80% 的性能故障

SQL 数据库满载,Redis 力挽狂澜

SQL Server 遭受大并发量时,该做些什么

SQL 运行时性能统计信息的获取

列出 SQL 数据库行数最多的前十张表,你要几秒?

费老鼻子劲迁移到高版本 SQL 数据库后,性能变差了

你的数据库,能撑起多少并发,有数吗?

如何全方位地给 SQL Server 做测试

如何对 Oracle 做压力测试?

要点分析:用SQL+Excel监控数据库性能

谈谈表分区

亿级数据分析性能杀手锏 - 列式存储
视频版演绎《一条极简 SQL 语句引发的超长等待》

一条极简 SQL 语句引发的超长等待

一次日志爆满引发的数据库无法访问

听说你们的数据库并发 2 万就跪了?

为什么你的SQL,跑不动千万级的数据?

Memory Optimized Table 的存储内幕

MVCC 下的事务管理
SQL Server In Memory OLTP 基础篇

玩转In Memory OLTP, 怎能不懂Row Versioning

InMemory OLTP 的 Native Compile Modules

内存优化表,碧玉大变闺秀!

SQL Server Storage - 之一

SQL Server Storage - 之二

SQL Server Storage - 之三

SQL Server Storage - 之四

SQL Server Storage - 之五

SQL Server Storage - 之六

SQL Server Storage - 之七

SQL Server Storage - 之八

SQL Server Storage - 之九

SQL Server Storage - 之十

SQL Server Storage - 之十一

SQL Server Storage - 之十二

SQL Server Storage - 之十三

SQL Server Concurrency - 之一

SQL Server Concurrency - 之二

SQL Server Concurrency - 之三

SQL Server Replication - 之一

SQL Server Replication - 之二

SQL Server Replication - 之三

SQL Server Failover Cluster - 之一

SQL Server Failover Cluster - 之二

SQL Server Performance 分析 - 之一

SQL Server Performance 分析 - 之二

SQL Server Performance 分析 - 之三

SQL Server Performance 分析 - 之四

SQL Server Performance 分析 - 之五

SQL Server Performance 分析 - 之六

SQL Server Performance 分析 - 之七

Docker 上运行 SQL Server
简单两例说明白 SQL Server Docker 的发布

Docker 持续集成 SQL Server 变更

Linux 版本 SQL Server 的快速安装
Linux 搭建 SQL Server 高可用完结篇
SQL Server AlwaysOn Availability Group On Linux
安装 SQL 失败问题归总

SQL Server 的备份与恢复
完成一次简单的 SQL 注入
为什么你必须掌握数据字典?

因为ESR, 我一定要推荐你这款 SQL 神器

谁动了我的数据库

对不起,你所掌握的DBA 进阶,只是别人眼中的入门

SQL 的编译原理,了解下?

2019 MySQL8 24小时快速入门(1)

2019 MySQL8 24小时快速入门(2)
回答读者朋友的2道题

SQL 学习技巧
实战的 SQL 开发固然重要,那是保证手不生的必要条件。但任何技能想要更上一层楼,需要的是总结,抽象问题和解决思路,以便下次更好的推演。

20 图归纳 SQL 数据库知识点

SQL 开发应有的一种思维
出色的 SQL 编码师成长进阶路线

帕慕克给我上的一堂 SQL 学习课

程序员与村上春树

写作与阅读的一些看法

SQL 编程中的 DRY 原则,你用吗?

学不好 SQL 数据库的两个根本原因,我替你总结下

作为面试官,我最喜欢考的两类题

零基础 SQL 数据库小白,从入门到精通的学习路线与书单

如何写好 5000 行的 SQL 代码

除了 DBA, SQL 人还能胜任的黄金职业

SQL 参考书目
这部分记录自己曾经看过的这些书,随手记录下的一些领悟。
数据行业私房书单(附读书心法)

SQL 优化推荐书单

重读《决战大数据》有感

"数"到用时方恨少

数据分析师书单

一篇文章说完数据仓库维度建模基本理论

真的以为我们只讨论SQL,这篇我们说NotOnlySQL

SQL 数据库学习路线推荐

脑洞一下未来的数据库

带读 IBM 关系型数据库经典论文

2019 年最值得阅读的 8 本数据仓库方向的书

学 SQL Server 我最常逛的 5 个网站

推荐大数据Spark必读书目

5 个给你力量的数据库行业网站

突破年薪20W,必读的三本数据库好书

三行SQL代码中隐藏的数据库书单

SQL 人该如何挑选学习资料之书单篇

那些必读的数据库领域论文

想精通SQL Server, T-SQL的全历史你听过吗?

深扒SQL的历史,说点秘密给你听

大数据技能类
2010 年在惠普做世界 500 强 ITIL 的数据仓库时,差点就做了大数据项目。当时其实根本不以为意,无非又是一个噱头罢了。当时一心在玩 Oracle, 现在想来感觉就像是用 15 个比特币换了一块披萨。保持对事物的好奇,足够激发想象力去抓住潜在的机会。
Hive 篇
Hive 进阶应用 - 泛型函数

Hive 性能调优,这 9 点都掌握了?
Hive 编程入门 之 Join 的失效

Hive 的正则应用,用会了没?

Hive 编程专题之 - 表值函数

Hive 编程专题之 - 自定义函数 Java 篇

Hive 编程专题 之 - 列组合与算术组合

Hive编程专题 之 - 使用正则指定输出列

Hive 入门 Group By 全案例【附代码】

Hive 的入门级 Group By 全案例

增量更新 Hive 表数据

Hive 的事务支持

一小时快速搭建 Hive

Hadoop 实验 - Mac 搭建篇

Hadoop的分布式存储
Spark 篇
Spark SQL 大数据处理

为什么要使用 Spark 呢

半小时搭建 spark 应用

入门必读 | Spark 论文分享与导读

为什么 Spark 在数据科学界这么红?

Kafka 篇
学点 Kafka 流处理
为什么要用 Kafka 呢

在你的 Java 程序里调用 Kafka 发起数据流
大数据技术趣味篇
Spark 高难度对话 SQL Server

Spark 高难度对话 SQL Server 续篇

Spark 高难度对话 SQL Server 后记

Spark SQL 与 Hive 的第一场会师
秋,Spark 与巴黎评论
12 图浅析人口分布对经济趋势的影响

大数据架构与应用
解读主流大数据架构

解读《大数据下的数据分析平台架构》

Netflix: 从 Batch ETL 到 Stream Processing 的转型之路

AI 在 Salesforce CRM 中的应用

Hortonworks , 快速上手 Hadoop 的套件

大数据在 IoT 的应用
数据分析之词云制作

Hadoop 之上的数据建模 - Data Vault 2.0

使用 Sqoop 将 30W+ MySQL 数据导入 Hive

9 张脑图梳理下分布式数据计算系统【附高福利】

SQL 人如何把握风口上的“数据中台”

SQL人的优势:实战大数据开发10分钟入门
数据工程师必须掌握的7个大数据实战项目

大数据相关书目
流式处理的故障容错
流式数据分析处理的常规方法

数据,为什么需要流式处理?
分布式事务,不可不知的 2PC

数据模型以及查询语言

应对高并发的方法论

关于性能,我们在谈些什么?

关于访问量,我们在谈些什么

解读《Hadoop 构建数据仓库实践》
刚面完阿里蚂蚁金服的大数据工程师,有话说

2019 年数据仓库 BI 及 Data Science 最全书单

看亿级用户电商如何玩转SQL大数据
进阶数据库和大数据架构必备技能点

带读《Snowflake》数仓论文

数据仓库技能类

BI, 数据仓库,ETL, 数据开发,有什么区别?

一次 BO 报表引发的数据库宕机要点分析

数据可能只有在你眼里才一文不值

跟 Amazon 学入门级数据仓库架构

SQL 人的进阶职业-建模师
SQL 数据库常用面试6题

数据仓库,就不是数据库了吗?

看数据模型界两大长老的神仙打架

为什么我说 ETL 是 SQL 人重启辉煌之光的必经之路

如何使用 SQL 做好 ETL 中的数据指纹

为什么我建议你多做数据仓库项目

1.7亿的老罗直播,教会我们的 SQL 数据库和大数据晋级技能

Linux 应用篇
Linux 在当代互联网世界中,是炙手可热的技术,几乎已经是互联网世界的霸主操作系统。
Shell 编程的老臣 - gawk

Shell 编程的老臣 - sed

另类的 ETL 好手 sed 进阶(附文档下载)
NoSQL | NewSQL 类
数据库架构师浅谈 - 之一

数据库架构师浅谈 - 之二

强烈推荐一门SQL之外我还在修炼的技艺
当 SQL 中的 LIKE 无法满足要求时,你怎么办?

SQL 已死,NoSQL才是王道?醒醒吧,别瞎说八道了

软技能篇
圈子里的一些事

写文章的这些年

金三银四,谈谈职业规划与发展

村上春树与 996

程序员与村上春树

外包没有资格 WFH?

初级程序员最应避免的 7 大错误

【知乎热文】数据分析师的出路在哪儿

以问代读,以问带学

10 场外企面试经验总结

我理解的代码重构与完美思想

那些喜欢买书看视频的朋友,都拿到大厂30万的Offer了吗?

当我面试SQL数据库开发人员时,都会问些什么
做一个高级高薪的SQL数据库开发,我可以提供的 2 个建议

说说被遗忘的数据库开发职业 - 数据库测试

记一次面试的尴尬,说说作为数据库工程师,学好英语的重要性

三本书告诉你,碎片化阅读到底该怎么碎

说说数据库工程师必备的一个技能

学技术总是很慢,你得培养这些个技巧!

真的轮到你来说“一年的SQL经验重复了十年而已”?答对这四题再说

闲话扯淡

让老美感觉到害怕的中国5G

转专业的程序员,泪眼回首头三年

是的,我们面基了

报告,我的香港之旅

下月起,即将影响千万人的大事

现在的年轻人,都欠债吗?

东南亚的高薪软狗招聘,打死不接

本周阶段性的收获颇丰,我满意了

蚂蚁金服 OceanBase 性能远超 Oracle 100%?告诉你真相
谈谈这周可乐的事情

11月的碎碎念

周末,说三件事

丰巢柜收费了,你还用吗?

读研与工作,你选哪个?

Web 技术无疑被苹果公司打入了冷宫

疫情下,裁员补偿标准不可不知

程序员“删库跑路”的锅,微盟该怎么补?

聊聊钟南山教授,带给我的思考

疫情下的新年,别有滋味

盘点近期数据库界趣文要事

蚂蚁金服上市后取消了周报,为什么我说不合理?

陆金所去Oracle化,平安科技500 IT人亟待转型

阿里 OceanBase 数据库又拿下世界第一,性能超越Oracle 23 倍!

我看韩剧《寄生虫》,一副好牌究竟是怎么被打烂的?

作为程序员,在挑选 iPad 时我在想什么?

继蚂蚁金服OceanBase之后,腾讯也祭出了大杀技

从 Microsoft 加入 OpenJDK 项目说起

故事,要从豆瓣9.2高分的《小丑》说起

《巴黎评论 I》启示录连载之 - 杜鲁门.卡波蒂

【数据仓库|本号精华合集(三)】数据仓库|本号精华合集(三)
文章图片

    推荐阅读