我们在做数据分析的工作时,会用到大量的数据,而这些数据都来自于数据库,SQL可以让我们很方便的去访问和查询数据库。
作为一个数据分析师,我们需要掌握一些SQL的核心技能
1.数据库
什么是数据库?
选取主流的数据库
mysql的安装与配置非常简单,我们从官网下载社区版本安装,windows用户可以选择安装MSI安装(Windows Installer),一直默认安装,到了数据库用户和密码设置时,设置即可。
选取MySQL的GUI工具
SQL的基本操作
创建数据库
CREATE DATABASE STUDENTS
打开数据库
USE STUDENTS
查看所有数据库
#查看所有数据库 SHOW DATABASES #查看当前打开的数据库 SELECT DATABASE()
删除数据库
DROP DATABASES 数据库名称
DROP DATABASE STUDENTS
在数据库中创建数据表,根据具体数据类型,选择想用数据长度
CREATE TABLE tb1( ID INT(20) NOT NULL, 姓名 varchar(20), 性别 varchar(5) ) #查看数据表 SHOW TABLES FROM STUDENTS #查看数据表结构 SHOW COLUMNS FROM STUDENTS
向表中写入记录
INSERT tb1(ID, 姓名, 性别) VALUES(1,'张三', '男'); INSERT tb1(ID, 姓名, 性别) VALUES(2,'李四', '女'); INSERT tb1(ID, 姓名, 性别) VALUES(3,'王五', '男'); INSERT tb1(ID, 姓名, 性别) VALUES(4,'赵六', '女');
删除记录的数据
DELETE FROM tb1 WHERE 姓名 = '赵六'
更新记录的数据
UPDATE persons SET 性别 = '男' WHERE 姓名 ='赵六'
2.SQL重点知识
一、基础知识
列出一些关键字
- select.....from
- where
- group by --having
- order by
- like
- distinct
- 常用函数:sum,count, max, min,avg
- case when then else end
select 列名称 from 表名称 select * from 表名称 #获取所有列
WHERE 列 运算符 值
需要理解筛选的条件,合理利用运算符获取数据
group by:对指定的字段进行分组,产生汇总信息,一般结合sum,count函数使用。
select 字段1,字段2 from Table1 GROUP BY 字段1,字段2
group by 使用中需要注意的问题
1,注意返回结果集的字段,,这些字段要么要包含在Group By语句的后面,作为分组的依据;要么就要被包含在聚合函数中
2,where 搜索条件在进行group by 分组操作之前应用,不能使用聚合函数
3, having 搜索条件在进行分组操作之后应用,可以使用聚合函数
ORDER BY 字段1,字段2
where column_namelike pattern
SELECT DISTINCT 列名称 FROM 表名称
sum:返回数值列的总数、 avg: 返回列的平均值、 count()返回表中的记录数
max():返回最大值、 min():返回最小值
二、连接(join)查询
- 内连接
- 外连接
内连接
FROM 表1 [INNER] JOIN 表2 ON〈联接条件〉
FROM 表1 表名1 [INNER] JOIN 表1 表名2 ON〈联接条件〉
外连接
FROM 表1 LEFT JOIN 表2 ON〈连接条件〉
全连接 Full join, 两张表全部返回
图解如下
三、子查询
说白了就是嵌套查询,包含在某个查询中,如果子查询依赖于外部条件,则被称为相关子查询;
反之为非相关子查询
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/kjbd-fxjc/5421.html