Python操作MySQL
目前，关于Python操作数据库主要有以下几种方法：
MySQLdb的使用
MySQLdb是用于Python连接MySQL数据库的接口，它实现了Python数据库API规范V2.0，基于MySQL C API上建立的，目前只支持Python2.x。
PyMySQL的使用
PyMySQL是Python中用于连接MySQL服务器的一个库，它支持Python3.x，是一个纯Python写的MySQL客户端，它的目标是替代MySQLdb。PyMySQL在MIT许可下发布。
mysql.connector 的使用
由于 MySQL 服务器以独立的进程运行，并通过网络对外服务，所以，需要支持 Python 的 MySQL 驱动来连接到 MySQL 服务器。
目前，有两个 MySQL 驱动：
mysql-connector-python：是 MySQL 官方的纯 Python 驱动
MySQL-python ：是封装了 MySQL C驱动的 Python 驱动
SQLAlchemy的使用
是一种ORM（Object-Relational Mapping）框架，将关系数据库的表结构映射到对象上，隐藏了数据库操作背后的细节，简化了数据操作。

3.1 在Python3.X上安装MySQL驱动
STEP1：由于MySQL官方提供了mysql-connector-python驱动。安装时，在Anaconda Prompt中输入：
conda install mysql-connector-python
STEP2：使用以下代码来测试mysql-connector是否安装成功：
import mysql.connector

如果没有产生错误，则表明安装成功。
3.2 创建数据库连接

这里连接的是我之前创建的blank这个user。如果数据库已经存在的话，我们可以直接连接；如果数据库不存在，直接连接则会报错，这个时候我们就需要创建一个数据库，创建数据库可以在MySQL Workbench中创建，也可以在python中使用"CREATE DATABASE"语句，在本实验中，我们使用已经在MySQL workbench中已经建好的test_s这个数据库。
import mysql.connector

连接数据库

config = {
'user' : 'blank' #用户名
'password' : 'password' #自己设定的密码
'host' : '127.0.0.1' #ip地址，本地填127.0.0.1，也可以填localhost
'port' : '3306' #端口，本地的一般为3306
'database' : 'test_s' #数据库名字，这里选用test_s
}
con = mysq;.connector.connect(**config)

3.3 创建数据表
STEP1:当Python 和数据之间的连接建立起来之后，要操作数据库，就需要让 Python对数据库执行SQL语句。创建数据表我们使用"CREATE TABLE"语句，在test_s这个数据库中创建一个叫做customers的表格，其中包含id、name、address、sex、age、sl这六个columns。Python是通过游标执行SQL语句的，所以，连接建立之后，就要利用连接对象得到游标对象。
cursor()：表示游标
execute()：是执行语句
STEP2：一般在创建新表的时候，我们还会设置一个主键（PRIMARY KEY）来方便进行查询工作。创建主键，我们可以用"INT AUTO_INCREMENT PRIMARY KEY"

创建一个表

buffered = True 不设的话，查询结果没有读完会报错

raise errors.InternalError("Unread result found")

mycursor = con.cursor(buffered = True)
mycursor.execute("CREATE TABLE customers(id INT AUTO_INCREMENT PRIMARY KEY, \
name VARCHAR(255) , address VARCHAR(255), \
7sex VARCHAR(225) , age INT(10) , sl INT(10))")

VARCHAR()表示的是数据类型，定义的是变长字符串；INT（）表示整型

STEP3：执行语句。执行完后，我们可以回到MySQL workbench，可以看到在test_s下面的customers这个表格，其中Columns为我们创建的id，name，address，sex，age和sl。

STEP4：但是，当我们再次执行语句的时候，由于已经创建了"customers"这个表，所以再次执行会报错，这个时候就需要加一个判断，判断这个表是否已经存在于test_s这个数据库中
ProgrammingError: Table 'customers' alreadyy exists

STEP5：我们可以用"SHOW TABLES"语句来查看数据表是否已经存在，如果存在就print"table already exists",如果不存在，就print"table does not exist"。
def tableExists(mycursor, name):
stmt = "SHOW TABLES LIKE '" +name+ "'"
mycursor.execute(stmt)
return mycursor.fetchone()
mycursor = con.cursor()
if tableExists(mycursor , 'customers'):
print("table already exists")
else:
print("table not exists")

STEP6：上面的语句只是为了帮助我们判断是否有同名表，当我们要新建一个表时，我们可以在这个判断的基础上，在创建新表前删掉数据库内的同名表，再建新表。删除我们用的是"DROP TABLE"，新建表是"CERATE TABLE"
import mysql.connector

连接数据库

config = {
'user' : 'blank',
'password' :'fuying123888',
'host' : '127.0.0.1',
'port':'3306',
'database' : 'test_s'
}
con = mysql.connector.connect(**config)

检查一个表是否存在

def tableExists(mycursor, name):
stmt = "SHOW TABLES LIKE '"+name+"'"
mycursor.execute(stmt)
return mycursor.fetchone()

删除一个表（无论它是否已经存在）

def dropTable(mycursor, name):
stmt = "DROP TABLE IF EXISTS "+name
mycursor.execute(stmt)

buffered=True 不设的话，查询结果没有读完会报错

raise errors.InternalError("Unread result found")

mycursor = con.cursor(buffered=True)

删除临时表

tableName = 'customers'
dropTable(mycursor, tableName)

创建一个表

mycursor.execute("CREATE TABLE customers(id INT AUTO_INCREMENT PRIMARY KEY,\
name VARCHAR(255), address VARCHAR(255), \
sex VARCHAR(225), age INT(10), sl INT(10))")

3.4 增、改、删、查
3.4.1增
在cutomers表中插入数据用的是"INSERT INTO"语句。
除了用一条条用execute( )插入之外，我们还可以用executemany（）的方式批量插入，也就是val中包含的是一个元组列表，包含我们想要插入的数据。
需要注意的事是：如果数据表格有更新，那么必须用到commit()语句，否则在workbench是看不到插入的数据的。

往表里插入一些记录

sql="INSERT INTO customers(name,address,sex,age,sl) VALUES(%s, %s,%s,%s,%s)"
val = ("John", "Highway 21","M",23,5000)
mycursor.execute(sql, val)
val = ("Jenny", "Highway 29","F",30,12500)
mycursor.execute(sql, val)
val=[("Tom","ABC 35","M",35,14000),
("Tom1","Highway 29","M",28,6700),
("Lily","Road 11","F",30,8000),
("Martin","Road 24","M",35,14000),
("Sally","Fast 56","M",32,15000)]
mycursor.executemany(sql, val)
con.commit()
执行以上代码后，回到workbench，，我们可以看到最终的结果为：

3.4.2 改

在cutomers表中更改数据用的是"UPDATE"语句。例如，我们将最后一条 “Sally”的名字改成“Tiny”：

将Sally改为Tiny

sql="UPDATE customers SET name='Tiny' WHERE name ='Sally'"
mycursor.execute(sql)
con.commit()

执行代码，回到workbench我们可以看到结果为：

3.4.3 删

关于删，我们在上文提到了删除表格，用的是“DROP TABLE ”语句，“IF EXISTS”关键字是用于判断表是否存在，只有在存在的情况才删除当我们要删除一条数据记录时候，用到的语句是“DELETE FROM”语句。例如：我们想在customers这个表格当中，删除name为Tiny的这一条记录：

删除名字为Tiny的记录

sql="DELETE FROM customers WHERE name='Tiny'"
mycursor.execute(sql)
con.commit()

执行代码，回到workbench我们可以看到结果为：

3.4.4 查

普通查询

普通查询数据用的是SELECT语句。例如：我们想查询customers的所有信息，并且进行打印输出：

查询这里面所有的人：

sql="SELECT * FROM customers"
mycursor.execute(sql)
myresult = mycursor.fetchall() # fetchall() 获取所有记录
for x in myresult:
print(x)

得到最终结果为：

值得注意的是：fetchall（）表示的是获得所有记录；fetchone（）表示只获取一条数据；fetchmany（size=3）表示获取三条记录；
限定条件查找

为了获取指定条件下的查找结果，我们可以使用where语句。例如：我们想在查询customers的所有信息基础上，输出年龄大于30岁的消费者的信息：
sql="SELECT * FROM customers WHERE age > 30"
mycursor.execute(sql)
myresult = mycursor.fetchall() # fetchall() 获取所有记录
for x in myresult:
print(x)

最终得到的结果为：

通配符查找

有时候为了进行模糊查询，可以匹配通配符，通过“LIKE”来进行查找：
百分号（%）:代表零个、一个或多个数字或字符；
下划线（_）:代表一个单一的数字或字符。
例如：查出所有名字中含有t的记录：

%代表零个、一个或者多个数字或字符

_代表一个单一的数字或者字符

sql = "SELECT * FROM customers WHERE name LIKE '%t%'"
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)
执行代码，我们得到的结果如下：

值得注意的是：但是使用Like查询时，即使我们在代码输入的是“t”，执行过程中也会将含有“T”的记录同样输出，即用LIKE匹配通配符对大小写不敏感。为了区分大小写，可以用“GLOB”进行查询。
排序

查询结果排序可以使用 ORDER BY 语句，默认的排序方式为升序，如果要设置降序排序，可以设置关键字 DESC。例如：我们要按照年龄对customers进行升序排列：

排序

按照年龄排序

sql = "SELECT * FROM customers ORDER BY age"
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)
执行代码，得到的结果为：
n zxx m nb

LIMIT

当数据库数量非常大的时候，为了限制查询的数据量，可以采用"LIMIT"语句来指定，比如我们希望在customers表中找出工资最高的三个人：

找出其中工资最高的3个人

sql = "SELECT * FROM customers ORDER BY sl DESC LIMIT 3"
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)
执行代码，得到结果为：

二次筛选

有时候我们在进行一次筛选后，还需要设定一个筛选条件进行二次筛选，我们就可以采用“HAVING”语句。例如：我们希望统计在年龄处于20-30（不包括20岁，但是包括30岁）的人当中，选择薪资大于5000的消费者：

二次过滤

统计在年龄处于20-30之间的人中，选择薪资大于5000的人

sql = "SELECT * FROM customers WHERE age>20 and age<=30 HAVING sl>5000 "
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)
con.commit()
con.close()
执行代码后，得到的结果如下：

3.5 分组聚合

在数据库中，分组常用的语句为“GROUP BY”语句，聚合函数，通常是配合分组进行使用，在数据库中常用的聚合函数为：
COUNT（）：表示计算总行数，括号可以写和字段名字
MAX（column）：表示求此列的最大值
MIN（column）：表示求此列的最小值
SUM（column）：表示求此列的和
AVG（column）：表示求此列的平均值

从customers表中统计出男女薪资总和

以sex为类别进行GROUP BY 分组，加上WHERE来做条件判断。

统计出男女的薪水总数

sql = "SELECT sex,sum(sl) FROM customers GROUP BY sex"
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)
最终结果为：

从customers表中，按性别进行分组，统计出年龄在20-30的消费者的薪资，并且按照薪资高低进行排序

按照性别进行分组，统计出年龄在20-30岁的消费者的薪资

sql = "SELECT sex,sum(sl) FROM customers WHERE age>20 and age<=30 GROUP BY sex ORDER BY sl"
mycursor.execute(sql)
myresult=mycursor.fetchall()
for x in myresult:
print(x)

值得注意的是：本例是以sex为类别进行GROUP BY 分组，加上WHERE来做条件判断，加上ORDER BY 排序，但是GROUP BY 的位置必须要在WHERE 之后，在ORDER BY 之前。
3.6 分批量读取和处理数据

程序运行的时候，数据都是在内存中的，但是有时候如果数据量太大，内存会装不下，这个时候我们就需要分批从数据库去读取数据，然后再处理，等到处理完了之后，再去读取。比如：我们要从customers当中分批读取和处理薪资大于8000的消费者，并将其存入另一张表中。我们的做法是先新建一个表，然后从数据库当中读取3个，并且将读取的这3个进行处理，处理完读取的这三个后，再去数据库重新读取三个，直到数据库的数据读完为止。

分批读取并且处理将薪资大于8000的消费者的记录存到另一张表中

创建一个临时表

tmpName = 'cust_tmp'
dropTable(mycursor, tmpName)
mycursor.execute("CREATE TABLE cust_tmp(id INT AUTO_INCREMENT PRIMARY KEY,\
name VARCHAR(255), address VARCHAR(255), \
sex VARCHAR(225), age INT(10), sl INT(10))")
ins = con.cursor(buffered=True)
if tableExists(mycursor, tableName):
print("process table: %s", tableName)

查询表里的记录

sql = "SELECT * FROM customers WHERE address is not null"  
mycursor.execute(sql)  
# 每次处理 batchsize 条记录，直到所有查询结果处理完  
batchsize = 3  
readsize = batchsize  
while readsize == batchsize:  
    print("before batch")  
    myresult = mycursor.fetchmany(size=batchsize)  
    for x in myresult:  
        if x[5]>8000:  
            ins.execute("INSERT INTO"+tmpName+"(id,name,address,sex,age,sl) VALUES (%s, %s,%s, %s,%s,%s)", x)  
            print(x)  
    readsize = len(myresult)

else:
print("table: does not exists", tableName)
con.commit()
con.close()
我们回到workbench找到这个新建的表格cust_tmp，我们可以发现薪资大于8000的消费者都被记录上了：

执行代码，我们可以看到处理的过程如下：
在第一批读取的三条记录中，只有两条是满足薪资大于8000的要求，第二批读取的三条记录中，只有一条满足薪资大于8000的要求，而在第三批读取的三条记录中，没有任何记录是满足薪资大于8000的要求，当没有记录可以读的时候，程序即停止。

值得注意的是：就分批读取的batchsize而言，当batchsize太大时，会导致内存装不下，batchsize太小，会导致每次通过网络连接数据库会很慢。因此，我们选取batchsize大小的原则是在内存够用的前提下尽可能的大，在真实的业务场景下，建议每次读取100以上，当内存够用的话，也可以增加至几千上万条。

mysql python

菜单 学习猿地 - LMONKEY

开通学习猿地VIP

尊享10项VIP特权 持续新增

知识通关挑战

打卡带练！告别无效练习

接私单赚外块

VIP优先接，累计金额超百万

学习猿地私房课免费学

大厂实战课仅对VIP开放

你的一对一导师

每月可免费咨询大牛30次

领取更多软件工程师实用特权

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

人生苦短我要学Python！

PHP开发工程师

PHP是世界上最好的编程语言!

GO开发工程师

想优雅的写程序，赶紧GO!

大数据开发工程师

弄大数据，就是在搞革命!

前端开发工程师

不仅最好，而且最全!

UI开发工程师

这个世界从来不缺少美，缺少你来创造美!

Linux运维工程师

不只是说说而已！

WEB前端1+X

不仅为考证，轻松做开发

计算机二级（C语言）

一切只为考证！

猿工手册

各种工具精挑细选

猿材料

各种工具精挑细选

猿代码

各种工具精挑细选

猿著课件

各种工具精挑细选

知识题库

知识闯关节节高，刷题涨知识！

阶段练习

单元测试知识学习状况秒掌握！

期末考试

期末测试，学习情况即刻知道！

面试题库

最新的企业技术人员招聘真题练习！

Java专区

2948篇 ｜ 24.5万人浏览

Python专区

2593篇 ｜ 19.5万人浏览

大数据专区

2948篇 ｜ 18.5万人浏览

PHP专区

3953篇 ｜ 27.5万人浏览

Go专区

1382篇 ｜ 12.5万人浏览

Web前端专区

1453篇 ｜ 31.5万人浏览

Linux云计算

1230篇 ｜ 4.5万人浏览

其他专区

53232篇文章 ｜ 11.5万人浏览

搜索

历史记录 清除记录

近期热搜

项目开发全程实录（电商EW_Shop）

8676 人 1年前

轻松学会Laravel-项目篇（商城API）

2022 人 1年前

Python数据分析2.0-金融

325 人 1年前

Python办公自动化2.0

241 人 1年前

使用账号登录

启用更安全省心的  微信登录

Java开发工程师

何以解忧，唯有 Java！

Python开发工程师

菜单学习猿地 - LMONKEY

尊享10项VIP特权持续新增

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览

历史记录清除记录

2948篇｜ 24.5万人浏览

2593篇｜ 19.5万人浏览

2948篇｜ 18.5万人浏览

3953篇｜ 27.5万人浏览

1382篇｜ 12.5万人浏览

1453篇｜ 31.5万人浏览

1230篇｜ 4.5万人浏览

53232篇文章｜ 11.5万人浏览