mysql插入2000万数据_Mysql千万级别数据批量插入，性能提高

weixin_39807859

3570人浏览 · 2021-01-19 07:09:56

weixin_39807859 · 2021-01-19 07:09:56 发布

-----------------------------------------------------------方式1 ----------------------------------------------------------------------------------------

第一步：配置my.ini文件

文件中配置

bulk_insert_buffer_size=120M 或者更大

将insert语句的长度设为最大。

Max_allowed_packet=1M

Net_buffer_length=8k

保存

第二步：查看设置的参选有没有生效.

Mysql > SHOW VARIABLES;

bulk_insert_buffer_size默认是8M，我们要把它调成100M或百兆以上，也不要太大。下面看调整个好的，如下图：

第三步：完成设置后，批量插入数据时使用多条模式。

INSERT INTO table (field1,field2,field3) VALUES ('a',"b","c"), ('a',"b","c"),('a',"b","c");

----------------------------------------------------------- 方式2 ----------------------------------------------------------------------------------------

建表语句：

DROP TABLE IF EXISTS `stock_discover`;

CREATE TABLE `stock_discover` (

`code` char(6) NOT NULL,

`index` int(11) unsigned NOT NULL DEFAULT '0',

`name` varchar(20) NOT NULL,

`exchange` varchar(10) NOT NULL DEFAULT '',

`date` timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,

`yesterday` double unsigned NOT NULL,

PRIMARY KEY (`code`,`index`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC;

单个添加更新

如果记录在表中不存在则进行插入，如果存在则进行更新：

sql = "INSERT INTO stock_discover VALUES ('%s', 2, '%s', 'HZ', '%s', '%s')" \

" ON DUPLICATE KEY UPDATE `date` = '%s' , yesterday = '%s''"

#数据格式

data = ['000005', u'合肥', '2018-09-19 14:55:21', u'2520.64']

sql = sql % (data[0], data[1], data[2], data[3], data[2], data[3])

cursor.execute(sql)

批量添加更新

在更新大量数据时可能同时遇到两个问题：

① 如果每条更新执行一次sql性能很低，也容易造成阻塞；

② 批量更新时又有可能遇到主键重复的问题

使用 ON DUPLICATE KEY UPDATE 一条sql解决批量更新和主键重复问题(id为主键),使用executemany进行批量插入

# 记录在表中不存在则进行插入，如果存在则进行更新

sql = "INSERT INTO `stock_discover` VALUES (%s, %s, %s, %s, %s, %s) " \

"ON DUPLICATE KEY UPDATE `date` = VALUES(`date`) , yesterday = VALUES(yesterday)"

#数据格式如下：

data_info = [('000005', 2, u'合肥', 'HZ', '2018-09-19 14:55:21', u'2520.64'),

('000006', 2, u'北京', 'HZ', '2018-09-19 14:55:21', u'2694.92'),

('000007', 2, u'上海', 'HZ', '2018-09-19 14:55:21', u'2745.38')]

#批量插入使用executement

cursor.executemany(sql, data_info)

注意： ON DUPLICATE KEY UPDATE是mysql特有的语法，对于其他sql并不一定适用

也可以使用如下方法：

Mysql插入数据的SQL语句主要有：

1、insert into表示插入数据，数据库会检查主键，如果出现重复会报错；

2、replace into表示插入替换数据，需求表中有PrimaryKey，或者unique索引，如果数据库已经存在数据，则用新数据替换，如果没有数据效果则和insert into一样；

3、insert ignore表示，如果表中如果已经存在相同的记录，则忽略当前新数据；

create table testtb(

id int not null primary key,

name varchar(50),

age int

);

insert into testtb(id,name,age)values(1,'bb',13);

select * from testtb;

insert ignore into testtb(id,name,age)values(1,'aa',13);

select * from testtb;

replace into testtb(id,name,age)values(1,"aa",12);

select * from testtb;

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git