首页 存档 技术 查看内容

MySQL 大数据量快速插入方法和语句优化

2018-3-30 13:00 |来自: 互联网 443 0

摘要: 作者:lyd518 blog.csdn.net/lyd518/article/details/6690419 MySQL大数据量快速插入方法和语句优化是本文我们主要要介绍的内容,接下来我们就来一一介绍,希望能够让您有所收获! INSERT语句的速度 插入一个记 ...

作者:lyd518

blog.csdn.net/lyd518/article/details/6690419


MySQL大数据量快速插入方法和语句优化是本文我们主要要介绍的内容,接下来我们就来一一介绍,希望能够让您有所收获!


INSERT语句的速度


插入一个记录需要的时间由下列因素组成,其中的数字表示大约比例:


连接:(3)


发送查询给服务器:(2)


分析查询:(2)


插入记录:(1x记录大小)


插入索引:(1x索引)


关闭:(1)


这不考虑打开表的初始开销,每个并发运行的查询打开。


表的大小以logN (B树)的速度减慢索引的插入。


加快插入的一些方法


如果同时从同一个客户端插入很多行,使用含多个VALUE的INSERT语句同时插入几行。这比使用单行INSERT语句快(在某些情况下快几倍)。如果你正向一个非空表添加数据,可以调节bulk_insert_buffer_size变量,使数据插入更快。


如果你从不同的客户端插入很多行,能通过INSERT DELAYED语句加快速度。


用MyISAM,如果在表中没有删除的行,能在SELECT语句正在运行的同时插入行。


当从一个文本文件装载一个表时,使用LOAD DATA INFILE。这通常比使用很多INSERT语句快20倍。参见13.2.5节,“LOAD DATA INFILE语法”。


当表有很多索引时,有可能要多做些工作使得LOAD DATA INFILE更快些。使用下列过程:


有选择地用CREATE TABLE创建表


执行FLUSH TABLES语句或命令mysqladmin flush-tables。使用myisamchk keys-used=0 -rq /path/to/db/tbl_name。这将从表中取消所有索引的使用。


用LOAD DATA INFILE把数据插入到表中,因为不更新任何索引,因此很快。 如果只想在以后读取表,使用myisampack压缩它。参见15.1.3.3节,“压缩表特性”。


用myisamchk -r -q /path/to/db/tbl_name重新创建索引。这将在写入磁盘前在内存中创建索引树,并且它更快,因为避免了大量磁盘搜索。结果索引树也被完美地平衡。 执行FLUSH TABLES语句或mysqladmin flush-tables命令。


请注意如果插入一个空MyISAM表,LOAD DATA INFILE也可以执行前面的优化;主要不同处是可以让myisamchk为创建索引分配更多的临时内存,比执行LOAD DATA INFILE语句时为服务器重新创建索引分配得要多。


也可以使用ALTER TABLE tbl_name DISABLE KEYS代替myisamchk keys-used=0 -rq/path/to/db/tbl_name,使用ALTER TABLE tbl_name ENABLE KEYS代替myisamchk -r -q/path/to/db/tbl_name。使用这种方式,还可以跳过FLUSH TABLES。


锁定表可以加速用多个语句执行的INSERT操作:


LOCK TABLESaWRITE;

INSERTINTOaVALUES(1,23),(2,34),(4,33);

INSERTINTOaVALUES(8,26),(6,29);

UNLOCK TABLES;


这样性能会提高,因为索引缓存区仅在所有INSERT语句完成后刷新到磁盘上一次。一般有多少INSERT语句即有多少索引缓存区刷新。如果能用一个语句插入所有的行,就不需要锁定。


对于事务表,应使用BEGIN和COMMIT代替LOCK TABLES来加快插入。


锁定也将降低多连接测试的整体时间,尽管因为它们等候锁定最大等待时间将上升。例如:


Connection1does1000inserts

Connections2,3,and4do1insert

Connection5does1000inserts


如果不使用锁定,2、3和4将在1和5前完成。如果使用锁定,2、3和4将可能不在1或5前完成,但是整体时间应该快大约40%。


INSERT、UPDATE和DELETE操作在MySQL中是很快的,通过为在一行中多于大约5次连续不断地插入或更新的操作加锁,可以获得更好的整体性能。如果在一行中进行多次插入,可以执行LOCK TABLES,随后立即执行UNLOCK TABLES(大约每1000行)以允许其它的线程访问表。这也会获得好的性能。


INSERT装载数据比LOAD DATA INFILE要慢得多,即使是使用上述的策略。


为了对LOAD DATA INFILE和INSERT在MyISAM表得到更快的速度,通过增加key_buffer_size系统变量来扩大 键高速缓冲区。


INSERT语法


INSERT[LOW_PRIORITY|DELAYED|HIGH_PRIORITY][IGNORE]

[INTO]tbl_name[(col_name,...)]

VALUES({expr|DEFAULT},...),(...),...

[ON DUPLICATE KEY UPDATEcol_name=expr,...]


或:


INSERT[LOW_PRIORITY|DELAYED|HIGH_PRIORITY][IGNORE]

[INTO]tbl_name

SETcol_name={expr|DEFAULT},...

[ON DUPLICATE KEY UPDATEcol_name=expr,...]


或:


INSERT[LOW_PRIORITY|HIGH_PRIORITY][IGNORE]

[INTO]tbl_name[(col_name,...)]

SELECT...

[ 声明:文章版权归原作者所有 部分文章转自互联网 如有侵权请联系 [邮箱地址] 删除


路过

雷人

握手

鲜花

鸡蛋

相关分类

返回顶部