Load data导入csv文件
635 words
2 minutes
场景
- 数据量较大且需要较高的导入效率
- mysqlimport本质就是对load data语句的封装
- 本次使用的csv文件是50m,36w行,12列
具体实践
1
2
3
4
5
6
7
8
9
10
11
12
13
| CREATE TABLE `my_user` (
`id` int unsigned NOT NULL AUTO_INCREMENT,
`name` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
`age` tinyint NOT NULL DEFAULT '0',
`email` varchar(255) CHARACTER SET utf8mb4 COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
`country` varchar(255) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
`type` tinyint NOT NULL DEFAULT '0',
`job` varchar(255) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
`brief` varchar(255) COLLATE utf8mb4_general_ci NOT NULL DEFAULT '',
`created_at` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP,
`updated_at` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_general_ci;
|
- mysql的配置
/etc/mysql/mysql.conf.d/mysqld.cnf
的 [mysqld]
选项添加配置,重启mysql
csv文件需要放在上面的目录(/tmp)下
sql语句
1
| LOAD DATA INFILE '/tmp/my_user.csv' INTO TABLE my_user FIELDS TERMINATED BY ',' ENCLOSED BY '"' LINES TERMINATED BY '\n' IGNORE 1 LINES (@dummy,name,age,email,country,type,@dummy,job,@dummy,@dummy,@dummy,@dummy) SET brief='这个人很低调.';
|
- 括号中的列需要和csv中的列一致(顺序和数量)
- 将数据表中需要导入的列对应写在括号内,不需要导入的数据表的列,用
@dummy
占位 - 使用SET 指定列(brief)的值
关于将大号Excel转为CSV
1
| cd /tmp && soffice --headless --convert-to csv:"Text - txt - csv (StarCalc)":"44,34,0,1,1/1" my_user.xlsx --outdir ./
|
- 可能报错
javaldx failed!
,这主要就是,在正式环境中,没有设置执行用户的home文件夹.记得重启容器!! 假设执行用户为 nobody
1
2
3
4
5
6
7
8
9
10
| # 创建一个目录,例如 /home/nobody
mkdir -p /home/nobody/.config/libreoffice
# 更改目录的所有者和权限
chown -R nobody:nogroup /home/nobody
chmod -R 755 /home/nobody
apk --no-cache add shadow sudo
# error: javaldx failed! 主要就是没有设置执行用户的home文件夹.记得重启容器!!
usermod -d /home/nobody nobody
|