网站首页 > 基础教程 正文
最近在一个项目的研发过程中,起初采用pandas读取数据,数据量不大的时候pandas的优越性就不言而喻了,非常方便快捷。后来随着数据量的增加问题就出现了。当.csv行数超过1048576行时,32位win7提示这是最大的行数。说明单表容量在32位操作系统是受限的。强行增大单表文件大小。实践中单表最大1.3GB,结果python使用pandas根本无法打开。只能改变数据库方式。
研究当前数据库潮流以及便捷性,决定采用sqlite3 数据库。采用数据库就需要把大量数据导入sqlite库中。最开始没深入考虑就按照常规数据库方法读写数据库。实践表明单表传统一条一条写入数据库一天只能完成十万条记录插入。系统起码有1300万条数据,那导入时间那是不可想象的。网上查了很多资料加上实验。采用批量事务提交能几百倍的提高效率。实战测试一分钟左右就能完成10要数据插入。这是什么效率,天壤之别的优化!
猜你喜欢
- 2024-10-17 手把手教你在嵌入式设备中使用SQLite3
- 2024-10-17 sqlite功能强大么,为什么这么流行?
- 2024-10-17 发布至今18年,为什么SQLite一定要用C语言来开发?
- 2024-10-17 C语言实例_调用SQLITE数据库完成数据增删改查
- 2024-10-17 微信为什么使用 SQLite 保存聊天记录?
- 2024-10-17 sqlite在Linux中的移植、安装、测试
- 2024-10-17 Sqlite数据库操作的sql操作语句 sqlite数据库密码破解工具
- 2024-10-17 【数据库】Upsert = Update or Insert
- 2024-10-17 SQLite数据库,LabVIEW使用很方便
- 2024-10-17 python内置的SQLite数据库香不香?来试试就知道了
- 最近发表
- 标签列表
-
- gitpush (61)
- pythonif (68)
- location.href (57)
- tail-f (57)
- pythonifelse (59)
- deletesql (62)
- c++模板 (62)
- css3动画 (57)
- c#event (59)
- linuxgzip (68)
- 字符串连接 (73)
- nginx配置文件详解 (61)
- html标签 (69)
- c++初始化列表 (64)
- exec命令 (59)
- canvasfilltext (58)
- mysqlinnodbmyisam区别 (63)
- arraylistadd (66)
- node教程 (59)
- console.table (62)
- c++time_t (58)
- phpcookie (58)
- mysqldatesub函数 (63)
- window10java环境变量设置 (66)
- c++虚函数和纯虚函数的区别 (66)