MySQL 是被广泛使用的一个数据库,但是 Web 开发人员会在大规模访问时的数据库扩展以及性能方面遇到问题。这也是近年来 NoSQL 数据库开始出现并逐渐繁荣的一个原因。对于关注 MySQL 可扩展性的 DBA 人员来说,当然非常希望看到像 Twitter 这样的网站是怎样运用和优化 MySQL 的。
Jeremy Cole 和 Davi Arnaut 是 Twitter DBA 和 DB 开发组的成员,他们表示,大部分 Twitter 数据都采用了 MySQL 作为持久化存储,包括发表的 Tweets、兴趣图、时间线,以及用户数据。由于 Twitter 的数据规模和访问规模, 他们不得不对 MySQL 源码进行修改优化以适应这种级别的应用。为了回馈社区,他们决定在 BSD 许可证下开源他们对 MySQL 所做的贡献。项目托管在 GitHub,主要的修改包括:
增加状态变量,特别是在 InnoDB 引擎内。这样能更有效地监控系统负载和运行状态。
在非一致性内存访问系统中优化内存分配。在初始化时就分配 InnoDB 的缓存池,如果内存不足则可迅速获得错误报告,这样在服务器面临内存压力时也能保证性能稳定。
减少查询超时中一些不必要的操作。这样服务器可以在毫秒级别主动取消耗时过长的查询。
以一种轻量的方式导入导出 InnoDB 的缓存池。这样可以让我们以最小的代价执行回滚。
针对 SSD 固态硬盘进行优化,包括 page-flushing 以及减少写操作以改善 SSD 硬盘寿命。
另外在4月12日,Twitter 还将对 Gizzard, 一个 MySQL 的分片复制框架进行详细介绍。如果有任何问题,都可以在 GitHub 上向他们提 issue。