借用binlog2sql工具轻松解析MySQL的binlog文件,再现Oracle的闪回功能

借用binlog2sql工具轻松解析MySQL的binlog文件

    • 简介
    • 依赖配置
    • 用户权限
    • 选项配置
    • 案例:误UPDATE表数据回滚
    • binlog2sql VS mysqlbinlog

看腻文章了就来听听视频演示吧:https://www.bilibili.com/video/BV1Zj411k7VW/

简介

binlog2sql是美团大众点评开源的一款用于解析binlog的工具。可用于提取操作的SQL及生成回滚SQL。

依赖配置

github项目:
https://github.com/danfengcao/binlog2sql

github打不开可去gitee下载:
https://gitee.com/damned_gentleness/binlog2sql/tree/master/

unzip binlog2sql-master.zip 
cd binlog2sql-master/
# 需要安装的Python依赖
[root@db01 binlog2sql-master]# cat requirements.txt
PyMySQL==0.7.11
wheel==0.29.0
mysql-replication==0.13
# 指定使用阿里云的镜像(能连网的方式)
pip install -r requirements.txt -i http://mirrors.aliyun.com/pypi/simple/ --trusted-host mirrors.aliyun.com
  1. 阿里云:http://mirrors.aliyun.com/pypi/simple/
  2. 中国科技大学:https://pypi.mirrors.ustc.edu.cn/simple/
  3. 清华大学:https://pypi.tuna.tsinghua.edu.cn/simple/
  4. 中国科学技术大学:http://pypi.mirrors.ustc.edu.cn/simple/

MySQL server必须设置以下参数:

[mysqld]
server_id = 1
log_bin = /var/log/mysql/mysql-bin.log
max_binlog_size = 1G
binlog_format = row
binlog_row_image = full

用户权限

最小权限集合:

  • select:需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
  • super/replication client:两个权限都可以,需要执行’SHOW MASTER STATUS’, 获取server端的binlog列表
  • replication slave:通过BINLOG_DUMP协议获取binlog内容的权限
-- 授权语句
GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO xxoo;

由于是伪装成slave来获取主的二进制事件,故无需对binlog有可读权限。

先切进python脚步文件(binlog2sql.py)所在目录

[root@dba binlog2sql-master]# cd binlog2sql
[root@dba binlog2sql]# ll
total 36
-rwxr-xr-x 1 root root  7747 Oct 12  2018 binlog2sql.py
-rwxr-xr-x 1 root root 11581 Oct 12  2018 binlog2sql_util.py
-rw-r--r-- 1 root root    92 Oct 12  2018 __init__.py

选项配置

解析出标准SQL

[root@dba binlog2sql]# python binlog2sql.py -h127.0.0.1 -P3306 -uroot -proot -dmdb -t t_student --start-file='mysql-bin.000011'
USE mdb;
CREATE ALGORITHM=UNDEFINED DEFINER=`root`@`%` SQL SECURITY DEFINER VIEW `t_view` AS select * from heartbeat;
USE mdb;
create table test2 (id int,name text);
USE mdb;
DROP TABLE `test2` /* generated by server */;
USE db_test;
create table tblpky(id int primary key auto_increment,name text);
USE mdb;
create table t_student(id int,name varchar(18),class int,score varchar(18));
INSERT INTO `mdb`.`t_student`(`class`, `score`, `id`, `name`) VALUES (1, '66', 1, 'a'); #start 2418 end 2638 time 2023-02-23 02:22:10
INSERT INTO `mdb`.`t_student`(`class`, `score`, `id`, `name`) VALUES (1, '58', 2, 'b'); #start 2418 end 2638 time 2023-02-23 02:22:10
INSERT INTO `mdb`.`t_student`(`class`, `score`, `id`, `name`) VALUES (2, '86', 3, 'c'); #start 2418 end 2638 time 2023-02-23 02:22:10
INSERT INTO `mdb`.`t_student`(`class`, `score`, `id`, `name`) VALUES (2, '78', 4, 'd'); #start 2418 end 2638 time 2023-02-23 02:22:10
UPDATE `mdb`.`t_student` SET `class`=2, `score`='89', `id`=3, `name`='c' WHERE `class`=2 AND `score`='86' AND `id`=3 AND `name`='c' LIMIT 1; #start 2734 end 2927 time 2023-02-23 02:28:38
DELETE FROM `mdb`.`t_student` WHERE `class`=1 AND `score`='58' AND `id`=2 AND `name`='b' LIMIT 1; #start 3023 end 3201 time 2023-02-23 02:28:55
INSERT INTO `mdb`.`t_student`(`class`, `score`, `id`, `name`) VALUES (1, '48', 5, 'e'); #start 3297 end 3475 time 2023-02-23 02:29:32

参数选项

python binlog2sql.py --help解析模式:
--stop-never 持续解析binlog。可选。默认False,同步至执行命令时最新的binlog位置。
-K, --no-primary-key 对INSERT语句去除主键。可选。默认False
-B, --flashback 生成回滚SQL,可解析大文件,不受内存限制。可选。默认False。与stop-never或no-primary-key不能同时添加。
--back-interval -B模式下,每打印一千行回滚SQL,加一句SLEEP多少秒,如不想加SLEEP,请设为0。可选。默认1.0。解析范围控制:
--start-file 起始解析文件,只需文件名,无需全路径 。必须。
--start-position/--start-pos 起始解析位置。可选。默认为start-file的起始位置。
--stop-file/--end-file 终止解析文件。可选。默认为start-file同一个文件。若解析模式为stop-never,此选项失效。
--stop-position/--end-pos 终止解析位置。可选。默认为stop-file的最末位置;若解析模式为stop-never,此选项失效。
--start-datetime 起始解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。
--stop-datetime 终止解析时间,格式'%Y-%m-%d %H:%M:%S'。可选。默认不过滤。对象过滤:
-d, --databases 只解析目标db的sql,多个库用空格隔开,如-d db1 db2。可选。默认为空。
-t, --tables 只解析目标table的sql,多张表用空格隔开,如-t tbl1 tbl2。可选。默认为空。
--only-dml 只解析dml,忽略ddl。可选。默认False。
--sql-type 只解析指定类型,支持INSERT, UPDATE, DELETE。多个类型用空格隔开,如--sql-type INSERT DELETE。可选。默认为增删改都解析。用了此参数但没填任何类型,则三者都不解析。

案例:误UPDATE表数据回滚

忘带where条件的误UPDATE整张表

mysql> select * from t_student;
+------+------+-------+-------+
| id   | name | class | score |
+------+------+-------+-------+
|    1 | a    |     1 | 66    |
|    3 | c    |     2 | 89    |
|    4 | d    |     2 | 78    |
|    5 | e    |     1 | 48    |
+------+------+-------+-------+
4 rows in set (0.00 sec)mysql> update t_student set score='failure';
Query OK, 4 rows affected (0.01 sec)
Rows matched: 4  Changed: 4  Warnings: 0mysql> select * from t_student;
+------+------+-------+---------+
| id   | name | class | score   |
+------+------+-------+---------+
|    1 | a    |     1 | failure |
|    3 | c    |     2 | failure |
|    4 | d    |     2 | failure |
|    5 | e    |     1 | failure |
+------+------+-------+---------+
4 rows in set (0.00 sec)

找到误操作记录的binlog文件

mysql> show master status\G
*************************** 1. row ***************************File: mysql-bin.000011Position: 3899Binlog_Do_DB: Binlog_Ignore_DB: 
Executed_Gtid_Set: 0ee6241a-f240-11ec-9388-080027be95b2:1-169719
1 row in set (0.00 sec)

根据误操作人提供的大致误操作时间过滤数据

[root@dba binlog2sql]# python binlog2sql.py -h127.0.0.1 -P3306 -uroot -p'root' -dmdb -tt_student --start-file='mysql-bin.000011' --start-datetime='2023-02-23 02:36:17' --stop-datetime='2023-02-23 02:38:17'UPDATE `mdb`.`t_student` SET `class`=1, `score`='failure', `id`=1, `name`='a' WHERE `class`=1 AND `score`='66' AND `id`=1 AND `name`='a' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=2, `score`='failure', `id`=3, `name`='c' WHERE `class`=2 AND `score`='89' AND `id`=3 AND `name`='c' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=2, `score`='failure', `id`=4, `name`='d' WHERE `class`=2 AND `score`='78' AND `id`=4 AND `name`='d' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=1, `score`='failure', `id`=5, `name`='e' WHERE `class`=1 AND `score`='48' AND `id`=5 AND `name`='e' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27

可以知道误操作的位置点在3571-3868之间和时间点,再用flashback模式( -B )生成回滚sql,检查回滚sql是否正确

[root@dba binlog2sql]# python binlog2sql.py -h127.0.0.1 -P3306 -uroot -p'root' -dmdb -tt_student --start-file='mysql-bin.000011' --start-datetime='2023-02-23 02:36:17' --stop-datetime='2023-02-23 02:38:17' -B > tb_student_rb.sql[root@dba binlog2sql]# cat tb_student_rb.sql UPDATE `mdb`.`t_student` SET `class`=1, `score`='48', `id`=5, `name`='e' WHERE `class`=1 AND `score`='failure' AND `id`=5 AND `name`='e' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=2, `score`='78', `id`=4, `name`='d' WHERE `class`=2 AND `score`='failure' AND `id`=4 AND `name`='d' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=2, `score`='89', `id`=3, `name`='c' WHERE `class`=2 AND `score`='failure' AND `id`=3 AND `name`='c' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27
UPDATE `mdb`.`t_student` SET `class`=1, `score`='66', `id`=1, `name`='a' WHERE `class`=1 AND `score`='failure' AND `id`=1 AND `name`='a' LIMIT 1; #start 3571 end 3868 time 2023-02-23 02:36:27

确认回滚sql语句无误并回滚。登录mysql确认,检查数据回滚成功。

mysql> select * from t_student;
+------+------+-------+---------+
| id   | name | class | score   |
+------+------+-------+---------+
|    1 | a    |     1 | failure |
|    3 | c    |     2 | failure |
|    4 | d    |     2 | failure |
|    5 | e    |     1 | failure |
+------+------+-------+---------+
4 rows in set (0.00 sec)mysql> source /root/binlog2sql-master/binlog2sql/tb_student_rb.sql
Query OK, 1 row affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0Query OK, 1 row affected (0.01 sec)
Rows matched: 1  Changed: 1  Warnings: 0Query OK, 1 row affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0Query OK, 1 row affected (0.00 sec)
Rows matched: 1  Changed: 1  Warnings: 0mysql> select * from t_student;
+------+------+-------+-------+
| id   | name | class | score |
+------+------+-------+-------+
|    1 | a    |     1 | 66    |
|    3 | c    |     2 | 89    |
|    4 | d    |     2 | 78    |
|    5 | e    |     1 | 48    |
+------+------+-------+-------+
4 rows in set (0.00 sec)

binlog2sql VS mysqlbinlog

限制:

  • mysql server必须开启,离线模式下不能解析
    – 基于BINLOG_DUMP协议来获取binlog内容
    – 需要读取server端information_schema.COLUMNS表,获取表结构的元信息,拼接成可视化的sql语句
  • 参数 binlog_row_image 必须为FULL,暂不支持MINIMAL
  • 解析速度不如mysqlbinlog

优点:

  • 纯Python开发,安装与使用都很简单
  • 自带flashback、no-primary-key解析模式,无需再装补丁
  • flashback模式下,更适合闪回实战
  • 解析为标准SQL,方便理解、筛选
  • 代码容易改造,可以支持更多个性化解析

参考链接:https://www.cnblogs.com/ivictor/p/6418409.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/148580.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

代码随想录 Day10 栈与队列 LeetCode T239 滑动窗口的最大值 T347 前K个高频元素

简要介绍一下单调队列和优先级队列的不同 元素顺序的处理:单调队列中,元素的顺序是单调的,也就是说,队列中的元素按照特定的单调性(递增或递减)排列。这种特性使得单调队列在处理一些问题时非常高效&#…

C++ stack和queue

stack的介绍 stack是作为容器适配器被实现的,容器适配器即是对特定类封装作为其底层的容器,并提供一组特定的成员函数来访问其元素,将特定类作为其底层的,元素特定容器的尾部(即栈顶)被压入和弹出 stack的底层容器可以是任何标准…

【做题笔记】多项式/FFT/NTT

HDU1402 - A * B Problem Plus 题目链接 大数乘法是多项式的基础应用,其原理是将多项式 f ( x ) a 0 a 1 x a 2 x 2 a 3 x 3 ⋯ a n x n f(x)a_0a_1xa_2x^2a_3x^3\cdotsa_nx^n f(x)a0​a1​xa2​x2a3​x3⋯an​xn中的 x 10 x10 x10,然后让大数的…

为什么特斯拉和理想,能用很少的SKU获得成功? -审批版

作者|普通一涛 编辑|德新 乔布斯喜欢「为改变混乱繁杂而生的现代简约主义」设计理念,所以苹果产品走的都是超级简洁的路线。 在汽车圈,特斯拉和理想也是简洁主义信奉者。 能用两款车打天下,绝不用三款车,能用三款车的&#xff0…

再学C++ | STL库中可能存在的内存溢出与脏数据问题

STL库中的 vector 是我们使用最频繁的STD容器之一。它具有广泛的应用,并且在性能方面表现出色。然而,其存在一种潜在问题,即溢出。由于 vector 在使用下标访问元素时不会检查索引是否越界,因此很可能导致溢出错误的出现。这种错误…

图神经网络 GNN

之前经常看到图神经网络的内容,但是一直都觉得很难,就没有继续了解,现在抽空学习了一下,简单了解GNN是个什么东西,还没有进行代码实践,随着后续的学习,会继续更新代码的内容,这里先记…

互联网Java工程师面试题·MyBatis 篇·第二弹

目录 16、Xml 映射文件中,除了常见的 select|insert|updae|delete标签之外,还有哪些标签? 17、Mybatis 的 Xml 映射文件中,不同的 Xml 映射文件,id 是否可以重复? 18、为什么说 Mybatis 是半自动 ORM 映射…

conda安装使用jupyterlab注意事项

文章目录 一、conda安装1.1 conda安装1.2 常见命令1.3 常见问题 二、jupyterlab2.1 jupyterlab安装和卸载2.2 常见错误2.2.1 版本冲突,jupyterlab无法启动2.2.2 插件版本冲突 2.3 常用插件2.3.1 debugger2.3.2 jupyterlab_code_formatter 2.4 jupyter技巧 一、conda…

点云处理开发测试题目

点云处理开发测试题目 文件夹中有一个场景的三块点云数据,单位mm。是一个桌子上放了一个纸箱,纸箱上有四个圆孔。需要做的内容是: 1. 绘制出最小外接立方体,得到纸箱的长宽高值。注意高度计算是纸箱平面到桌子平面的距离。 2. 计…

flink自定义窗口分配器

背景 我们知道处理常用的滑动窗口分配器,滚动窗口分配器,全局窗口分配器,会话窗口分配器外,我们可以实现自己的自定义窗口分配器,以实现我们的自己的窗口逻辑 自定义窗口分配器的实现 package wikiedits.assigner;i…

设计模式之抽象工厂模式--创建一系列相关对象的艺术(简单工厂、工厂方法、到抽象工厂的进化过程,类图NS图)

目录 概述概念适用场景结构类图 衍化过程业务需求基本的数据访问程序工厂方法实现数据访问程序抽象工厂实现数据访问程序简单工厂改进抽象工厂使用反射抽象工厂反射配置文件衍化过程总结 常见问题总结 概述 概念 抽象工厂模式是一种创建型设计模式,它提供了一种将相…

Logrus 集成 color 库实现自定义日志颜色输出字符原理

问题背景 下列代码实现了使用 Logurs 日志框架输出日志时根据级别不同,使用对应的自定义颜色进行输出。那么思考下代码的逻辑是怎么实现的呢? 效果如下: 代码如下: import ("fmt""github.com/sirupsen/logrus&q…

ARM汇编与C言语的混合编程

1. C言语如何与汇编进行交互 有些时候,我们需要在汇编代码中调用C代码,或者说C代码中调用汇编代码。 那么,汇编调用C代码,或者C代码调用汇编函数,他们的函数参数、返回值是如何传递的? 对应ARM架构来说&…

angularjs开发环境搭建

Angularjs是一个前端页面应用开发框架,其使用TypeScript作为开发语言,Angularjs的特性包括,使用组件、模板以及依赖注入的开发框架构建可扩展的web应用,使用易于集成的类库支持页面路由、页面表单、前后端接口交互等各种不同特性&…

RabbitMQ-主题模式

接上文 RabbitMQ-发布订阅模式和路由模式 1 主题模式 #通配符 代表0个或多个。*通配符 代表 1个或多个 进行测试,修改配置文件 Configuration public class RabbitConfiguration {Bean("topicExchange") //这里使用预置的Topic类型交换机public Exchan…

Android Studio实现简易计算器(带横竖屏,深色浅色模式,更该按钮颜色,selector,style的使用)

目录 前言 运行结果: 运行截屏(p50e) apk文件 源码文件 项目结构 总览 MainActivity.java drawable 更改图标的方法: blackbutton.xml bluebuttons.xml greybutton.xml orangebuttons.xml whitebutton.xml layout 布…

嵌入式Linux应用开发-驱动大全-同步与互斥③

嵌入式Linux应用开发-驱动大全-同步与互斥③ 第一章 同步与互斥③1.4 Linux锁的介绍与使用1.4.1 锁的类型1.4.1.1 自旋锁1.4.1.2 睡眠锁 1.4.2 锁的内核函数1.4.2.1 自旋锁1.4.2.2 信号量1.4.2.3 互斥量1.4.2.4 semaphore和 mutex的区别 1.4.3 何时用何种锁1.4.4 内核抢占(pree…

2023年中国体育赛事行业现状及趋势分析:体育与科技逐步融合,推动产业高质量发展[图]

体育赛事运营是指组织体育赛事或获取赛事版权,并进行赛事推广营销、运营管理等一系列商业运作的运营活动。体育赛事运营相关业务主要包括赛事运营与营销、赛事版权运营两个部分。 体育赛事运营行业分类 资料来源:共研产业咨询(共研网&#x…

MySQL面试题合集

MySQL面经知识整理 文章目录 MySQL面经知识整理一、查询相关1.什么是MySQL的连接查询,左连接,右连接,内外连接2.SQL慢查询优化的方法3.大表查询如何优化 二、索引相关1.在MySQL中,可以通过哪些命令来查看查询是否使用了索引2.MySQL的最左匹配…

实验三十四、串联型稳压电路参数的选择

一、题目 电路如图1所示。已知输入电压为 50 Hz 50\,\textrm{Hz} 50Hz 的正弦交流电,来源于电源变压器副边;输出电压调节范围为 5 ∼ 20 V 5\sim20\,\textrm V 5∼20V,满载为 0.5 A 0.5\,\textrm A 0.5A; C 3 C_3 C3​ 为消振…