当前位置: 首页 > article >正文

深入理解中比较两个字符串差异的方法”或“高效比对字符串:diff-match-patch:c++实战指南

        diff-match-patch 是一个强大的开源 JavaScript 库,由 Google 开发并维护,用于计算两个字符串之间的差异,并进行高效的匹配和补丁应用。这个库广泛应用于版本控制系统、协同编辑系统以及任何需要处理文本变化的场景。

GitHub地址:https://github.com/google/diff-match-patch

这是对应不同语言的实现,像cpp,csharp,dart,java,JavaScript,lua,Python等等。
其中demo是html的文件,直接打开可以清晰看到对比效果。

其中:

diff:

Diff 获取两个文本并找到差异。此实现基于角色进行工作。 任何 diff 的结果都可能包含 'chaff',不相关的小共性,使输出复杂化。 差异后清理算法会排除这些微不足道的共性。
match:

Match 在较大的文本中查找模式。 match 的这种实现是模糊的,这意味着即使 pattern 包含错误,并且与文本中的内容不完全匹配。 此实现还接受预期位置,应在该位置附近找到匹配项。 候选匹配项的评分基于 a) 与 pattern 和文本,以及 b) 候选匹配项与预期位置之间的距离。 match distance 参数设置这两个量度的相对重要性。
patch:

两个文本可以相互比较,从而生成一个 Patch 列表。 然后,可以将这些补丁应用于第三个文本。如果第三个文本有自己的编辑,则此版本的 patch 将尽最大努力应用其更改,报告哪些补丁成功,哪些补丁失败。

c++ 实战实例

diff:

示例代码:

Semantic

	float diff_timeout = ui.lineEdit->text().toFloat();
	// Cost of an empty edit operation in terms of edit characters.
	short diff_editCost = ui.lineEdit_2->text().toShort();;

	QString text = ui.textEdit->toPlainText();
	QString text1 = ui.textEdit_2->toPlainText();
	diff_match_patch* dmp = new diff_match_patch(diff_timeout, diff_editCost);
	QList<Diff> diff, diff1;
	diff = dmp->diff_main(text, text1);
	dmp->diff_cleanupSemantic(diff);
	QString ds = dmp->diff_prettyHtml(diff);
	ui.textEdit_3->setHtml(ds);

Efficiency

dmp->diff_cleanupEfficiency(diff);

match:

示例代码:

	QString text = ui.textEdit_4->toPlainText();
	QString pattern = ui.textEdit_6->toPlainText();


	int loc = ui.lineEdit_location->text().toInt();
	QString Match_Distance = ui.lineEdit_distance->text();
	QString Match_Threshold = ui.lineEdit_threshold->text();

	diff_match_patch* dmp = new diff_match_patch();
	int match = dmp->match_main(text, pattern, loc);

	if (match == -1) {
		QString msg = "No match found.";
	}
	else {
		QString quote = text.mid(match, pattern.length());
		QString str = QString("Match found at character %1 :%2").arg(match).arg(quote);
		ui.textEdit_5->setText(str);
	}

patch:

示例代码:

	QString text = ui.textEdit_9->toPlainText();
	diff_match_patch dmp;
	QList<Patch> patches = dmp.patch_fromText(patch_text);
	QPair<QString, QVector<bool> > results = dmp.patch_apply(patches, text);
	QString s = results.first;
	ui.textEdit_10->setText(s);


http://www.kler.cn/a/306501.html

相关文章:

  • 某app最新版 vmp算法分析一
  • HTML之表单学习记录
  • Openstack7--安装消息队列服务RabbitMQ
  • 微信小程序=》基础=》常见问题=》性能总结
  • SciPy:Python 科学计算工具包的全面教程
  • 拦截器实现http请求访问本地图片
  • c++面向对象
  • 栈OJ题——用栈实现队列
  • 嵌入式初学-C语言-数据结构--七
  • 【linux基础】linux中的开发工具(4)--调试器gdb的使用
  • 问题及解决方案汇总
  • 结构体内存对齐
  • 【算法】动态规划—最长公共子序列
  • HTML+CSS - 网页布局之多列布局定位
  • 网络安全应急响应概述
  • 用STM32做一个USB-TTL工具吧
  • JavaScript Promise 异步编程的一些代码分享
  • 远程桌面内网穿透是什么?有什么作用?
  • openssl下载和创建证书
  • 如何在 Visual Studio Code 中反编译具有正确行号的 Java 类?
  • C++:opencv多边形逼近二值图轮廓--cv::approxPolyDP
  • Java集合进阶--双列集合
  • R与机器学习系列|15.可解释的机器学习算法(Interpretable Machine Learning)(下)
  • HarmonyOS开发5.0【rcp网络请求】
  • ChatGPT+2:修订初始AI安全性和超级智能假设
  • L298N电机驱动方案简介