当前位置：首页 > article >正文

律所录音证据归集工具：基于PyQt6与多线程的自动化音频管理解决方案

article 2025/2/10 5:14:23

在律所日常工作中，音频证据的整理与归集是一个高频且复杂的任务。面对大量的案件录音文件，如何实现快速且准确的分类与存档，成为了律所提高效率、降低出错率的关键。本文将通过技术角度解析一款名为律所录音证据归集工具的项目，详细介绍其背后的技术架构、实现细节以及如何通过自动化提升工作效率。

项目概述

该工具主要面向律师事务所，通过自动化手段帮助用户快速整理录音文件，生成规范化的目录结构，支持导入案件信息与音频文件，并根据案件数据自动匹配、命名及分类音频文件。工具基于PyQt6进行图形化界面开发，使用多线程技术避免长时间操作造成界面卡顿。

技术栈

PyQt6：作为GUI框架，PyQt6提供了简洁易用的界面开发方式，能够快速创建交互式应用。
多线程：为了确保在大量数据处理时界面不会卡顿，我们使用了PyQt的QThread和QObject进行多线程任务的处理。
Pandas：用于处理导入的Excel表格数据，解析案件信息并与音频文件进行匹配。
自定义模块：如daoru（导入模块）、sorting（音频排序模块）、export（导出模块）等，负责音频的整理、文件路径的管理以及最终的导出操作。

核心功能实现

1. 导入案件数据与音频文件

在程序的开始，用户需要导入案件信息和音频文件。我们使用了QFileDialog来弹出文件选择对话框，确保用户能够方便地导入相关文件。音频文件和Excel表格通过以下代码导入：

def on_import_audio_folder(self):
folder = daoru.import_audio_folder(self, self.first_widget)
if folder:
self.audio_folder = folder

def on_import_excel(self):
phone_list, df_data = daoru.import_phone_file_excel(self, self.first_widget)
if phone_list is not None and df_data is not None:
self.phone_list = phone_list
self.excel_df = df_data
# 打印导入的号码信息
self.try_print_converted_phone_data()

通过调用daoru.import_audio_folder和daoru.import_phone_file_excel，我们分别导入了音频文件夹和案件信息表格。在on_import_excel方法中，Excel表格数据会被解析成Pandas DataFrame格式，便于后续的数据处理和分析。

2. 数据匹配与音频归集

音频文件与案件信息的匹配是核心功能之一。根据Excel中的案件数据（如电话号码、案件编号），我们会将音频文件重命名并按规则存档。以下是处理音频排序的代码实现：

class SortingWorker(QObject):
finished = pyqtSignal()
error = pyqtSignal(str)
log_signal = pyqtSignal(str)
progress_signal = pyqtSignal(int)

def __init__(self, excel_data, audio_folder, output_base, org_code, ent_name):
super().__init__()
self.excel_data = excel_data
self.audio_folder = audio_folder
self.output_base = output_base
self.org_code = org_code
self.ent_name = ent_name

def run(self):
try:
sorting.one_click_sort(
excel_data=self.excel_data,
audio_folder=self.audio_folder,
output_base=self.output_base,
org_code=self.org_code,
ent_name=self.ent_name,
log_callback=self.log_signal.emit,
progress_callback=self.progress_signal.emit
)
self.finished.emit()
except Exception as e:
self.error.emit(str(e))

SortingWorker类负责执行音频文件的排序和归集工作，one_click_sort方法是排序的核心函数，接收案件数据、音频文件夹路径等参数，进行音频文件的命名和整理。在排序过程中，我们使用progress_signal信号来实时更新进度条。

3. 导出整理结果

整理完成后，用户可以选择导出整理好的音频文件及其路径。此过程不仅会生成整理的文本文件（记录文件路径），还会将音频文件复制到指定的目录中，便于后期的查找和存档。export.export_txt_and_copy负责将整理结果导出：

def on_export_clicked(self):
if not self.sorted_records:
print("[ERROR] 没有分拣记录，无法导出！")
self.append_log("[ERROR] 没有分拣记录，无法导出！")
return

for rec in self.sorted_records:
if "录音/录音" in rec[5]:
rec[5] = rec[5].replace("录音/录音", "录音")
if "录音\\录音" in rec[5]:
rec[5] = rec[5].replace("录音\\录音", "录音")

if not hasattr(self, 'output_base') or not self.output_base:
self.append_log("[ERROR] 未找到输出目录，请先执行一键分拣操作！")
return

try:
export.export_txt_and_copy(self.sorted_records, self.output_base, self.audio_folder)
print("[INFO] 导出操作完成！")
self.append_log("[INFO] 导出操作完成！")
self.show_export_success_message()
except Exception as e:
print(f"[ERROR] 导出过程中出错: {e}")
self.append_log(f"[ERROR] 导出过程中出错: {e}")

该函数确保整理后的音频文件被准确导出，同时生成一个包含音频路径的文本文件，方便律师后续查找与管理。

4. 多线程处理，确保界面流畅

在处理大量音频文件时，传统的单线程方式会导致界面卡顿或无响应。为了避免这种情况，我们使用了QThread来将音频归集的处理工作放到后台执行，从而保证界面的流畅性。

class MyWindow(QMainWindow, Ui_MainWindow):
def __init__(self):
super().__init__()
self.setupUi(self)

self.sorting_thread = None
self.sorting_worker = None

def on_deal_clicked(self):
self.sorting_thread = QThread()
self.sorting_worker = SortingWorker(
excel_data=self.excel_df,
audio_folder=self.audio_folder,
output_base=self.output_base,
org_code=self.jgdm_lineEdit.text().strip(),
ent_name=self.qyjj_lineEdit.text().strip()
)
self.sorting_worker.moveToThread(self.sorting_thread)
self.sorting_thread.started.connect(self.sorting_worker.run)
self.sorting_worker.finished.connect(self.on_sorting_finished)
self.sorting_worker.error.connect(self.on_sorting_error)
self.sorting_worker.log_signal.connect(self.append_log)
self.sorting_worker.progress_signal.connect(self.update_progress)
self.sorting_thread.start()