当前位置：首页 > article >正文

基于Python的医院运营数据可视化平台：设计、实现与应用（下）

article 2025/2/19 9:09:42

在这里插入图片描述

5.2 数据采集与预处理的代码实现

从 HIS、LIS 等系统采集数据时，需要针对不同系统的接口特点编写相应的采集代码。以从 HIS 系统采集患者就诊记录为例，假设 HIS 系统提供了基于 HTTP 的 API 接口，且数据格式为 JSON，以下是使用 Python 的 requests 库进行数据采集的代码示例：

import requests

import json

\# HIS系统API地址

his\_api\_url = "http://his\_system.com/api/visits"

\# 发送HTTP GET请求获取数据

response = requests.get(his\_api\_url)

if response.status\_code == 200:

&#x20;   \# 将响应内容解析为JSON格式

&#x20;   data = json.loads(response.text)

&#x20;   \# 这里可以对采集到的数据进行初步处理，例如提取关键信息

&#x20;   for visit in data:

&#x20;       patient\_id = visit.get('patient\_id')

&#x20;       visit\_time = visit.get('visit\_time')

&#x20;       diagnosis = visit.get('diagnosis')

&#x20;       \# 进一步处理数据，如存储到本地文件或数据库

&#x20;       \# 示例：将数据写入CSV文件

&#x20;       with open('visits.csv', 'a', newline='') as csvfile:

&#x20;           fieldnames = \['patient\_id', 'visit\_time', 'diagnosis']

&#x20;           writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

&#x20;           if csvfile.tell() == 0:

&#x20;               writer.writeheader()

&#x20;           writer.writerow({'patient\_id': patient\_id, 'visit\_time': visit\_time, 'diagnosis': diagnosis})

else:

&#x20;   print(f"请求失败，状态码: {response.status\_code}")

对于 LIS 系统，如果其数据存储在数据库中，我们可以使用相应的数据库连接库进行数据采集。假设 LIS 系统使用 MySQL 数据库，以下是使用 pymysql 库采集检验数据的代码示例：

import pymysql

import csv

\# 连接MySQL数据库

conn = pymysql.connect(

&#x20;   host='lis\_database\_host',

&#x20;   user='lis\_user',

&#x20;   password='lis\_password',

&#x20;   database='lis\_database',

&#x20;   charset='utf8mb4'

)

try:

&#x20;   with conn.cursor() as cursor:

&#x20;       \# 执行SQL查询语句，获取检验数据

&#x20;       sql = "SELECT patient\_id, test\_item, test\_result FROM test\_results"

&#x20;       cursor.execute(sql)

&#x20;       results = cursor.fetchall()

&#x20;       \# 将数据写入CSV文件

&#x20;       with open('test\_results.csv', 'w', newline='') as csvfile:

&#x20;           fieldnames = \['patient\_id', 'test\_item', 'test\_result']

&#x20;           writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

&#x20;           writer.writeheader()

&#x20;           for row in results:

&#x20;               patient\_id, test\_item, test\_result = row

&#x20;               writer.writerow({'patient\_id': patient\_id, 'test\_item': test\_item, 'test\_result': test\_result})

finally:

&#x20;   conn.close()

在数据清洗和转换方面，以清洗和转换上述采集到的患者就诊记录数据为例，以下是使用 Pandas 库进行数据清洗和转换的代码：

import pandas as pd

\# 读取采集到的就诊记录数据

data = pd.read\_csv('visits.csv')

\# 清洗数据

\# 删除含有缺失值的行

data = data.dropna()

\# 处理异常值，假设visit\_time格式为字符串，将其转换为datetime类型并检查异常时间

data\['visit\_time'] = pd.to\_datetime(data\['visit\_time'], errors='coerce')

data = data.dropna(subset=\['visit\_time'])  # 删除转换失败的异常时间数据

\# 转换数据

\# 将diagnosis字段中的诊断名称进行标准化处理，例如统一为小写

data\['diagnosis'] = data\['diagnosis'].str.lower()

\# 保存清洗和转换后的数据

data.to\_csv('cleaned\_visits.csv', index=False)

上述代码实现了从 HIS、LIS 等系统采集数据，并对采集到的数据进行了清洗和转换，确保数据的质量和可用性，为后续的数据分析和可视化提供可靠的数据基础。

5.3 数据分析与挖掘的代码实现

在数据分析与挖掘模块中，使用 Python 的相关库实现了多种分析功能。以下是描述性分析、相关性分析、预测性分析的代码示例：

描述性分析代码示例

import pandas as pd

\# 读取数据

data = pd.read\_csv('hospital\_data.csv')

\# 进行描述性分析

descriptive\_stats = data.describe()

print(descriptive\_stats)

上述代码使用 Pandas 库读取 CSV 格式的医院运营数据文件，然后调用 describe () 函数对数据进行描述性统计分析，该函数会计算数据的计数、均值、标准差、最小值、25% 分位数、50% 分位数（中位数）、75% 分位数以及最大值，并返回一个包含这些统计信息的 DataFrame。

相关性分析代码示例

import pandas as pd

import seaborn as sns

import matplotlib.pyplot as plt

\# 读取数据

data = pd.read\_csv('hospital\_data.csv')

\# 计算相关性矩阵

correlation\_matrix = data.corr()

\# 使用Seaborn绘制相关性热力图

plt.figure(figsize=(10, 8)