当前位置：首页 > article >正文

分析excel硕士序列数据提示词——包含对特征的筛选，非0值的过滤

article 2025/3/1 11:53:30

文章目录

1 分析出发点
2 围绕出发点的文件分析
3 功能模块
- 计算重心
- 相关性计算
- 教学倾向百分比
多列相关性计算
结果封装
证伪——过滤0后的交叉相关系数
封装和总控——批量处理
特征筛选——筛选提问倾向最大和最小的前五
- - 代码
总的清洗

1 分析出发点

写一个python代码，遍历"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"下所有excel文件，计算每个excel的行为类别列和教学倾向列这两列的交叉相关系数，新建一个excel存入文件名作为一列，后面一列是行为倾向交叉系数列，存入对应的系数
以下是完整的 Python 代码，包含了遍历文件夹、收集所有 Excel 文件的绝对路径、并将其写入到一个新的 Excel 文件中，所有文件路径从第一行开始写入：

import os
import pandas as pd

# 设置文件夹路径和输出文件路径
folder_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"
output_file = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质结果.xlsx"

# 收集所有 Excel 文件的详细信息
data = []
for root, dirs, files in os.walk(folder_path):
    for file in files:
        if file.lower().endswith(('.xlsx', '.xls')):
            full_path = os.path.join(root, f

查看全文

http://www.kler.cn/a/447485.html