当前位置: 首页 > article >正文

Python分析无人驾驶汽车在桂林市文旅行业推广的问卷

【项目背景】

通过市场调研、文本分析、访谈和问卷调查等方法,探讨:

  1. 网民对无人驾驶汽车出行服务的态度。
  2. 无人驾驶安全员的行业背景。
  3. 不同人群在旅游时的交通选择偏好。
  4. 游客及当地居民对桂林市文旅路线的交通满意度。
  5. 乘客对无人驾驶汽车的满意度。
  6. 桂林市文旅路线推广无人驾驶汽车是否会优化桂林旅游交通体验及其影响因素。

【相关代码】

import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.decomposition import LatentDirichletAllocation as LDA
import matplotlib.pyplot as plt
from scipy.stats import chi2_contingency

# 假设我们有一个包含问卷数据的CSV文件
data = pd.read_csv('survey_data.csv')

# 数据清洗:移除缺失值
data_clean = data.dropna()

# 文本分析:使用LDA模型提取主题
vectorizer = CountVectorizer(stop_words='english')
lda = LDA(n_components=3, random_state=0)
lda.fit_transform(vectorizer.fit_transform(data_clean['comments']))

# 可视化主题
pyLDAvis.enable_notebook()
vis = pyLDAvis.gensim_models.prepare(lda, vectorizer, data_clean)
pyLDAvis.display(vis)

# 交叉表和卡方检验:分析不同人群的交通选择偏好
contingency_table = pd.crosstab(data_clean['age_group'], data_clean['preferred_transport'])
chi2, p, dof, expected = chi2_contingency(contingency_table)

print(f"Chi-squared test results: chi2={chi2}, p={p}, dof={dof}")

# 满意度分析:计算不同交通方式的满意度
satisfaction_scores = data_clean[['waiting_time', 'vehicle_cleanliness', 'driver_attitude']].mean(axis=1)
print(f"Average satisfaction scores: {satisfaction_scores.mean()}")
 

【代码说明】

  • 数据导入与清洗:

使用Pandas库读取名为"survey_data.csv"的CSV文件,加载问卷数据。

对数据进行清洗,通过dropna()方法移除包含缺失值的行,存储在data_clean中。

  • 文本分析(LDA模型):

使用Scikit-learn库中的CountVectorizer进行文本向量化,将文本数据转换成词频矩阵。

使用Latent Dirichlet Allocation (LDA) 模型对文本数据进行主题提取。

通过LDA模型的fit_transform方法拟合并转换文本数据,将其应用到data_clean['comments']列中。

  • 可视化主题(pyLDAvis):

调用pyLDAvis.gensim_models.prepare方法准备可视化数据,用于展示LDA模型的结果。

最终通过pyLDAvis.display方法展示生成的交互式可视化主题图。

  • 交叉表和卡方检验:

使用Pandas的crosstab方法创建交叉表,分析不同人群(按照'age_group')的交通选择偏好('preferred_transport')。

通过chi2_contingency方法进行卡方检验,计算卡方值(chi2)、p值(p)、自由度(dof)和期望频数(expected)。

  • 满意度分析:

计算各个满意度指标(等待时间、车辆清洁度、司机态度)的平均分数。

将三个满意度指标的平均分数进行均值计算,作为整体满意度得分。

需要注意的是,代码中使用的一些库和函数如pyLDAvis、gensim_models需要提前导入或安装。整体代码结构为数据处理、文本分析、可视化、统计分析和结果展示。

civilpy:Python数据分析及可视化实例目录940 赞同 · 36 评论文章​编辑

civilpy:Python通过某上市企业经营业绩预测股价走势0 赞同 · 0 评论文章​编辑

civilpy:Python实时追踪关键点组成人体模型0 赞同 · 0 评论文章​编辑


http://www.kler.cn/a/274754.html

相关文章:

  • 基于Spring Boot的找律师系统
  • Linux网络基础--传输层Tcp协议(上) (详细版)
  • 数据结构漫游记:初识vector
  • 【使用MCP协议连接本地和远程数据——以Claude的Windows客户端为例】
  • SQL语句自动加上了LIMIT 10,导致报错
  • Word使用分隔符实现页面部分分栏
  • 00_coolprop_in_matlab在Matlab中使用CoolProp
  • 飞天使-k8s知识点26-kubernetes温故知新1-pod
  • 在idea中配置tomcat服务器,部署一个项目(下载教程加链接)
  • 【爬虫】实战-爬取Boss直聘信息数据
  • docker小白第十四天之Portainer与CIG
  • Go语言之函数、方法、接口
  • 数据在内存中的存储(C语言)(难点,需多刷几遍)
  • Nginx发布之后可以使用IP访问,不能使用localhost访问, Nginx发布之后可以使用localhost访问,不能使用IP访问,
  • Selenium WebDriver使用EC来定义显式等待的条件
  • Python内置对象
  • react中useContext的用法
  • 万用表革新升级,WT588F02BP-14S语音芯片助力智能测量新体验v
  • 服务器端(Debian 12)配置jupyter与R 语言的融合
  • Java项目基于SpringBoot和Vue的时装购物系统的设计与实现
  • C#基础语法学习笔记(传智播客学习)
  • [Qt学习笔记]Halcon窗口界面上显示文字的字体尺寸、样式修改
  • GO-Gin-Example 第六部分 将Golang应用部署到Docker
  • 【MySQL】知识点 + 1
  • 什么是Spring Boot
  • 字符串函数---(1)