当前位置: 首页 > article >正文

wordcloud库基本介绍

文章目录

    • wordcloud库概述
      • wordcloud库的安装
    • wordcloud库使用说明
      • 配置对象参数
    • wordcloud应用实例
    • 实例: 政府工作报告词云

wordcloud库概述

wordcloud是优秀的词云展示第三方库
词云以词语为基本单位,更加直观和艺术地展示文本
在这里插入图片描述

wordcloud库的安装

(cmd命令行) pip install wordcloud

在这里插入图片描述

wordcloud库使用说明

wordcloud库把词云当作一个wordcloud对象

  • wordcloud.WordCloud() 代表一个文本对应的词云
  • 可以根据文本中词语出现的概率等参数绘制词云
  • 词云的绘制形状,尺寸和颜色都可以设定

wordcloud库常规方法
w = wordcloud.WordCloud()

  • 以WordCloud对象为基础
  • 配置参数,加载文件,输出文件
    在这里插入图片描述
import wordcloud
c = wordcloud.WordCloud() # 步骤1: 配置对象参数
c.generate("wordcloud by Python") # 步骤2: 加载词云文本
c.to_file("pywordcloud.png") # 步骤三: 输出词云文件

在这里插入图片描述
在这里插入图片描述

配置对象参数

w = wordcloud.WordCloud(<参数>)

参数描述
width指定词云对象生成图片的宽度,默认400像素 w=wordcloud.WordCloud(width=600)
height指定词云对象生成图片的高度,默认200像素 w=wordcloud.WordCloud(height=400)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

wordcloud应用实例

import wordcloud
txt = "life is short,you need python"
w = wordcloud.WordCloud(background_color="purple")
w.generate(txt)
w.to_file("pywcloud.png")

以空格分隔单词
在这里插入图片描述
中文需要先分词并组成空格分隔字符串

import wordcloud
import jieba
txt = "程序设计语言是计算机能够理解和\
识别用户操作意图的一种交互体系,它按照\
特定规则组织计算机指令,使计算机能够自\
动进行各种运算处理。"
w = wordcloud.WordCloud(width=1000,font_path="msyh.ttc",height=700)
w.generate(" ".join(jieba.lcut(txt)))
w.to_file("py.jpg")

在这里插入图片描述

实例: 政府工作报告词云

问题分析: 直观了解政策文件

  • 需求: 对于政府工作报告等政策文件,如何直观理解?
  • 体会直观的价值: 生成词云 & 优化词云

政府工作报告等文件 ⇒ 有效展示的词云
这个案例我们使用的材料:材料

思路:

  1. 读取文件,分词整理
  2. 设置并输出词云
  3. 观察结果,优化迭代

代码:

import jieba
import wordcloud
f = open("1.txt","r",encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(font_path="msy.ttc",width=1000,height=700,background_color="white")
w.generate(txt)
w.to_file("wordcloud.jpg")

在这里插入图片描述
还有一些其他更丰富的词云就自己探索叭!


http://www.kler.cn/a/395664.html

相关文章:

  • 鸿蒙next ui安全区域适配(刘海屏、摄像头挖空等)
  • TVBox 网络接口
  • 跟着尚硅谷学vue2—基础篇4.0
  • 干货分享之Python爬虫与代理
  • linux上海康SDK安装并设置环境变量
  • 卷积神经网络之Yolo详解
  • hbase未来的发展趋势
  • linux配置nginx
  • 【Homework】【6】Learning resources for DQ Robotics in MATLAB
  • Android Framework AMS面试题及参考答案
  • 借助Excel实现Word表格快速排序
  • ssh登陆服务器后支持Tab键命令补全
  • Python中的HTTP协议
  • Linux kernel 堆溢出利用方法(二)
  • 2024年11月15日Github流行趋势
  • GOLANG笔记第四周
  • 【回溯法】——单词搜索
  • Oracle 单机及 RAC 环境 归档模式及路径修改
  • Django 2024全栈开发指南(三):数据库模型与ORM操作(上篇)
  • 搜索,CF 1666L - Labyrinth
  • ui->tableView升序
  • 自动驾驶3D目标检测综述(二)
  • 安科瑞ARD2F智能型电动机保护器在某水泥厂的应用-安科瑞黄安南
  • 京东 2025届秋招 自然语言处理
  • 为以人工智能为中心的工作负载重新设计的全局控制台
  • 如何在C#中处理必盈接口返回的股票数据?