当前位置: 首页 > article >正文

【R语言】词云图

Gonewind词云图

library(tm)

library(wordcloud)



article <- tolower(readLines('D:/RWorkPlace/第3章_类别比较型图表/gonewind.txt', warn = FALSE))

article <- Corpus(VectorSource(article))

# 去除标点

article <- tm_map(article, content_transformer(tolower))

article <- tm_map(article, removePunctuation)

article <- tm_map(article, removeNumbers)

article <- tm_map(article, removeWords, stopwords("en"))  # 去除英文停用词

article <- tm_map(article, stripWhitespace)

wordcloud(words = article, min.freq = 5, scale = c(3, 0.5), colors = brewer.pal(8, "Dark2"))

Sanguo1词云图

library(tm)

library(wordcloud)

library(jiebaR)



# 读取中文文本文件

text <- readLines("D:/RWorkPlace/第3章_类别比较型图表/sanguo1.txt", encoding = "UTF-8")

# 将文本合并为一个字符串

text <- paste(text, collapse = " ")

# 使用jiebaR分词

engine<-worker()

segmented_text <- segment(text,engine)

# 创建语料库

corpus <- Corpus(VectorSource(segmented_text))

# 进行文本预处理

corpus <- tm_map(corpus, removePunctuation)

corpus <- tm_map(corpus, removeNumbers)

corpus <- tm_map(corpus, stripWhitespace)

# 将Corpus对象转换为数据框

corpus_df <- data.frame(text = sapply(corpus, as.character))

# 创建词云图

wordcloud(words = corpus_df$text, min.freq = 50, scale = c(3, 0.5), colors = brewer.pal(8, "Dark2"))

NEWS词云图

library(tm)

library(wordcloud)



article <- tolower(readLines('D:/RWorkPlace/第3章_类别比较型图表/NEWS.txt', warn = FALSE))

article <- Corpus(VectorSource(article))

# 去除标点

article <- tm_map(article, content_transformer(tolower))

article <- tm_map(article, removePunctuation)

article <- tm_map(article, removeNumbers)

article <- tm_map(article, removeWords, stopwords("en"))  # 去除英文停用词

article <- tm_map(article, stripWhitespace)

wordcloud(words = article, min.freq = 10, scale = c(3, 0.5), colors = brewer.pal(8, "Dark2"))

全唐诗词云图

library(tm)

library(wordcloud)

library(RColorBrewer)

library(openxlsx)

library(jiebaR)



# 导入xlsx文件

file_path <- "D:/RWorkPlace/第3章_类别比较型图表/全唐诗.xlsx"

data <- read.xlsx(file_path, detectDates = TRUE)

# 合并多列文本为一个文本向量

text <- paste(data$poet, data$title, data$poem, sep = " ")

# 使用jiebaR分词

engine<-worker()

segmented_text <- segment(text,engine)

# 创建语料库

corpus <- Corpus(VectorSource(segmented_text))

# 进行文本预处理

corpus <- tm_map(corpus, removePunctuation)

corpus <- tm_map(corpus, removeNumbers)

corpus <- tm_map(corpus, stripWhitespace)

# 将Corpus对象转换为数据框

corpus_df <- data.frame(text = sapply(corpus, as.character))

# 创建词云图

wordcloud(words = corpus_df$text, min.freq = 70, scale = c(3, 0.5), colors = brewer.pal(8, "Dark2"))


http://www.kler.cn/a/564291.html

相关文章:

  • 华为数通Datacom认证体系详解:从HCIA到HCIE的进阶路径
  • Ubuntu 下 nginx-1.24.0 源码分析 - ngx_init_cycle 函数 - 详解(3)
  • 北京大学DeepSeek提示词工程与落地场景(PDF无套路免费下载)
  • 【数据结构】链表的带环问题
  • Fiddler 的安装与使用
  • (python)Arrow库使时间处理变得更简单
  • pnpm的基本用法
  • 使用Google内核浏览器调试真机网页
  • Qt通过QPainter 绘制网格,以及滑动界面消除格子的方式来验证TP触摸屏的准确性
  • 计算机毕业设计Python+DeepSeek-R1大模型考研院校推荐系统 考研分数线预测 考研推荐系统 考研(源码+文档+PPT+讲解)
  • 四、表关系与复杂查询
  • 在已有的原生 App 里嵌入 Flutter 页面的方法
  • Redis源码剖析之GEO——Redis是如何高效检索地理位置的?
  • Unity探究预制体浮点数对Unity资源大小的影响
  • Spring MVC 程序开发(1)
  • Hadoop架构详解
  • 释放 Cursor 的全部潜能:快速生成智能 Cursor Rules
  • 16.6 LangChain LCEL 实战指南:从零构建生产级大模型应用
  • 手持云台32位单片机主控芯片
  • 反制无人机详细全面介绍