当前位置: 首页 > article >正文

Scala全文单词统计

一:方法

package test5
import java.io.PrintWriter
import scala.io.Source
//可变的Map
import scala.collection.mutable
object test5_1 {
  def main(args: Array[String]): Unit = {
//1.读入文件
    val content = Source.fromFile("1.txt").mkString
//    println(content)

    //2.拆分字符串-->单词数组
//    val rs = content.split(",")正则表达式
//    W:表示非字符(,空格,?...)
//    W+:多个非字符
    val rs = content.split("\\w+")
//    println("-"*40)
//    rs.foreach(println)

    //3.统计出现的频率
    val wordsMap = mutable.Map[String,Int]()
    rs.foreach(w => {
      val word = w.toLowerCase()//全小写
      //是否出现
      if(wordsMap.contains(word)){
        wordsMap(word)+=1
      }else{
        wordsMap(word) = 1
      }
    })
    //4.根据出现的次数从高到低排序
    //Map不能直接排序,需要转成有序的集合
    val orderList = wordsMap.toList.sortWith((a,b)=>a._2>b._2)
    //输出Map

    //5.保存结果,涉及到写入文件
    val writer = new PrintWriter("output.txt")

    for (e<- orderList){
      println(e._1,e._2)
      writer.println(s"${e._1}:${e._2}次")

    }
    writer.close()//关闭
  }
}


http://www.kler.cn/a/409109.html

相关文章:

  • ES 基本使用与二次封装
  • 【MyBatis】全局配置文件—mybatis.xml 创建xml模板
  • flatter算法详解
  • 无线电磁波在自由空间的衰减
  • 「Mac玩转仓颉内测版32」基础篇12 - Cangjie中的变量操作与类型管理
  • CPU命名那些事
  • 【TEST】Apache JMeter + Influxdb + Grafana
  • 小程序25- iconfont 字体图标的使用
  • mfc100u.dll是什么?分享几种mfc100u.dll丢失的解决方法
  • Vue——响应式数据,v-on,v-bind,v-if,v-for(内含项目实战)
  • 周末总结(2024/11/24)
  • HTMLCSS:3D金字塔加载动画
  • MySQL 主从复制之多线程复制
  • 【数据结构】【线性表】一文讲完队列(附C语言源码)
  • el-table的树形结构后端返回的id没有唯一键怎么办
  • Java中的CAS
  • elasticsearch的文档管理
  • MySQL原理简介—12.MySQL主从同步
  • 计算机网络复习笔记(湖科大教书匠)
  • Qt案例 滥用[Qt::BlockingQueuedConnection]队列链接导致出现程序死锁Bug的问题
  • JavaWeb开发:HTML 页面与接口对接
  • 基于Java Springboot工厂生产设备维护管理系统
  • Facebook商城号封号的原因是什么?
  • 数据集-目标检测系列- 花卉 玫瑰 检测数据集 rose >> DataBall
  • C/C++ 每日一练:实现字符串的大小写转换
  • unity3d————基础篇小项目(设置界面)