当前位置: 首页 > article >正文

Java编程中通用的正则表达式(二)

        正则表达式,又称正则式、规则表达式、正规表达式、正则模式或简称正则,是一种用来匹配字符串的工具。它是一种字符串模式的表示方法,可以用来检索、替换和验证文本。正则表达式是一个字符串,它描述了一些字符的组合,这些字符可以是字母、数字或者其他字符。在正则表达式中,我们可以使用特殊的语法和符号来表示某些字符或字符集合。正则表达式是一种强大且灵活的工具,可以在不同的编程语言和工具中使用,如Java、JavaScript、Python、Perl、PHP等。

1、匹配中文

        在Java中,可以使用Unicode范围来匹配中文字符。其中,汉字的Unicode编码范围为:[\u4e00-\u9fa5]。     

下面是一个例子,使用正则表达式判断一个字符串中是否包含中文字符:

String str = "Hello, 你好!";
String regex = "[\u4e00-\u9fa5]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
if (matcher.find()) {
    System.out.println("包含中文字符");
} else {
    System.out.println("不包含中文字符");
}

        输出结果为:"包含中文字符"。

2、匹配身份证

        以下是Java中使用正则表达式判断身份证号的代码:

import java.util.regex.Pattern;

public class Main {
    public static void main(String[] args) {
        String idCard = "110101199003073197"; // 身份证号码
        String regex = "\\d{17}[\\d|x]|\\d{15}"; // 正则表达式

        if (Pattern.matches(regex, idCard)) {
            System.out.println("身份证号码格式正确");
        } else {
            System.out.println("身份证号码格式不正确");
        }
    }
}

        这里使用了Java中的正则表达式类Pattern,使用matches方法判断字符串是否符合正则表达式。正则表达式\\d{17}[\\d|x]|\\d{15}表示身份证号码可以是18位(最后一位可能是数字或字母x)或者是15位。其中,\\d表示匹配数字,x表示字母x。

3、匹配IP地址

        要判断一个字符串是否为IP地址,可以使用Java中的正则表达式。下面是一个示例代码:

public static boolean isIpAddress(String input) {
    String pattern = "^\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}$";
    return input.matches(pattern);
}

        这个方法接收一个字符串参数,并返回一个布尔值。如果参数字符串满足IPv4地址格式,返回true;否则返回false。

        该正则表达式的含义是:以数字开头,由三个数字和一个点号组成的字符串重复四次。每个数字的范围为1到3位。点号需要转义。

例如,以下几个字符串都是合法的IPv4地址:

  • 192.168.0.1
  • 10.0.0.1
  • 172.16.0.1

而以下字符串不是IPv4地址:

  • 192.168.0.1000(其中1000超出了数字范围)
  • 10.0.0.01(前导零无效)

请注意,此方法只能判断IP地址的格式是否正确,而不能验证IP地址是否真正存在或是否可达。

4、屏蔽敏感词汇

        可以使用 Java 的正则表达式(Regular Expression)来过滤和替换文本中的特定字符或字符串。下面是一个示例代码,用于屏蔽敏感词汇:

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class RegexFilter {
    public static void main(String[] args) {
        String text = "你是一只小小鸟,飞呀飞不高,就算风雨无阻也要努力飞,因为你是小小鸟。";
        String[] sensitiveWords = {"小小鸟", "飞呀飞不高", "努力飞"};

        String patternString = String.join("|", sensitiveWords); // 构造正则表达式
        Pattern pattern = Pattern.compile(patternString); // 编译正则表达式
        Matcher matcher = pattern.matcher(text); // 匹配文本

        StringBuffer result = new StringBuffer(); // 用于存储过滤后的文本
        while (matcher.find()) {
            // 将匹配到的敏感词汇用"*"替换
            matcher.appendReplacement(result, "*".repeat(matcher.group().length()));
        }
        matcher.appendTail(result); // 将剩余文本添加到结果中

        System.out.println(result); // 输出结果(敏感词汇被屏蔽)
    }
}

在上面的代码中,可以通过修改 text 变量中的文本和 sensitiveWords 数组中的敏感词汇来测试不同的情况。另外,也可以调整正则表达式的构造方式和替换方式来实现更复杂的过滤和替换规则。

5、判断格式化时间

        在 Java 中,可以使用正则表达式来判断格式化时间是否符合指定的格式。下面是一个例子:

String regex = "\\d{4}-\\d{2}-\\d{2} \\d{2}:\\d{2}:\\d{2}";
String time = "2021-03-23 12:30:00";
if (time.matches(regex)) {
    System.out.println("时间格式正确");
} else {
    System.out.println("时间格式不正确");
}

上面的代码中,正则表达式 \\d{4}-\\d{2}-\\d{2} \\d{2}:\\d{2}:\\d{2} 表示匹配以四位数字开头,后面跟着 -,两位数字,再后面跟着 -,两位数字,再后面跟着空格,两位数字,再后面跟着 :,两位数字,再后面跟着 :,两位数字的字符串。如果时间字符串符合这个格式,就会输出 时间格式正确,否则输出 时间格式不正确


http://www.kler.cn/news/163041.html

相关文章:

  • idea__SpringBoot微服务05——JSR303校验(新注解)(新的依赖),配置文件优先级,多环境切换
  • Mysql 命令行导出SQL文件和导入文件
  • mybatisplus手动获取数据源执行非主数据库事务
  • sql行转列
  • java-两个列表进行比较,判断那些是需要新增的、删除的、和更新的
  • 线性回归与逻辑回归:深入解析机器学习的基石模型
  • LinuxBasicsForHackers笔记 -- 日志系统
  • AGM CPLD 应用指南
  • 《每天一个Linux命令》 -- (5)通过sshkey密钥登录服务器
  • Could not resolve all dependencies for configuration ‘:app:androidApis‘.
  • Amazon CodeWhisperer 开箱初体验
  • JAVA程序如何打jar和war问题解决
  • CentOS系统装机流程
  • 【场景测试用例】上传文件
  • 【数据开发】Hive 多表join中的条件过滤与指定分区
  • ReactNative性能优化实践
  • Azure云WAF服务的CRS规则和DRS规则区别
  • 大数据技术3:数据仓库的ETL和分层模型
  • vite配置nework访问ip
  • 电脑知识:关于电脑使用的误区
  • Linux查看openSSL版本
  • 24、文件上传漏洞——Apache文件解析漏洞
  • 【Python】 Python web开发库大全
  • 云贝教育 |【技术文章】PostgreSQL中误删除数据怎么办(一)
  • java:slf4j、log4j、log4j2、logback日志框架的区别与示例
  • 实例分割网络:Mask RCNN
  • IBM Qiskit量子机器学习速成(四)
  • pytorch中五种常用随机矩阵构造方法:rand、randn、randn_like、randint、randperm
  • CSS import 规则
  • 医院信息系统源码,采用JAVA编程,支持跨平台部署应用,满足一级综合医院(专科二级及以下医院500床)的日常业务应用