如何正则匹配乱码?(正则匹配结果)
itomcoil 2025-03-20 15:42 9 浏览
曾经护网的时候,遇到过要写一个正则,匹配文本中包含乱码,当时精神状态比较紧张,没有写出来,事后感觉非常尴尬,不过现在已经释然了,趁着周末休息的时候,简单研究了一下,以防未来还会遇到同样的问题,测试样例如下,包含:中文、英文、韩文、日文、中文标点符号、英文标点符号,以及乱码。
(中文)(yen)(abc+-*/)()(小さな日本)()(中文)(yen)(+-*/)()(小さな日本)
ailx10
网络安全优秀回答者
网络安全硕士
去咨询
正则表达式[ -~]+,可以匹配所有的可打印的ASCII码字符,但是不能匹配中文、中文标点符号以及乱码。
正则表达式[^ -~]+,可以匹配所有中文、中文标点符号以及乱码,也能匹配日文、韩文。
正则表达式[\u4e00-\u9fa5]+,可以匹配所有的中文。
正则表达式[\u3002\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\ufe43\ufe44\u3014\u3015\u2026\u2014\uff5e\ufe4f\uffe5\u00a5]+,可以匹配所有的中文标点符号。
正则表达式[\u2E80-\u2FDF\u3040-\u318F\u31A0-\u31BF\u31F0-\u31FF\u3400-\u4DB5\u4E00-\u9FFF\uA960-\uA97F\uAC00-\uD7FF]+ ,可以匹配所有的中日韩文,但是不包含标点符号。
所以,初略的构建一个匹配乱码的正则表达式如下:
[^ -~\u2E80-\u2FDF\u3040-\u318F\u31A0-\u31BF\u31F0-\u31FF\u3400-\u4DB5\u4E00-\u9FFF\uA960-\uA97F\uAC00-\uD7FF\u3002\u00a5\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\ufe43\ufe44\u3014\u3015\u2026\u2014\uff5e\ufe4f\uffe5\u00a5]+
测试如下,效果良好:
如果想要匹配乱码之后的所有文本,可以使用如下正则表达式:
[^ -~\u2E80-\u2FDF\u3040-\u318F\u31A0-\u31BF\u31F0-\u31FF\u3400-\u4DB5\u4E00-\u9FFF\uA960-\uA97F\uAC00-\uD7FF\u3002\u00a5\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\ufe43\ufe44\u3014\u3015\u2026\u2014\uff5e\ufe4f\uffe5]+.*
如果想要匹配包含乱码的整个文本,可以使用如下正则表达式:
[ -~\u2E80-\u2FDF\u3040-\u318F\u31A0-\u31BF\u31F0-\u31FF\u3400-\u4DB5\u4E00-\u9FFF\uA960-\uA97F\uAC00-\uD7FF\u3002\u00a5\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\ufe43\ufe44\u3014\u3015\u2026\u2014\uff5e\ufe4f\uffe5]*[^ -~\u2E80-\u2FDF\u3040-\u318F\u31A0-\u31BF\u31F0-\u31FF\u3400-\u4DB5\u4E00-\u9FFF\uA960-\uA97F\uAC00-\uD7FF\u3002\u00a5\uff1f\uff01\uff0c\u3001\uff1b\uff1a\u201c\u201d\u2018\u2019\uff08\uff09\u300a\u300b\u3008\u3009\u3010\u3011\u300e\u300f\u300c\u300d\ufe43\ufe44\u3014\u3015\u2026\u2014\uff5e\ufe4f\uffe5]+.*
如果文本中不存在乱码,则测试不通过
网络安全任重道远,
发布于 2022-08-06 20:17
相关推荐
- 外婆都能学会的Python教程(二十六):Python中的函数式编程
-
前言Python是一个非常容易上手的编程语言,它的语法简单,而且功能强大,非常适合初学者学习,它的语法规则非常简单,只要按照规则写出代码,Python解释器就可以执行。下面是Python的入门教程介绍...
- [编程基础] Python lambda函数总结
-
Pythonlambda函数教程展示了如何在Python中创建匿名函数。Python中的匿名函数是使用lambda关键字创建的。文章目录1介绍1.1简单使用1.2Pythonlambda与m...
- 一文掌握Python中列表推导和 Lambda 函数
-
嵌套列表推导与嵌套列表推导式一起工作:matrix=[[jforjinrange(5)]foriinrange(3)]print(matrix)#Createsa3x5...
- python中函数详解和实践
-
少看美女多学习来吧客观:1.函数定义使用def关键字定义函数:deffunction_name(parameters):"""函数文档字符串""&...
- Python基础编程20例之七:filter过滤,筛选奇数
-
20230115星期日:list_value=[1,2,3,4,5,6,7,8,9]defis_qishu(n):ifn%2==1:returnTrue...
- Python 匿名函数Lambda的9种用法
-
简单的lambda函数x=1f=lambdax:x+1print(f(1))这个简单的lambda函数接受一个参数x,并返回x+1的结果。将lambda函数赋值给变量ad...
- python匿名函数lambda的语法特点和应用场景
-
在Python的编程过程中,有时我们会碰到一些很简单的计算,但是感觉专门为这个计算创建个函数又觉得太小题大做,这时就可以用到lambda表达式。lambda是用于创建匿名函数,也就是没有具体名称的函...
- python组合函数不允许你还不会的 10 个高效技巧
-
以下是Python中组合函数的10个高效技巧,涵盖函数串联、柯里化、装饰器链式调用等场景,助你构建灵活的数据处理流水线:一、基础组合技巧1.函数管道(Pipeline)defadd(x):...
- 刘心向学(21)Python中的迭代器与内置函数
-
分享兴趣,传播快乐,增长见闻,留下美好!亲爱的您,这里是LearningYard新学苑。今天小编为大家带来文章“刘心向学(21)Python中的迭代器与内置函数”欢迎您的访问。Share...
- Python之函数式编程:funcy,功能更加齐全的函数式编程库
-
引言通过前面的关于Python中进行函数式编程的系列文章的介绍,我们已经把函数式编程范式中的相关特性,以及Python内置的类、functools模块对函数式编程范式的支持,都介绍了一遍。今天这篇文章...
- Python高级编程技巧:深入理解函数式编程
-
引言Python是一种多范式编程语言,支持面向对象、命令式、以及函数式编程等多种编程范式。函数式编程以其简洁、高效和易于并行处理的特点,在处理大规模数据和复杂逻辑时显示出独特的优势。本文将深入探讨Py...
- Python中级篇~函数式编程的概念和原则(匿名函数和高阶函数)
-
Python的函数式编程是一种编程范式,它是基于数学中的函数概念而产生的。在函数式编程中,函数被看作是一等公民,可以像变量一样被传递和操作。函数式编程具有很多优点,包括代码的可读性、可维护性和可扩展性...
- Python函数中几个特殊又很有用的函数,一定要搞明白函数式编程
-
带你走进@机器人时代Discover点击上面蓝色文字,关注我们Python函数提供了一种表单简单的函数的方式,成为lambda表达式,我们来看看下面的例子:#常规函数写法defy(m,n)...
- Python匿名函数详解:从概念到实践
-
一、什么是匿名函数?在Python中,匿名函数(AnonymousFunction)是一种不需要显式命名的函数,通常用lambda关键字定义。与使用def定义的普通函数相比,匿名函数更简洁,适合定义...
- Python 函数进阶的10大技巧,不允许你还不会
-
函数是Python编程的核心构建块,掌握高级函数技巧可以显著提升代码质量和开发效率。以下是Python函数编程的进阶技巧:1.函数参数高级用法1.1灵活的参数处理#位置参数、默认参数、可变参数...
- 一周热门
- 最近发表
- 标签列表
-
- ps图案在哪里 (33)
- super().__init__ (33)
- python 获取日期 (34)
- 0xa (36)
- super().__init__()详解 (33)
- python安装包在哪里找 (33)
- linux查看python版本信息 (35)
- python怎么改成中文 (35)
- php文件怎么在浏览器运行 (33)
- eval在python中的意思 (33)
- python安装opencv库 (35)
- python div (34)
- sticky css (33)
- python中random.randint()函数 (34)
- python去掉字符串中的指定字符 (33)
- python入门经典100题 (34)
- anaconda安装路径 (34)
- yield和return的区别 (33)
- 1到10的阶乘之和是多少 (35)
- python安装sklearn库 (33)
- dom和bom区别 (33)
- js 替换指定位置的字符 (33)
- python判断元素是否存在 (33)
- sorted key (33)
- shutil.copy() (33)