netcore ToolGood.Words 敏感词检测

ToolGood.Words

ToolGood.Words 是一个基于 C# 实现的高性能非法词(敏感词)检测组件,具备以下核心功能:

• 敏感词过滤(支持通配符)

• 繁体/简体互换

• 全角/半角互换

• 获取拼音(全拼、首字母)

• 拼音模糊匹配

• 数字与中文大写转换在 48k 敏感词库下,使用 StringSearchEx2.Replace 进行过滤,速度可超过 3 亿字符/秒(测试环境:i7-8750H CPU)。

非法词(敏感词)检测类类名特点

StringSearch / StringSearchEx / StringSearchEx2返回 string 类型结果

WordsSearch / WordsSearchEx / WordsSearchEx2返回 WordsSearchResult 类型,包含位置、序号等信息

IllegalWordsSearch专为非法词过滤设计,支持跳词、黑名单、忽略大小写等高级功能

常用方法

• SetKeywords:设置敏感词库

• ContainsAny:判断是否包含敏感词

• FindFirst:查找第一个敏感词

• FindAll:查找所有敏感词

• Replace:替换敏感词为指定字符

var iwords = new StringSearch();
iwords.SetKeywords("中国|国人|zg人".Split('|'));

bool contains = iwords.ContainsAny("我是中国人"); // true
string replaced = iwords.Replace("我是中国人", '*'); // "我是***"

作者:spike

分类: Net

创作时间:2025-10-19

更新时间:2025-10-20

联系方式放在中括号之中例如[[email protected]],回复评论在开头加上标号例如:#1