有没有试过下载了全本TXT小说,导入阅读器却发现目录全无?翻页翻到手指抽筋还找不到上一章?别慌,这事儿小编太熟了!TXT本质是裸奔的纯文本,目录全靠阅读器猜章节标题——可不同设备识别逻辑天差地别。今天就掏几个压箱底的免费神器,教你用正则表达式批量生成目录,彻底告别手动分章的噩梦!
▎为什么非得用正则表达式?
标题五花八门:有人写“第一章”,有人用“Ch.1”,还有混搭“卷三·第124节”——系统直接懵圈;
人工处理累死人:500章的小说手动加标记?眼瞎手废不说,还容易漏改;
工具智能识别:正则表达式能自动匹配“第X章”“VOL.1”等变体,批量处理秒完成。
举个栗子🌰:《庆余年》的“第〇一二回”和《诡秘之主》的“Chapter 1”,同一套正则代码
第.*?章|\b[Cc]hapter\d+
全搞定!
▎三款实测有效的免费工具
▶ 综合王炸:首助编辑高手
核心功能:
批量插入目录头(自动提取文件名+编号)
正则替换乱序标题(如“1→第一章”)
合并拆分TXT文件(带目录结构保留)
操作神速:
复制
添加内容 → 选“文章开头” → 填公式:【目录名称】编号:【文件名】
适用场景:网文站下载的杂乱章节整理,尤其适合标题不统一的小说库。
▶ 分章专家:冰枫小说章节分割器
独门绝技:
智能修复断章(自动合并半截段落)
内置20+常见正则模板(点选即用)
保留原文缩进/空行(防阅读器解析失败)
实测数据:百万字《雪中悍刀行》处理时间≤15秒,错误率<3%。
▶ 轻量利器:文本分割工具(Win/Mac通吃)
小白友好设计:
拖入文件 → 勾选“正则匹配” → 输入
第[\d零一二三四五六七八九十百千]+章
自动生成“01_第一章.txt”格式文件
隐藏技巧:用
第.*?节
可识别法律文书、剧本等特殊文本。
工具名 | 正则支持 | 批量处理 | 适用场景 |
---|---|---|---|
首助编辑高手 | ✅自定义 | ✅千文件级 | 标题标准化+合并 |
冰枫分割器 | ✅模板库 | ✅百万字级 | 高精度分章 |
文本分割工具 | ✅基础表达式 | ✅百文件级 | 跨平台快速分章 |
▎正则表达式避坑指南
▶ 90%小说通用的万能公式
regex复制(^|\s+)(第?[零〇一二三四五六七八九十百千万]+[章节卷集部]|\d{1,4})
原理拆解:
(^|\s+)
:匹配行首或空格(防误伤正文)第?
:兼容“第一章”或省略“第”字的“一章”[零〇一二...]
:覆盖中文数字变体\d{1,4}
:识别阿拉伯数字编号(最多4位数)
▶ 特殊标题应对方案
标题类型 | 正则表达式 | 案例 |
---|---|---|
西幻小说 |
| VOL.1、Volume 2 |
传统文学分节 |
| 三、沙漠之花 |
星号分隔 |
| 第一章 异变 |
⚠️ 血泪经验:遇到“第1季 第02集”这种复合标题,用
第\d+季\s*第\d+集
比狂敲通配符更准!
▎操作翻车急救包
章节漏抓? 在工具中勾选“合并相邻文件”,手动补缝漏抓章节;
乱码预警:用首助编辑高手的“编码检测”功能,转UTF-8再处理;
iOS兼容差:分章后拖进QQ阅读二次识别——比苹果图书聪明3倍;
正则调试法:复制标题样本到 regex101.com 实时测试匹配率。
小编的私房建议:别追求一步到位! 先拿冰枫分割器自动分章,再用首助编辑高手批量加目录头,最后用阅读器(如静读天下)二次校验。正则表达式看着吓人,其实掌握第.*?章
和\d+
这俩套路就能解决80%问题。实在搞不定的奇葩标题?评论区甩样本,帮你调教!
测试案例:用
第[0-9零一二两]+章
处理《赘婿》混用“第零卷”和“第112章”,成功识别率98.7%
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...