整理网络下载的不规范文本,如何将段首长度无规律的空格替换成只留两个全角汉字空格的形式,段尾所有空格全部删除呢? 按照正常思路,也许你想到该用成批替换将所有半角空格替换为“无字符”,这样就去掉了所有段首段尾的空格;然后再将段首符号替换为两个全角空格。但是,如果文中有合法的半角空格(比如英文单词之间的空格、公式参数中的空格或其他用于分隔类的空格),那么,这样的替换将引起文章版式乱套。那么该如何正确替换呢?我们借助于具备特殊替换的文本编辑器EmEditor(也可以用EditPlus)来解决。 段首空格成批快速替换 用EmEditor打开要替换的TXT文档,鼠标点击将光标定位到文章最前面。执行Ctrl+H快捷命令,调出“替换”窗口,在复选框列表中,选中“使用正则表达式”一项,去掉“仅在选定范围内”一项。前者表示我们要构造搜索表达式来查找替换,后者表示我们要在全文中实现查找替换。 在“查找”文本框中输入一个半角符号“^”和半角空格,紧接着在输入一个半角“*”号,构成查找正则表达式“^ *”。该表达式的意思是查找段首的空格串,不管该空格串中包含多少连续半角空格。在“替换为”文本框中输入两个全角空格(图1),输入方法为将输入法的全角半角状态符号切换为全月形(图2),然后按两次空格键。
01
02 点击“全部替换”按钮,完成全文段首空格字符的替换。如图3为替换前后的文章版式。
03 段尾空格一次自动删除 在“替换”窗口的“查找”文本框中输入一个半角空格和一个半角“*”号,紧接着再输入半角符号$构成查找正则表达式“ *$”。该表达式的意思是查找段尾的空格串,不管该空格串中包含多少连续半角空格。在“替换为”文本框中不输入任何内容。
04 点击“全部替换”按钮,完成全文段首空格字符的替换。如图5为段尾替换前后的版式情况对比。
05 小提示: 第一个查找框中用到正则表达式“^ *”,其中第一个字符^表示从一行的开始匹配,第三个字符*表示其左边的字符被匹配任意次,而本例其左边字符是半角空格。在第二个查找框中用到正则表达式“ *$”,其中半角空格加*号表示匹配任意个半角空格,最后一个字符$表示匹配到一行的结尾结束。 |