加入收藏 | 设为首页 | 会员中心 | 我要投稿 聊城站长网 (https://www.0635zz.com/)- 智能语音交互、行业智能、AI应用、云计算、5G!
当前位置: 首页 > 站长学院 > Asp教程 > 正文

asp 运用正则表达式替换word中的标签,转为纯文本

发布时间:2023-06-10 13:13:33 所属栏目:Asp教程 来源:
导读:asp里使用正则表达式清除后台编辑器里复制粘贴内容的word格式,将其转换成纯文本

公司客户在使用网站后台编辑添加修改内容时,经常是直接从word文档里复制内容到编辑器里后就提交。结果是在内容显示页面上是五花
asp里使用正则表达式清除后台编辑器里复制粘贴内容的word格式,将其转换成纯文本
 
公司客户在使用网站后台编辑添加修改内容时,经常是直接从word文档里复制内容到编辑器里后就提交。结果是在内容显示页面上是五花八门的样式,有时也需要部分纯文本内容作为摘录使用,这些都需要清除word格式。改变客户的习惯要客户先复制到记事本里再粘贴到编辑器里编辑是很难的,所以从我们自己改变起。从网上百度了若干清除word格式的正则,使用效果不甚理想,所以自己写了清除word格式的asp函数,能满足我们自己的使用需求。函数如下:
 
复制代码代码如下:
 
function cleanWord(html)
 
dim regEx
 
set regEx=New RegExp
 
regEx.IgnoreCase=True
 
regEx.Global=True
 
regEx.Pattern="<[^>]*>" '清除所有<>之间的内容
 
html = regEx.replace(html,"" )
 
regEx.Pattern="{[^}]*}" '清除所有{}之间的内容
 
html = regEx.replace(html,"" )
 
regEx.Pattern="/[^/]*/" '清除所有/**/之间的注释
 
html = regEx.replace(html,"" )
 
html =Replace(html,"table.MsoNormalTable","") '替换掉漏网的单词
 
cleanWord= html
 
set regEx=nothing
 
end function
 
 

(编辑:聊城站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章