7*24小时应急电话:15927160396
首页 新闻资讯 技术文章
asp里使用正则表达式清除后台编辑器里复制粘贴内容的word格式转换成纯文本(原创)

    公司客户在使用网站后台编辑添加修改内容时,经常是直接从word文档里复制内容到编辑器里后就提交。结果是在内容显示页面上是五花八门的样式,有时也需要部分纯文本内容作为摘录使用,这些都需要清除word格式。改变客户的习惯要客户先复制到记事本里再粘贴到编辑器里编辑是很难的,所以从我们自己改变起。从网上百度了若干清除word格式的正则,使用效果不甚理想,所以自己写了清除word格式的asp函数,能满足我们自己的使用需求。函数如下:

function cleanWord(html)
    dim regEx
    set regEx=New RegExp
    regEx.IgnoreCase=True
    regEx.Global=True
    regEx.Pattern="<[^>]*>"                    '清除所有<>之间的内容
    html = regEx.replace(html,"" )
    regEx.Pattern="{[^}]*}"                     '清除所有{}之间的内容
    html = regEx.replace(html,"" )
    regEx.Pattern="/[^/]*/"                       '清除所有/**/之间的注释
    html = regEx.replace(html,"" )
    html =Replace(html,"table.MsoNormalTable","")        '替换掉漏网的单词
    cleanWord= html
    set regEx=nothing
end function

版权所有:武汉网福互联科技有限公司    鄂ICP备09022096号
业务QQ:23444550 客服QQ:267052100 电邮:23444550@qq.com  

鄂公网安备 42010602000905号

手机站二维码