正则表达式删除指定的html标签-范文、应用文-IT技术专栏-网页制作-考试资料-在线学习网

网站首页汉语字词英语词汇考试资料写作素材旧版资料

标题	正则表达式删除指定的html标签
内容	抓取某网页的数据后(比如描述),如果照原样显示的话,可能会因为它里面包含没有闭合的html标签而打乱了格式,也可能它里面用了比较让人费解的html标签,把预订的格式搅乱. 如果全盘删除里面的 html 标签,可能会造成阅读上的困难(比如 a, img 这些标签), 最好是删除一部分,保留一部分. 正则表达式里,判断包含某些字符串是非常容易理解的,但是如何判断不包含某些字符串 (是字符串,不是字符,是某些,不是某个) 确实是个费解的事. <(?!((/?s?li)\|(/?s?ul)\|(/?s?a)\|(/?s?img)\|(/?s?br)\|(/?s?span)\|(/?s?b)))[^>]+> 这个正则是判断html标签不包含 li / ul / a / img / br / span / b 的,就上面的要求来说,是要删除除这里列出的html标签,这也是我摸索了很长时间才搞出来的. (?!exp) 匹配后面跟的不是exp的位置 /?s? 我一开始试着把它写到最前面的 < 后面,但是测试失败了. 下面是一个简单的函数,把要保留的tag串起来,生成一个正则表达式,然后把不需要的tag删除... private static string removespecifyhtml(string ctx) { string[] holdtags = { a, img, br, strong, b, span };//要保留的 tag // <(?!((/?s?li)\|(/?s?ul)\|(/?s?a)\|(/?s?img)\|(/?s?br)\|(/?s?span)\|(/?s?b)))[^>]+> string regstr = string.format(@<(?!((/?s?{0})))[^>]+>, string.join(@)\|(/?s?, holdtags)); regex reg = new regex(regstr, regexoptions.compiled \| regexoptions.multiline \| regexoptions.ignorecase); return reg.replace(ctx, ); } ---------------------------- 修正: 上面的正则,如果保留了 li , 实际运行会发现 link 也给保留下来了, 保留 a 会把 addr 也给保留下来, 解决办法就是加 b 断言. <(?!((/?s?lib)\|(/?s?ul)\|(/?s?ab)\|(/?s?imgb)\|(/?s?brb)\|(/?s?spanb)\|(/?s?bb)))[^>]+> private static string removespecifyhtml(string ctx) { string[] holdtags = { a, img, br, strong, b, span, li };//保留的 tag // <(?!((/?s?lib)\|(/?s?ulb)\|(/?s?ab)\|(/?s?imgb)\|(/?s?brb)\|(/?s?spanb)\|(/?s?bb)))[^>]+> string regstr = string.format(@<(?!((/?s?{0})))[^>]+>, string.join(@b)\|(/?s?, holdtags)); regex reg = new regex(regstr, regexoptions.compiled \| regexoptions.multiline \| regexoptions.ignorecase); return reg.replace(ctx, ); }
随便看	毕节市金沙县2016年招聘医疗卫生事业单位急需专业技术人员公告(第六号) 2016年招聘中山大学总务处管理人员启事雅安市雨城区2016年考试招聘综合类事业人员总成绩及体检公告 2016年杭州市桐庐县市场监管局合同制工作人员招聘录用结果公告 2016年泸州市古蔺县司法局招聘乡镇司法协理员公告湖南省科技厅直属事业单位省产业技术协同创新院招聘调整招聘条件并延长报名时间的公告泸州市古蔺县2016年上半年事业单位考试招聘工作人员申请政策性加分人员公示 2016年泸州市政府投资建设工程管理第一中心等3个单位拟聘用黄建/房立荣/李俊菊三名同志公示遵义市凤冈县文化馆2016年招聘人员简章泸州市纳溪区2016年上半年事业单位考试招聘工作人员加分公示广东外语外贸大学2016年第一批招聘事业编制工作人员拟聘人员公示 2016年杭州市淳安县供销合作总社招聘工作人员公告毕节市金沙县煤矿安全生产监督管理局2016年招聘工作人员公告(第六号) 北京电影学院2016年人才招聘拟聘人员公示名单南充职业技术学院2016年招聘工作人员体检公告毕节市金沙县2016年招聘医疗卫生事业单位急需专业技术人员岗位调整表安顺市施秉县2016县直事业单位招聘及乡镇业单位专项招聘工作人员笔试成绩公示黔西南州州国防教育办公室2016年招聘事业单位工勤人员拟进入面试/技能测试人员名单及有关事宜公告 2016年东营市道路运输管理处招聘工作人员简章绵阳市文化广电新闻出版局2016年直接考核招聘工作人员公告 2016年佛山市顺德区社会创新中心招聘公告贵阳市公共资源交易中心2016年招聘派遣员工考试成绩公布普洱市2016年事业单位招聘截止5月24日10时报名情况 2016年益阳市赫山区事业单位招聘工作人员公告绵阳市文化馆2016年直接考核招聘专业技术人员岗位和条件览表(2016年5月) rain-shower rain (something) down rain something off rain something out rain squall rain (sth) down rain-sth-down rain sth off rain-sth-off rainstorm 坐冷房子坐冷板凳坐力坐功坐化坐卧不宁坐卧不安坐卧不离坐受坐吃人教版初二英语知识点汇总初二上学期英语期末试卷免费八年级上册英语知识点最新八年级上册英语期末考试卷及答案初二上学期英语语法汇总八年级上册英语第二单元测试卷及答案八年级上册英语Units1-10单元知识点归纳初中八年级英语语法知识点整理初中英语八年级下册(冀教版)电子课本八年级上册英语期末试卷及答案

在线学习网考试资料包含高考、自考、专升本考试、人事考试、公务员考试、大学生村官考试、特岗教师招聘考试、事业单位招聘考试、企业人才招聘、银行招聘、教师招聘、农村信用社招聘、各类资格证书考试等各类考试资料。