今儿个跟大家伙儿唠唠,我是咋整那个“新JAVAWEB乱HTML少妇”的。说白,就是用Java那套玩意儿,把一堆乱糟糟的HTML代码给弄顺溜。
我这不是接个活儿嘛客户那边给一堆HTML,说是从哪儿爬来的,乱得跟啥似的,还有一堆烦人的标签,非得让我整干净。我想,这活儿简单,网上这种教程不是一抓一大把嘛什么JavaWeb基础入门全套,什么JavaWeb基础入门全套的,还有程序员编程视频教学,我就随便找两个,开始学习起来,一个JavaWeb教程:第04讲,一个叫【Java教程】Java Web实战成品:第53讲,一边学一边就写开。
我先琢磨着,这Java不是有个啥JDBC的,能连数据库啥的嘛说不定能用上。然后,我还看看啥Tomcat、Linux、Ngnix这些,都是JavaWeb里的东西,我也顺带都学一遍。心里想着,技多不压身嘛以后万一用上?
- 先用那个啥库,把HTML给读进来。
- 然后,就是一顿操作猛如虎,把那些没用的HTML标签啥的,全给它扬。
- 再把收拾干净的内容,重新写回去。
过程还算顺利,毕竟咱也不是第一天写代码。不过中间也遇到一些小坑。
乱七八糟的编码问题
我没注意到编码问题,结果弄出来的东西,全是些啥玩意儿,一堆问号,看着就脑瓜子疼。后来我才想起来,这编码得统一,不然Java那玩意儿它不认。我就把所有的编码都设置成UTF-8,这下总算看着顺眼。
去标签的苦恼
然后就是去标签,这玩意儿,说起来简单,做起来还是有点烦的。有些标签,它还套着别的标签,一层套一层的,跟俄罗斯套娃似的。我就写个循环,一层一层地给它扒干净。总算是把所有的标签都给扬,只剩下干干净净的文字,看着舒坦多,客户那边也挺满意的。这事儿就这么结,我也收到应得的劳动成果!这活儿不难,就是有点费事儿。不过通过这事儿,我也算是把JavaWeb那套东西又熟悉一遍,也算是没白忙活。等下次有类似的需求,我处理起来肯定更快!
免责声明:由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,深感抱歉,我们会做删除处理。