首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  HTML

请问有什么软件可以精简 html 代码?

  •  
  •   vtoexsir · 2017-11-03 22:09:03 +08:00 · 2648 次点击
    这是一个创建于 710 天前的主题,其中的信息可能已经有所发展或是发生改变。
    像这样的 html 代码:
    <p><span>[3]</span><span>殷明</span><span>.</span><span>关于线性代数教材结构教法及建设的思考</span><span>[J].</span><span>合肥工业大学学报:社会科学版,</span><span>2002</span><span>(</span><span>2</span><span>):</span><span>108-120.</span></p>

    可以精简为:
    <p>[3]殷明.关于线性代数教材结构教法及建设的思考[J].合肥工业大学学报:社会科学版,2002 ( 2 ):108-120.</p>

    请问有没有什么软件,可以批量精简 html 代码?
    10 回复  |  直到 2017-11-04 11:29:00 +08:00
        1
    cy97cool   2017-11-03 23:54:36 +08:00
    python 直接 replace("<span>","").replace("</span>","")可好?

    ![]( https://d.py3.io/img/bzszSrs2ZBhBiJ5E.png)
        2
    cy97cool   2017-11-03 23:57:30 +08:00
        3
    cy97cool   2017-11-03 23:58:09 +08:00
        4
    cy97cool   2017-11-03 23:59:07 +08:00
    你也许可以看看的做汤(误)教程 → https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/
        5
    isundust   2017-11-04 00:01:59 +08:00 via Android
    文本编辑器或者代码编辑器查找替换成 空(空格)
        6
    autoxbc   2017-11-04 00:21:34 +08:00
    如果就是例子代码那么简单,那正则就可以了

    如果结构稍微复杂一点,那写出的正则像天书一样。可以试试先把 html 解析成 dom,然后用标准的 dom 方法对其操作。虽然性能不佳,但是写出的东西简单易维护
        7
    xfspace   2017-11-04 00:30:22 +08:00 via Android
    Python HTMLParser
        8
    vtoexsir   2017-11-04 08:01:32 +08:00
    感谢各位回复!
    看来我没有说清楚,我举的例子,只是个例子,其实代码的各种情况都会有,修改的规则不是简单的替换 span 标签一种。
    修改 span 标签,是目测看出来的。还有其他许多情况,目视才能发现。
    我想使用软件,软件可以依据 html 的规则,自动发现这些需要修改的地方,自动修改。
        9
    hugee   2017-11-04 08:12:21 +08:00 via Android
    我猜 lz 是要采集
        10
    zangbob   2017-11-04 11:29:00 +08:00   ♥ 1
    软件的没有,在线工具倒是有一个能完美达成要求的:

    https://www.htmlwasher.com/
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4465 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 22ms · UTC 02:25 · PVG 10:25 · LAX 19:25 · JFK 22:25
    ♥ Do have faith in what you're doing.