首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
V2EX  ›  Linux

200 元帮写个文本处理小脚本

  •  
  •   VKMEPR · 37 天前 · 4980 次点击
    这是一个创建于 37 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有个文本需要转换为表格文件,有朋友可以帮忙写个处理脚本吗?用 shell、awk、python 都可以,熟悉这些语言的应该很容易,酬谢 200 元。

    可以帮忙的麻烦留个联系方式,谢谢。

    第 1 条附言  ·  37 天前
    抱歉,刚才没时间来得及编辑需求,现在补上。

    需要转换的数据源是一个 yml 文件,里面储存了多个软件的历史版本,其内容格式如下:

    <pre>- pgdlzv:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test
    - pgdlzv_beta_ver:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test
    - pgdlzv_alpha_ver:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test
    - bdlxri:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test
    - bdlxri_beta_ver:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test
    - bdlxri_alpha_ver:
    V1.0.1: http://lg.la.ramnode.com/static/100MB.test
    V1.0.2: http://lg.la.ramnode.com/static/1000MB.test</pre>

    上面摘录了一小部分,实际上还有很多内容(格式相同),需要将其转换为 HTML 表格代码,并分别输出到文件。

    譬如 pgdlzv、pgdlzv_beta_ver、pgdlzv_alpha_ver 输出到同一文件(文件名为 pgdlzv,也就是开头相同的部分)。

    表格格式如下图:

    https://i.loli.net/2019/10/06/Y7I3lhV1o8DcF5z.png

    表格里各项数据获取来源说明:

    “文件时间”:可使用 curl -I 获取链接文件的 Last-Modified
    “软件版本”:取自源文件里的版本号
    “软件类型”:取自源文件里的段落第一行字符串,不过这里要做个替换,比如 pgdlzv 替换为 Release version,pgdlzv_beta_ver 替换为 Beta version,pgdlzv_alpha_ver 替换为 Alpha version
    “文件下载”:取自源文件里的下载链接,加一个 <a> 超链接
    “文件大小”:可使用 curl -I 获取链接文件的 Content-Length
    第 2 条附言  ·  37 天前
    <pre>标签编辑器没能识别,请忽略。
    32 回复  |  直到 2019-10-26 17:25:00 +08:00
        1
    navigaid   37 天前
        2
    whwq2012   37 天前 via iPad
    也许用 excel 自带的一些功能都能完成,你能发个例子吗
        3
    rebackhua   37 天前
    转 csv 就差不多了,shell 比较快
        4
    zhzbql   37 天前
        5
    ant2017   37 天前 via Android
    MTA2MzQ2NjkwOQ==
        6
    Litecoins   37 天前 via iPhone
    MjQ3MzMzNDE3QHFxLmNvbQ==
        7
    lspvic   37 天前 via Android
    这你们也抢,让 1L 来
        8
    blue2008   37 天前
    样本和需求麻烦发我一下,不用给钱。
    急用找楼上几位大神,我只是比较好奇,找点事情做做。谢谢。
    邮箱 YWRtaW5AYmx1ZW5vb2IuY29t
        9
    aaniao002   37 天前 via Android
    把题目发出来,说不定答案就会显示了。
        10
    coderluan   37 天前
    200 块钱就别搞单独联系了,你把需求发出来,想做的把代码发出来,谁先完成你钱发谁。
        11
    artandlol   37 天前 via Android
    需求发出来,给你最佳答案还免费
        12
    akatquas   37 天前 via iPhone
    哈哈哈哈楼上几个,
        13
    VKMEPR   37 天前
    @navigaid
    @whwq2012
    @zhzbql
    @ant2017
    @Litecoins
    @blue2008
    @aaniao002
    @coderluan
    @artandlol
    抱歉,刚才没时间来得及编辑需求,现在补上了。如果可以实现,麻烦 @下我。转换表格主要是方便朋友之间查阅之用,也是公益性质的,所以只能发 200 意思一下,这里的大佬们见谅哈~
        14
    bequt   37 天前 via Android
    我也是来做题的
        15
    artandlol   37 天前 via Android
    http://convertcsv.com/yaml-to-csv.htm 先转成 excel,再一顿猛操作,再导出成 HTML 或者把 csv 内嵌到 HTML
        16
    dunn   37 天前 via iPhone
    哈哈。楼上几位笑死我了
    保证按时完成。 做完还倒贴十块钱
    手动滑稽。开玩笑
        17
    cdlixucd   37 天前 via Android
    钱少不开工 这句话没听过吗😄
        18
    navigaid   37 天前
    @VKMEPR 这个简单,可以做。微信就是我 id,注明一下来自 v2
        19
    v2zyx   37 天前 via Android
    贿赂 300 块,选我选我😌😌
        20
    zbinlin   37 天前
    如果真的是公益性质的,可以找我,免费~
        21
    autogen   37 天前
    这个太简单了
        22
    navigaid   37 天前
    已经搞定了,完整的 YAML 发我吧,@VKMEPR
        23
    navigaid   37 天前
    我这里没拆成多个文件,网页是用 pandoc 从 markdown 表格生成的,样式在单独的 CSS 里,细节上的出入后续都可以再改,分分钟的事情 @VKMEPR
        24
    VKMEPR   37 天前
    @navigaid WX 搜索不到用户名?
        25
    yoshiyuki   37 天前
        26
    VKMEPR   37 天前
    @yoshiyuki 额,编辑器忽略了,有带 4 个空格缩进。
        27
    navigaid   37 天前
    @VKMEPR 现在可以了
        28
    navigaid   37 天前
    @VKMEPR 你再试试
        29
    kajweb   36 天前
    https://github.com/kajweb/outsourcing-200-v2ex-script 搞定,虽然可能拿不到钱。哈哈哈
        30
    VKMEPR   36 天前
    @kajweb 太感谢了,昨晚找 1L 写了,不好意思~
        31
    ps1aniuge   36 天前
    关于楼主的脚本,大致流程如下:
    1powershell 用 yaml 模块导入 yaml,但不支持无缩进的 yaml
    2 用哈希表 或 pscustomobject,来处理,不规范的数据。
    3 用 format-table 输出表格。再加上管道,用 out-html 输出 html 文件。


    下面插播广告。 ;)

    QQ 群号=183173532
    名称=powershell 交流群
    本群建议 [免费帮] 群友写脚本!同时,支持 [红包求] 群友写脚本。

    复杂脚本,或 用户求你写脚本:
    1 个人脚本 10 元红包起。企业脚本 100 起。禁止求人写黑客 ps1,禁止帮写作恶 ps1,禁止分享黑客脚本!
    2 免责声明:使用脚本,看清源码,对用户产生任何不良后果,概不负责。
    3 用户需要说明系统环境,ps 版本。详细的需求,越细越好。必须提供小部分数据,作为测试。
    需求必须一次说清。需求增加,更改,则重新付费。一定要说的很细致全面。
    或者更改需求,增加一条需求,增加 5%---20%费用。

    4 只负责编写脚本,和除错。不负责运维。如安装环境,调试,修改。如需运维应该付出,写脚本 4----5 倍的运维费用。

    5 写 ps1 脚本的费用,大致分为这么几块:
    5.1 帮用户整理,明确需求。产出 [需求文档] 。<-----用户需求大都未十分明确,顾用户应该先付这块钱。
    5.2 写脚本费用。产出 [脚本] 。
    5.3 安装调试费用。产出 [在目的机子上,工作正常的脚本] 。
    5.4 售后服务费用。
        32
    missdeer   17 天前
    这种标准做法不是应该 xslt 吗?
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1177 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 26ms · UTC 18:24 · PVG 02:24 · LAX 10:24 · JFK 13:24
    ♥ Do have faith in what you're doing.