V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  KevinQi  ›  全部回复第 1 页 / 共 1 页
回复总数  17
4 天前
回复了 pharaoh168 创建的主题 程序员 为家里老人看电视进行的一些尝试
三大运营商 IPTV 可以终结,让老人折腾什么
我的,新鲜出炉 http://qiweiwei.cn
113 天前
回复了 qiyue0726 创建的主题 程序员 有什么能快速开发网站的框架或语言吗
若依,前端 vue ,后端 springboot
想请教一下您做 AI 的思路,想学习下,不知道可以分享下不?
@DigitalG 不太明白,AI 小白,现在只过了一遍 Huggingface 上的 Question Answering 任务的 colab 笔记。
我现在的想法是使用 HuggingFace 上的中文 QA 预训练模型,然后使用手里的文档资料数据进行微调,微调的步骤 Huggingface 上教程很清楚,但是如何使用纯文本 /pdf/exce 文档生成格式化的训练数据({question, context, answer: {answer_start, answer_text}}),一直没有找到工具和普遍的方法。目前就卡在了“无结构化文档 to Dateset”这一步了
@TimePPT 这篇检索到了,但是只有论文。
@TimePPT 我觉得从纯文本 /文件 /图片抽取信息做 QA 或者 Document QA 的训练数据集,或者更普遍的,“如何从无结资料构建 QA 数据?”,应该是训练 AI 的一个很普遍的步骤,为什么检索不到什么通用工具呢?是不是我检索的关键字不对啊,学术领域这个称呼是什么呢?
@DigitalG 未必是 QA 模型,目前想采用的 3 个,一个是 QA 模型,一个是 Document Question Answer 模型,还有一个是 Table Question Answering ,但是后面两个在 Huggingface 上都没有找到中文的相关模型,所以想着先试试 QA 模型,利用现有数据对某个中文模型进行微调训练。
@TimePPT 谢谢,纯的知识文档,大多是 excel ,还有 pdf 。
2023-04-13 16:53:30 +08:00
回复了 gaoyulong 创建的主题 程序员 想买一个高性能笔记本,预算 8000~12000,求推荐
真的有移动需求吗?
2022-08-24 18:21:54 +08:00
回复了 yagamil 创建的主题 程序员 后端准备干全栈,前端部分有什么快速捷径
学 vue 吧,上手快
2022-06-22 09:03:58 +08:00
回复了 yuhangch 创建的主题 GitHub Copilot Github Copilot 正式上线了
uninstall
2022-03-29 10:11:47 +08:00
回复了 thelast1 创建的主题 程序员 关于技术和以后的发展问题
你工作了几年了?一般公司很少追新技术的,而是追求的系统稳定和业务,这才是主要的
jfinal 框架,大公司应该用的是 springboot 吧
2021-07-26 10:12:41 +08:00
回复了 beryl 创建的主题 程序员 从面试中得到的一些思考和自勉-面试官角度
如何避免“一年经验用十年”?
1. 时刻保持谦虚的心态:水满则溢
2. 持续学习:读书,上课,线上线下的论坛。
3. 持续思考:写作,写作是逼迫自己思考和总结的一种方式,日报 /周报 /月报也算。

目前就想到这么多,请大家讨论与补充
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3324 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 27ms · UTC 00:49 · PVG 08:49 · LAX 17:49 · JFK 20:49
Developed with CodeLauncher
♥ Do have faith in what you're doing.