kwklover

kwklover

V2EX 第 117024 号会员,加入于 2015-05-15 10:58:41 +08:00
根据 kwklover 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
kwklover 最近回复了
265 天前
回复了 zeo 创建的主题 Web Dev 有没有好办法快速查找网站违禁词?
可以试试多六六查词工具,就是做网站违禁词查询,输入网站首页地址,就可以全站扫描检测的软件:
https://www.duo66.com/
268 天前
回复了 yuptyy 创建的主题 职场话题 想开了, 人生苦短, 及时行乐
如果家庭只有你一个人有收入,20K,后续养娃,养车,供房,各种支出会感觉很拮据的,如果夫妻双方有收入,父母本身有退休金之类的,那这个收入水平在三线城市也算滋润了。

不过,没有绝对养老这么一说的,工作不忙了,但人还是要进步的,闲久了会有其他的焦虑和压力的,要不然哪天被小年轻刷下来了,可别怪愤愤不平了。

而且社会不是静态不变的,10 年作为一个周期,如果 10 年你没有什么进步,你会发现你比周围的人已经落后很多了。
@dongxiao
@igeeky
感谢,先保留,后续逐一研究学习。
@jeeyong 不是默认,本来就是小打小闹的,欢迎大牛提供好的思路,目前的解决方案,解决百来万级的数据查重,勉强够用,再上一个量级,比如千万级数据量,那肯定慢死了,就是想征集一下不同的思路和方案。
@ntest
网上搜索了一下 SimHash 的资料,大概就是给每个文档建立一个 Hash,然后比较,所以比较的实现方式决定了最终的效率,不过 SimHash 可以计算出相似,但是具体相似多少,没法得出。
感觉大学前几年应该打理论基础,学好计算机基础,数据结构,算法这些比较基础的,出社会工作了,很难静下心学习这些基础知识的。

至于具体语言的东西,大同小异的。
可以研究一下招聘信息,找到自己的定位,小公司一般比较在意会某些语言,有项目经验,来了就能 CRUD 干项目,大一点的公司,一般在意基础,会一种语言就行,大部分的语言都是相通,会 C,学 C#,JAJA,PYTHON 这些一点都不难的,来来回回就那些基础的语法结构+一堆类库。会一种语言,培训一下,一周就能学会另外一种。

经验和基础倒是需要时间熬和悟的。
@jeeyong
我也不是专业 NLP,如果建立向量速度快,比较速度快,倒是可以研究一下。
通过搜索的方式+字表比较的方式也能解决问题,就是建立 Lucene 索引的过程也是很吃资源,很耗费时间的,不过就是搜索快。
@sampeng
向量的比较真的有那么高效?一百万多数据,先得建立一百多万的向量,然后每个文档与一百多万的向量做比较,效率真的能飞快?

刚开始的时候,也从网上看过一些文章,比如谷歌工程师写的按余弦夹角理论。但感觉实现起来比较复杂啊。


@jeeyong
分词的方式,依赖词库的分词方式,往往不太准确,结果就差别很大了,效果未必准确,小样本下测试偏差较大,大样本下没做测试,最后改为不分词,直接比较字。
不仅是婆媳关系,所有关系都一样,都取决于双方。如果妻子和父母比较通情达理,一般情况下,矛盾不会太深的。只要有一方没那么通情达理或比较强势,一般矛盾很难调和。因为人的观念和生活习惯很难改变,比如教育小孩,两代人之间本身就有很多观念冲突的。

如果确实无法调和,而且家庭问题,清官难断对错的,不妨考虑分开居住,但是不要隔太远,可以互相照顾的同时,保持一定的空间独立,矛盾自然消失了,反而会更加亲近。
国企现在都不讲编制了,不敢随便给建议,怕误导人,只是觉得不满现状不是出走的理由,有更好的发展空间才是,如果自己有规划,找到了更心仪的工作,也是可以考虑离开的。
关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1668 人在线   最高记录 5497   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 10ms · UTC 16:56 · PVG 00:56 · LAX 08:56 · JFK 11:56
♥ Do have faith in what you're doing.