在百万、千万级数据的一张 PostgreSQL 表中如何高效搜索一个指定的内容

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

V2EX 提问指南

这是一个创建于 1243 天前的主题，其中的信息可能已经有所发展或是发生改变。

待搜索的字段为 json 类型，要做的是模糊匹配。

如果直接使用 like 匹配，性能上感觉应该会爆炸，不知道有没有什么原生的比较高效或者耗时短的查询方式。

JSON

postgresql

匹配

搜索

3 条回复

angryfish

2020-11-23 07:33:49 +08:00 via iPhone

mysql 可以创建虚拟字段，映射要查询的 json 字段，不知道 postgresql 有没有

abcfyk

2020-11-23 10:04:11 +08:00

要么牺牲写速度，解析 json 出来再写，
要么牺牲读速度，直接存 json，读的时候解析

非要存 pg，就这两个方向，其他的优化都是隔靴搔痒

MoYi123

2020-11-23 10:27:09 +08:00

不清楚你具体要怎样做模糊查询，举几种常见场景
1. 查询 json 中的第一层存在 key 为 1 的行，比如{"1":"abc"}，需要在 json 列建 gin 索引
create index test_data1_gin on test using gin (data1);
select * from test where data1 ? '1';

2. 查询 json 中某个具体键的值，比如{'age':18},需要对 json->>'age'建索引
create index test_data1_btree on test using btree ((data1 ->> 'age'));
select * from test where data1 ->> 'age' = 18;

3. like '":2' 比如'{"1":2}'，那这一列不应该存为 json，应该存为 text，然后加上 gin 索引