在这篇文章中,我们将介绍 PostgreSQL 对 JSON 对象的实现和处理方法。拥有一些 Linux、Postgres 和 JSON 方面的经验是必要的,因为我们不仅要介绍这些新功能,还要介绍如何实现它们。

本文使用在 Ubuntu 23.04 上运行的 PostgreSQL 16(开发版)编写。首先,我将简要回顾一下 JSON 的背景知识,然后继续介绍我们如何在 Postgres 中使用 JSON,最后介绍我们可以使用哪些有用的函数来与 JSON 对象进行交互。

#1 背景

JavaScript 对象表示法(JSON)是一种开放的标准文件格式,用于将信息存储在键值对中。它拥有一种轻量级且独立于语言的格式,既易于大家阅读,又易于机器生成和解析。它的主要优势以及为什么它在数据存储中变得如此普遍,是因为它在应用程序之间的无缝互操作性。这很适合 Web 应用程序,因为我们通常需要两个程序进行通信,并且每个程序可能使用不同的语言来实现。只要每个程序都有解析JSON文件的方法,无论另一个程序使用什么软件或硬件,它们都应该能够有效地进行通信。现在我们看到了 JSON 在数据存储方面有多棒,让我们看看如何将其作为 ou Postgres 数据库的一部分。

#2 使用JSON

PostgreSQL 有两种用于在表中存储 JSON 数据的数据类型,分别是json 和 jsonb。json 类型将 JSON 数据存储为字符串,因此在读回时,接收应用程序需要将文本转换回 JSON 对象。另一方面,jsonb 类型将 JSON 对象直接存储为其二进制表示形式。当我们将 JSON 对象存储为 jsonb 时,PostgreSQL 会将 JSON 类型映射到它自己的数据类型,这些数据类型来自 PostgreSQL 文档:

这两种类型都接受几乎相同的输入。但是,由于其效率,大多数应用程序将从使用 jsonb 中受益更多。因此,我们的示例将主要侧重于使用 jsonb

要开始在 Postgres 中使用 JSON,我们首先必须创建一个表,其中包含类型为 JSON 的列:

#CREATETABLEt1(idint,datajsonb);

现在我们可以插入一些数据:

#INSERTINTOt1VALUES(1,'{"a":1,"b":"hello","c":{"d":"world","e":2},"arr":[1,2,3]}');

让我们看看这些数据是如何表示的:

#SELECT*FROMt1;id|data----+-----------------------------------------------1|{"a":1,"b":"hello","c":{"d":"world","e":2},"arr":[1,2,3]}(1row)

PostgreSQL 不仅存储 JSON 对象,它还具有自己的函数,可用于与使用键、值对作为查询中的参数进行交互。让我们来看看如何做到这一点。

JSON Functions

#3 运营商

PostgreSQL 实现了用于从 JSON 对象访问元素的运算符。PostgreSQL 文档中总结了这些运算符:

使用这些运算符,我们可以从之前插入的 JSON 对象中访问元素。这些运算符返回的值如下所示:

#SELECTdata->'a'ASresultFROMt1;result--------1(1row)postgres=#SELECTdata->'arr'->2ASresultFROMt1;result--------3(1row)

现在我们可以访问这些值,我们可以使用它们来查询表中的行。

#INSERTINTOt1VALUES(1,'{"num":12,"arr":[1,2,3]}'),(2,'{"num":14,"arr":[4,5,6]}'),(3,'{"num":16,"arr":[7,8,9]}');#SELECTdataFROMt1WHERE(data->'arr'->1)::integer>=5;result--------------------------{"num":14,"arr":[4,5,6]}{"num":16,"arr":[7,8,9]}(2rows)

正如我们所看到的,只选择了“arr”键中第 2 个元素大于或等于 5 的行。

#4 下标

这些 JSON 对象还支持在 Postgres 中下标,就像在许多编程语言中一样。我们可以将上面的运算符转换为下标,如下所示:

#SELECTdataFROMt1WHERE(data['arr'][1])::integer>=5;data-------------------------------{"arr":[4,5,6],"num":14}{"arr":[7,8,9],"num":16}(2rows)

和以前一样,我们也可以在 SELECT 语句中使用下标:

#SELECTdata['num']FROMt1WHERE(data['arr'][1])::integer>=5;data------1416(2rows)

对于有 JSON 经验的人来说,这种语法可能更熟悉。随意使用其中任何一个,因为它们的功能非常相似,接受键的文本输入和数组的整数索引。

#5 功能

PostgreSQL 还实现了更强大的函数,用于转换和检索 JSON 对象的大小、键和迭代器等信息。当然,和前面一样,所有这些函数都可以在查询内部使用,从而使 JSON 对象在数据库中更加强大。我们将在JSON函数示例中使用以下表模式和数据:

#CREATETABLEmyjson(idint,datajsonb);#INSERTINTOmyjsonvalues(1,'{"mynum":1,"mytext":"hello","myarr":[1,2,3,4,5]}');

更多函数可以在 PostgreSQL 文档的表 9.41 中找到。我们将在这里简要介绍一些更常见的函数的子集。

array_to_json

将任何 SQL 值转换为 JSON 二进制类型。

SELECTto_jsonb(data['myarr'])frommyjson;to_jsonb-----------------[1,2,3,4,5](1row)

jsonb_array_length

返回 JSON 二进制数组中的元素数。

SELECTjsonb_array_length(data['myarr'])frommyjson;jsonb_array_length--------------------5(1row)

jsonb_each

将顶级 JSON 对象转换为键值对。

SELECTjsonb_each(data)frommyjson;jsonb_each---------------------------(myarr,"[1,2,3,4,5]")(mynum,1)(mytext,"""hello""")

jsonb_object_keys

返回 JSON Binary 对象的键。

SELECTjsonb_object_keys(data)frommyjson;jsonb_object_keys-------------------myarrmynummytext(3rows)

#6 结论

在这篇博客中,我们了解了 PostgreSQL JSON 数据类型以及如何使用它来存储、访问和管理 JSON 对象。首先,我们简要介绍了 JSON 格式的背景及其在 Web 上的实用性。然后,我们研究了如何设置一个表来使用 JSON 数据类型,然后是我们可以访问它们的不同方法。最后,我们查看了 JSON 对象将有权访问的函数的一小部分,以及如何在实现查询中使用它们。

JSON 数据类型是一个非常灵活且可互操作的对象,可被大量 Web API 接口理解。如果您的数据库与任何类型的 Web 应用程序交互,请考虑如何使用 JSON 来简化应用程序之间的数据传递。

*引用

[1]“8.14. JSON Types.” PostgreSQL Documentation, The PostgreSQL Global Development Group, 9 Nov. 2023, www.postgresql.org/docs/current/datatype-json.html.

[2]“JSON Functions and Operators.” PostgreSQL Documentation, The PostgreSQL Global Development Group, 8 Nov. 2018, www.postgresql.org/docs/9.3/functions-json.html.

[3]“PostgreSQL JSON.” PostgreSQL JSON Tutorial, PostgreSQL Tutorial, www.postgresqltutorial.com/postgresql-tutorial/postgresql-json/. Accessed 12 Jan. 2024.