使用 Lua 编写脚本

在 Redis 中执行 Lua

Redis 允许用户在服务器上上传和执行 Lua 脚本。 脚本可以采用编程控制结构,并在执行时使用大多数命令来访问数据库。 由于脚本在服务器中执行,因此从脚本中读取和写入数据非常高效。

Redis 保证脚本的原子执行。 在执行脚本时,所有服务器活动在其整个运行时都会被阻止。 这些语义意味着脚本的所有效果要么尚未发生,要么已经发生。

脚本提供了几个在许多情况下可能有价值的属性。 这些包括:

  • 通过执行数据所在的逻辑来提供位置。数据局部性可减少整体延迟并节省网络资源。
  • 确保脚本的原子执行的阻塞语义。
  • 支持组合 Redis 中缺少的简单功能,或者这些功能太小众而无法成为其中的一部分。

Lua 允许您在 Redis 中运行部分应用程序逻辑。 此类脚本可以跨多个键执行条件更新,可能以原子方式组合几种不同的数据类型。

脚本在 Redis 中由嵌入式执行引擎执行。 目前,Redis 支持单个脚本引擎,即 Lua 5.1 解释器。 有关完整文档,请参阅 Redis Lua API 参考页面。

尽管服务器执行它们,但 Eval 脚本被视为客户端应用程序的一部分,这就是它们没有命名、版本化或持久化的原因。 因此,如果缺少所有脚本(在服务器重新启动、故障转移到副本等之后),应用程序可能需要随时重新加载。 从 7.0 版本开始,Redis Functions 提供了一种可编程性的替代方法,允许使用额外的编程逻辑来扩展服务器本身。

开始

我们将使用 Redis 的EVAL命令。

这是我们的第一个示例:

> EVAL "return 'Hello, scripting!'" 0
"Hello, scripting!"

在此示例中,EVAL需要两个参数。 第一个参数是一个字符串,由脚本的 Lua 源代码组成。 该脚本不需要包含 Lua 函数的任何定义。 它只是一个 Lua 程序,将在 Redis 引擎的上下文中运行。

第二个参数是脚本正文后面的参数数,从第三个参数开始,表示 Redis 键名称。 在此示例中,我们使用了值 0,因为我们没有为脚本提供任何参数,无论是否为键的名称。

脚本参数化

尽管非常不明智,但可以让应用程序根据其需要动态生成脚本源代码。 例如,应用程序可以发送这两个完全不同但同时完全相同的脚本:

redis> EVAL "return 'Hello'" 0
"Hello"
redis> EVAL "return 'Scripting!'" 0
"Scripting!"

尽管 Redis 没有阻止这种作模式,但由于脚本缓存的考虑,它是一种反模式(更多关于下面的主题)。 您可以参数化它们并传递执行它们所需的任何参数,而不是让您的应用程序生成相同脚本的细微变化。

以下示例演示了如何通过参数化实现与上述相同的效果:

redis> EVAL "return ARGV[1]" 0 Hello
"Hello"
redis> EVAL "return ARGV[1]" 0 Parameterization!
"Parameterization!"

在这一点上,必须了解 Redis 对键名称的输入参数和非键名称的输入参数之间的区别。

虽然 Redis 中的键名称只是字符串,但与任何其他字符串值不同,这些名称表示数据库中的键。 键的名称是 Redis 中的一个基本概念,是作 Redis 集群的基础。

重要提示:为了确保在独立部署和群集部署中正确执行脚本,脚本访问的所有键的名称都必须作为输入键参数显式提供。 该脚本应仅访问名称作为 input 参数给出的键。 脚本绝不应访问具有编程生成名称或基于数据库中存储的数据结构内容的键。

函数的任何 input 如果不是 key 的名称,则都是常规 input 参数。

在上面的示例中,HelloParameterization!常规输入参数。 由于脚本不触及任何键,因此我们使用数字参数 0 来指定没有键名称参数。 执行上下文通过 KEYSARGV 全局运行时变量使参数可供脚本使用。 KEYS 表在执行脚本之前预先填充了提供给脚本的所有键名称参数,而 ARGV 表具有类似的用途,但用于常规参数。

以下尝试演示脚本 KEYSARGV 运行时全局变量之间的输入参数分布:

redis> EVAL "return { KEYS[1], KEYS[2], ARGV[1], ARGV[2], ARGV[3] }" 2 key1 key2 arg1 arg2 arg3
1) "key1"
2) "key2"
3) "arg1"
4) "arg2"
5) "arg3"

注意:如上所示,Lua 的表数组以 RESP2 数组回复的形式返回,因此您客户端的库可能会将其转换为编程语言中的原生数组数据类型。 有关更多相关信息,请参阅控制数据类型转换的规则。

从脚本与 Redis 交互

可以通过 Lua 脚本调用 Redis 命令redis.call()redis.pcall().

这两者几乎相同。 两者都执行 Redis 命令及其提供的参数(如果这些参数表示格式正确的命令)。 但是,这两个函数之间的区别在于处理运行时错误(例如语法错误)的方式。 调用redis.call()函数直接返回给执行它的客户端。 相反,在调用redis.pcall()函数返回给脚本的执行上下文,以便进行可能的处理。

例如,请考虑以下情况:

> EVAL "return redis.call('SET', KEYS[1], ARGV[1])" 1 foo bar
OK

上述脚本接受一个 key name 和一个 value 作为其输入参数。 执行时,脚本会调用SET命令设置输入键 foo,字符串值为 “bar”。

脚本缓存

到目前为止,我们一直使用EVAL命令来运行我们的脚本。

每当我们调用EVAL,我们还会将脚本的源代码包含在请求中。 反复调用EVAL执行同一组参数化脚本,既浪费网络带宽,又在 Redis 中有一些开销。 当然,节省网络和计算资源是关键,因此,Redis 为脚本提供了一种缓存机制。

您执行的每个脚本EVAL存储在服务器保留的专用缓存中。 缓存的内容按脚本的 SHA1 摘要总和进行组织,因此脚本的 SHA1 摘要总和在缓存中唯一标识它。 您可以通过运行EVAL并调用INFO然后。 您会注意到,used_memory_scripts_evalnumber_of_cached_scripts 指标会随着执行的每个新脚本而增长。

如上所述,动态生成的脚本是一种反模式。 在应用程序运行时生成脚本可能会(而且可能会)耗尽主机的内存资源来缓存它们。 相反,脚本应该尽可能通用,并通过其参数提供自定义执行。

通过调用SCRIPT LOAD命令并提供其源代码。 服务器不执行脚本,而只是编译并将其加载到服务器的缓存中。 加载后,您可以使用从服务器返回的 SHA1 摘要执行缓存的脚本。

以下是加载然后执行缓存脚本的示例:

redis> SCRIPT LOAD "return 'Immabe a cached script'"
"c664a3bf70bd1d45c4284ffebb65a6f2299bfc9f"
redis> EVALSHA c664a3bf70bd1d45c4284ffebb65a6f2299bfc9f 0
"Immabe a cached script"

缓存易失性

Redis 脚本缓存始终是易失性的。 它不被视为数据库的一部分,也不会持久保存。 缓存可以在服务器重新启动时清除,在故障转移期间副本承担 master 角色时清除,或者通过SCRIPT FLUSH. 这意味着缓存的脚本是短暂的,缓存的内容可能随时丢失。

使用脚本的应用程序应始终调用EVALSHA来执行它们。 如果脚本的 SHA1 摘要不在缓存中,则服务器将返回错误。 例如:

redis> EVALSHA ffffffffffffffffffffffffffffffffffffffff 0
(error) NOSCRIPT No matching script

在这种情况下,应用程序应首先使用SCRIPT LOAD然后调用EVALSHA再次按其 SHA1 总和运行缓存的脚本。 Redis 的大多数客户端已经提供了用于自动执行此作的实用程序 API。 有关具体详细信息,请参阅客户的文档。

EVALSHA在 pipelining 的上下文中

执行时应特别小心EVALSHA管道请求的上下文中。 管道请求中的命令按其发送顺序运行,但其他客户端的命令可能会交错执行。 因此,NOSCRIPTerror 可以从管道请求返回,但无法处理。

因此,客户端库的实现应恢复为使用 plainEVALof 参数化。

脚本缓存语义

在正常作期间,应用程序的脚本应无限期地保留在缓存中(即,直到重新启动服务器或刷新缓存)。 根本原因是,编写良好的应用程序的脚本缓存内容不太可能持续增长。 即使是使用数百个缓存脚本的大型应用程序,在缓存内存使用方面也应该不是问题。

刷新脚本缓存的唯一方法是显式调用SCRIPT FLUSH命令。 运行该命令将完全刷新脚本缓存,删除到目前为止执行的所有脚本。 通常,仅当要为云环境中的其他客户或应用程序实例时,才需要这样做。

此外,如前所述,重新启动 Redis 实例会刷新非持久性脚本缓存。 但是,从 Redis 客户端的角度来看,只有两种方法可以确保 Redis 实例不会在两个不同的命令之间重新启动:

  • 我们与服务器的连接是持久的,到目前为止从未关闭过。
  • 客户端显式检查run_id字段中的INFO命令来确保服务器没有重新启动,并且仍然是相同的进程。

实际上,客户端假设在给定连接的上下文中,除非管理员显式调用SCRIPT FLUSH命令。 用户可以依靠 Redis 保留缓存的脚本这一事实在流水线环境中在语义上很有帮助。

SCRIPT命令

雷迪斯SCRIPT提供了几种控制脚本子系统的方法。 这些是:

  • SCRIPT FLUSH:此命令是强制 Redis 刷新脚本缓存的唯一方法。 在将同一 Redis 实例重新分配给不同用途的环境中,它最有用。 它还有助于测试 Client 端库的脚本功能实现。

  • SCRIPT EXISTS:给定一个或多个 SHA1 摘要作为参数,此命令返回 10 的数组。1 表示特定 SHA1 被识别为脚本缓存中已存在的脚本。0 的含义是具有此 SHA1 的脚本之前没有加载过(或者至少在最近一次调用SCRIPT FLUSH).

  • SCRIPT LOAD script:此命令在 Redis 脚本缓存中注册指定的脚本。 在所有我们想要确保EVALSHA不会失败(例如,在管道中或从MULTI/EXEC transaction 的 API 请求,而无需执行脚本。

  • SCRIPT KILL:此命令是中断长时间运行的脚本(又名慢速脚本)的唯一方法,而不是关闭服务器。 一旦脚本的执行持续时间超过配置的最大执行时间阈值,则认为该脚本速度较慢。 这SCRIPT KILL命令只能与在执行期间未修改数据集的脚本一起使用(因为停止只读脚本不会违反脚本引擎的保证原子性)。

  • SCRIPT DEBUG:控制内置 Redis Lua 脚本调试器的使用。

脚本复制

在独立部署中,一个名为 master 的 Redis 实例管理整个数据库。 集群部署至少有三个 master 管理分片数据库。 Redis 使用复制来维护任何给定主服务器的一个或多个副本或精确副本。

由于脚本可以修改数据,因此 Redis 确保脚本执行的所有写入作也发送到副本以保持一致性。 在脚本复制方面,有两种概念方法:

  1. 逐字复制:master 将脚本的源代码发送给副本。 然后,副本执行脚本并应用写入效果。 在短脚本生成许多命令(例如,for 循环)的情况下,此模式可以节省复制带宽。 但是,这种复制模式意味着副本会重做 master 完成的相同工作,这是浪费的。 更重要的是,它还要求所有编写脚本都是确定性的
  2. 效果复制:仅复制脚本的数据修改命令。 然后,副本在不执行任何脚本的情况下运行命令。 虽然在网络流量方面可能更长,但根据定义,此复制模式是确定性的,因此不需要特别考虑。

逐字脚本复制是 Redis 3.2 之前唯一支持的模式,其中添加了效果复制。 lua-replicate-commands 配置指令和redis.replicate_commands()Lua API 可用于启用它。

在 Redis 5.0 中,效果复制成为默认模式。 从 Redis 7.0 开始,不再支持逐字复制。

复制命令而不是脚本

从 Redis 3.2 开始,可以选择替代复制方法。 我们可以复制脚本生成的写入命令,而不是复制整个脚本。 我们称此脚本为效果复制

注意:从 Redis 5.0 开始,脚本效果复制是默认模式,不需要显式启用。

在这种复制模式下,在执行 Lua 脚本时,Redis 会收集 Lua 脚本引擎执行的所有实际修改数据集的命令。 当脚本执行完成时,脚本生成的命令序列将包装到MULTI/EXEC transaction 并发送到副本和 AOF。

根据用例,这在几个方面很有用:

  • 当脚本计算速度较慢,但可以通过几个写入命令来总结效果时,在副本上重新计算脚本或重新加载 AOF 时是一种耻辱。 在这种情况下,最好只复制脚本的效果。
  • 启用脚本效果复制后,将删除对非确定性函数的限制。 例如,您可以使用TIMESRANDMEMBER命令。
  • 此模式下的 Lua PRNG 在每次调用时随机播种。

除非已由服务器的配置或默认值启用(Redis 7.0 之前),否则您需要在脚本执行写入之前发出以下 Lua 命令:

redis.replicate_commands()

The redis.replicate_commands() function returns _true) if script effects replication was enabled; otherwise, if the function was called after the script already called a write command, it returns false, and normal whole script replication is used.

This function is deprecated as of Redis 7.0, and while you can still call it, it will always succeed.

Scripts with deterministic writes

Note: Starting with Redis 5.0, script replication is by default effect-based rather than verbatim. In Redis 7.0, verbatim script replication had been removed entirely. The following section only applies to versions lower than Redis 7.0 when not using effect-based script replication.

An important part of scripting is writing scripts that only change the database in a deterministic way. Scripts executed in a Redis instance are, by default until version 5.0, propagated to replicas and to the AOF file by sending the script itself -- not the resulting commands. Since the script will be re-run on the remote host (or when reloading the AOF file), its changes to the database must be reproducible.

The reason for sending the script is that it is often much faster than sending the multiple commands that the script generates. If the client is sending many scripts to the master, converting the scripts into individual commands for the replica / AOF would result in too much bandwidth for the replication link or the Append Only File (and also too much CPU since dispatching a command received via the network is a lot more work for Redis compared to dispatching a command invoked by Lua scripts).

Normally replicating scripts instead of the effects of the scripts makes sense, however not in all the cases. So starting with Redis 3.2, the scripting engine is able to, alternatively, replicate the sequence of write commands resulting from the script execution, instead of replication the script itself.

In this section, we'll assume that scripts are replicated verbatim by sending the whole script. Let's call this replication mode verbatim scripts replication.

The main drawback with the whole scripts replication approach is that scripts are required to have the following property: the script always must execute the same Redis write commands with the same arguments given the same input data set. Operations performed by the script can't depend on any hidden (non-explicit) information or state that may change as the script execution proceeds or between different executions of the script. Nor can it depend on any external input from I/O devices.

Acts such as using the system time, calling Redis commands that return random values (e.g., RANDOMKEY), or using Lua's random number generator, could result in scripts that will not evaluate consistently.

To enforce the deterministic behavior of scripts, Redis does the following:

  • Lua does not export commands to access the system time or other external states.
  • Redis will block the script with an error if a script calls a Redis command able to alter the data set after a Redis random command like RANDOMKEY, SRANDMEMBER, TIME. That means that read-only scripts that don't modify the dataset can call those commands. Note that a random command does not necessarily mean a command that uses random numbers: any non-deterministic command is considered as a random command (the best example in this regard is the TIME command).
  • In Redis version 4.0, commands that may return elements in random order, such as SMEMBERS (because Redis Sets are unordered), exhibit a different behavior when called from Lua, and undergo a silent lexicographical sorting filter before returning data to Lua scripts. So redis.call("SMEMBERS",KEYS[1]) will always return the Set elements in the same order, while the same command invoked by normal clients may return different results even if the key contains exactly the same elements. However, starting with Redis 5.0, this ordering is no longer performed because replicating effects circumvents this type of non-determinism. In general, even when developing for Redis 4.0, never assume that certain commands in Lua will be ordered, but instead rely on the documentation of the original command you call to see the properties it provides.
  • Lua's pseudo-random number generation function math.random is modified and always uses the same seed for every execution. This means that calling math.random will always generate the same sequence of numbers every time a script is executed (unless math.randomseed is used).

All that said, you can still use commands that write and random behavior with a simple trick. Imagine that you want to write a Redis script that will populate a list with N random integers.

The initial implementation in Ruby could look like this:

require 'rubygems'
require 'redis'

r = Redis.new

RandomPushScript = <<EOF
    local i = tonumber(ARGV[1])
    local res
    while (i > 0) do
        res = redis.call('LPUSH',KEYS[1],math.random())
        i = i-1
    end
    return res
EOF

r.del(:mylist)
puts r.eval(RandomPushScript,[:mylist],[10,rand(2**32)])

Every time this code runs, the resulting list will have exactly the following elements:

redis> LRANGE mylist 0 -1
 1) "0.74509509873814"
 2) "0.87390407681181"
 3) "0.36876626981831"
 4) "0.6921941534114"
 5) "0.7857992587545"
 6) "0.57730350670279"
 7) "0.87046522734243"
 8) "0.09637165539729"
 9) "0.74990198051087"
10) "0.17082803611217"

To make the script both deterministic and still have it produce different random elements, we can add an extra argument to the script that's the seed to Lua's pseudo-random number generator. The new script is as follows:

RandomPushScript = <<EOF
    local i = tonumber(ARGV[1])
    local res
    math.randomseed(tonumber(ARGV[2]))
    while (i > 0) do
        res = redis.call('LPUSH',KEYS[1],math.random())
        i = i-1
    end
    return res
EOF

r.del(:mylist)
puts r.eval(RandomPushScript,1,:mylist,10,rand(2**32))

What we are doing here is sending the seed of the PRNG as one of the arguments. The script output will always be the same given the same arguments (our requirement) but we are changing one of the arguments at every invocation, generating the random seed client-side. The seed will be propagated as one of the arguments both in the replication link and in the Append Only File, guaranteeing that the same changes will be generated when the AOF is reloaded or when the replica processes the script.

Note: an important part of this behavior is that the PRNG that Redis implements as math.random and math.randomseed is guaranteed to have the same output regardless of the architecture of the system running Redis. 32-bit, 64-bit, big-endian and little-endian systems will all produce the same output.

Debugging Eval scripts

Starting with Redis 3.2, Redis has support for native Lua debugging. The Redis Lua debugger is a remote debugger consisting of a server, which is Redis itself, and a client, which is by default redis-cli.

The Lua debugger is described in the Lua scripts debugging section of the Redis documentation.

Execution under low memory conditions

When memory usage in Redis exceeds the maxmemory limit, the first write command encountered in the script that uses additional memory will cause the script to abort (unless redis.pcall was used).

However, an exception to the above is when the script's first write command does not use additional memory, as is the case with (for example, DEL and LREM). In this case, Redis will allow all commands in the script to run to ensure atomicity. If subsequent writes in the script consume additional memory, Redis' memory usage can exceed the threshold set by the maxmemory configuration directive.

Another scenario in which a script can cause memory usage to cross the maxmemory threshold is when the execution begins when Redis is slightly below maxmemory, so the script's first write command is allowed. As the script executes, subsequent write commands consume more memory leading to the server using more RAM than the configured maxmemory directive.

In those scenarios, you should consider setting the maxmemory-policy configuration directive to any values other than noeviction. In addition, Lua scripts should be as fast as possible so that eviction can kick in between executions.

Note that you can change this behaviour by using flags

Eval flags

Normally, when you run an Eval script, the server does not know how it accesses the database. By default, Redis assumes that all scripts read and write data. However, starting with Redis 7.0, there's a way to declare flags when creating a script in order to tell Redis how it should behave.

The way to do that is by using a Shebang statement on the first line of the script like so:

#!lua flags=no-writes,allow-stale
local x = redis.call('get','x')
return x

Note that as soon as Redis sees the #! comment, it'll treat the script as if it declares flags, even if no flags are defined, it still has a different set of defaults compared to a script without a #! line.

Another difference is that scripts without #! can run commands that access keys belonging to different cluster hash slots, but ones with #! inherit the default flags, so they cannot.

Please refer to Script flags to learn about the various scripts and the defaults.

RATE THIS PAGE
Back to top ↑