开发者

Redis KEYS查询大批量数据替代方案

开发者 https://www.devze.com 2025-03-19 10:10 出处:网络 作者: 小沈同学呀
目录前言KEYS命令问题背景替代方案1.使用 SCAN 命令2. 使用有序集合(Sorted Set)3. 使用哈希(Hash)4. 使用 Redis 模块(如 RediSearch)总结前言
目录
  • 前言
  • KEYS命令问题背景
  • 替代方案
    • 1.使用 SCAN 命令
    • 2. 使用有序集合(Sorted Set)
    • 3. 使用哈希(Hash)
    • 4. 使用 Redis 模块(如 RediSearch)
  • 总结

    前言

    在使用 Redis 时,KEYS 命令虽然简单直接,但其全表扫描的特性在处理大规模数据时会导致性能问题,甚至可能阻塞 Redis 服务。本文将介绍SCAN命令、有序集合、哈希表和RediSearch模块四种替代 KEYS 的高效方案,以应对大批量数据的查询和管理。根据本人实际使用情况,查询Redis大批量数据的情况下推荐使用SCAN命令较好。

    KEYS命令问题背景

    KEYS 命令会遍历整个键空间,对于包含大量键的 Redis 实例,这可能导致以下问题:

    高延迟:执行时间较长,影响其他命令的响应速度。

    阻塞 Redis:在单线程模型下,KEYS 会阻塞 Redis 服务器,导致其他操作无法及时处理。

    内存消耗:返回所有匹配的键可能会占用大量内存。

    因此,在生产环境中应尽量避免使用 KEYS 命令。

    替代方案

    1.使用 SCAN 命令

    理论介绍

    SCAN 是一个增量迭代器,可以分批逐步遍历键空间,避免一次性加载所有键。它支持游标(cursor)机制,允许用户通过多次调用来完成完整的遍历。

    优点

    非阻塞:不会阻塞 Redis 服务器,适合在线环境。

    低资源消耗:每次只返回少量键,减少内存压力。

    缺点

    结果集不固定:SCAN 的结果集不是固定的,可能会有重复或遗漏的键,特别是在键频繁变化的情况下。

    额外参数:需要合理设置 COUNT 参数以平衡遍历速度和资源消耗。

    示例代码

    /**
     * scan命令测试
     * @author senfel
     * @date 2024/12/26 11:34
     * @return void
     */
    @Test
    public void scan() {
        try (Jedis jedis = new Jedis("localhost", 6379)) {
            String cursor = "0";
            ScanParams scanParams = new ScanParams().match("sys_dict:*").count(100);
            do {
                ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
                for (String key : scanResult.getResult()) {
                    System.out.println("Found key: " + key);
                }
           python     cursor = scanResult.getCursor();
            } while (!cursor.equals("0"));
        }
    }
    

    2. 使用有序集合(Sorted Set)

    理论介绍

    如果需要对键进行排序或范围查询,可以考虑将键存储在有序集合中,并为每个键分配一个唯一的分数(score)。这样可以通过 ZRANGE 或 ZREVRANGE 等命令高效地获取指定范围内的键。

    优点

    高效查询:支持快速的范围查询和排序。

    灵活性:可以根据业务需求调整分数规则。

    缺点

    额外开销:需要维护有序集合,增加了写入操作的复杂度。

    示例代码

    /**
     * sortSet
     * @author senfel
     * @date 2024/12/26 11:51
     * @return void
     */
    @Test
    public void sortSet() {
        try (Jedis jedis = new Jedis("localhost", 6379)) {
            // 添加键到有序集合
            for (int i = 0; i < 100; i++) {
                jedis.zadd("sorted_keys", System.currentTimeMillis(), "senfel"+i);
            }
            // 获取前 10 个键
            Set<String> keys = jedis.zrange("sorted_keys", 0, 9);
            for (String key : keys) {
                System.out.println("Key from sorted set: " + key);
            }
        }
    }
    

    3. 使用哈希(Hash)

    理论介绍

    如果键具有相似的结构或属于同一类目,可以将它们存储在一个哈希表中,每个字段代表一个键。这样可以通过 HGETALL 或 HSCAN 来批量获取相关键。

    优点

    集中管理:便于批量操作和维护。

    高效访问:哈希表提供了 O(1) 的查找性能。

    缺点

    适用范围有限:适用于键具有相同前缀或分类的情况。

    示例代码

    /**
     * useHash
     * @author senfel
     * @date 2024/12/26 11:55
     * @return void
     */
    @Test
    public void useHash() {
        try (Jedis jedis = new Jedis("localhost", 6379)) {
            for (int i = 0; i < 100; i++) {
                // 添加键到哈希表
                jedis.hset("user_data", "name"+i, "senfel"+i);
            }
            // 获取所有键值对
            Map<String, String> userData = jedis.hgetAll("user_data");
            for (Map.Entry<String, String> entry : userData.entrySet()) {
                System.out.println("User data: " + entry.getKey() + " -> " + entry.getValue());
            }
        }
    }
    

    4. 使用 Redis 模块(如 RediSearch)

    理论介绍

    Redis 模块扩展了 Redis 的功能,其中 RediSearch 提供了全文搜索和索引功能,能够高效地管理和查询大量数据。它支持复杂的查询语法和过滤条件。

    RediSearch安装推荐使用docker

    docker run --name redisearch -p 16379:6379 -v redis-data:/data redis/redis-stack-server:latest

    优点

    强大查询能力:支持全文搜索、模糊匹配等高级查询。

    高性能:优化的索引结构保证了高效的查询性能。

    缺点

    依赖外部模块:需要安装和配置 Redis 模块。

    学习成本:API 和配置相对复杂,需要一定的时间熟悉。

    maven依赖

    <dependency>
        <groupId>com.redislabs<IGOky/groupId>
        <artifactId>jredisearch</artifactId>
        <version>2.0.0</version>
    </dependency>
    

    示例代码

    /**
     * useRediSearch 未安装RediSearch未测试
     * @author senfel
     * @date 2024/12/26 12:26 
     * @return void
     */
    @Test
    public void useRediSearch() {
        Client client = Client.create("localhost", 6379).connect();
        // 创建索引并添加文档
        client.ftCreate("idx", Schema.newBuilder()
                .addField(new Tex编程客栈tField("title"))
                .addField(new TextField("content"))
                .build());
        client.ftAdd("idx", "doc1", 1.0, Document.newDocument()
                .addField("title", "Redis Search")
                .addField("content", "Learn how to use Redis Search"));
        // 查询文档
        SearchResult result = client.ftSearch("idx", new Query("Redis"));
        for (Document doc : result.documents()) {
            System.out.println("Found document: " + doc.getId());
        }
        client.close();
    }
    

    总结

    综上所述,Redis 大批量数据解决方案目前有SCAN命令、有序集合、哈希表、RediSearch扩展模块。一般对于Redis 大批量键遍历可以使用非阻塞低资源消耗的SCAN 命令,对于需要排序或范围查询的场景则使用有序集合,python对于键具有相同前缀或分类的情况可以使用哈希表,如果需要全文搜索或复杂查询则可以使用高性能强大查询能力的RediSearch。

    以上就是Redis KEYS查询大批量数据替代方案的详细内容,更多关于Redis KEYS数据替代方案的资料请关注php编程客栈(www.devze.com)其它相关文章!

    0

    精彩评论

    暂无评论...
    验证码 换一张
    取 消

    关注公众号