for循环调数据库有什么风险

发表于 2025-02-15 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌for循环调数据库有什么风险

1. 性能问题

风险：

高延迟：每次数据库调用都涉及网络通信和数据库处理时间，频繁调用会导致整体延迟增加。
低效率：大量的小批量操作比单次大批量操作效率低，增加了数据库的负载。

应对措施：

批量操作：尽量将多个操作合并为一个批量操作，如使用批量插入、批量更新等。
缓存：在内存中缓存数据，减少数据库访问次数。
异步处理：使用异步处理或消息队列，将数据库操作分散到后台任务中执行。

2. 资源消耗

风险：

连接耗尽：频繁的数据库连接和断开会消耗大量的数据库连接资源，可能导致连接池耗尽。
内存和CPU负载：大量的数据库操作会增加数据库服务器的内存和CPU负载，影响其他操作的性能。

应对措施：

连接池优化：使用连接池并适当配置连接池参数，以减少连接创建和销毁的开销。
合并请求：将多个查询合并为一个查询，减少数据库连接次数。

3. 事务处理复杂性

风险：

事务管理困难：在for循环中处理事务可能导致事务管理复杂化，增加了出错的可能性。
锁争用：长时间持有锁或频繁锁定资源可能导致锁争用，影响系统性能。

应对措施：

事务分段：将大事务分解为多个小事务，减少单个事务的持有时间。
乐观锁和悲观锁：根据具体情况选择合适的锁策略，避免不必要的锁争用。

4. 数据一致性

风险：

部分失败：for循环中的某些操作可能失败，导致数据不一致。
并发问题：多个并发操作可能导致数据竞态条件，影响数据一致性。

应对措施：

重试机制：实现重试机制，确保操作在失败时能重新执行。
并发控制：使用合适的并发控制策略，如乐观锁、悲观锁或分布式锁，确保数据一致性。

5. 可维护性和可读性

风险：

代码复杂：在for循环中嵌入大量的数据库操作代码，会使代码变得复杂且难以维护。
错误处理困难：错误处理逻辑复杂，增加了代码的维护成本。

应对措施：

抽象和封装：将数据库操作抽象和封装到独立的方法或类中，提高代码的可读性和可维护性。
日志和监控：添加日志记录和监控，方便排查问题。

mysql中已经存在的表，加索引，会不会产生锁表

发表于 2025-02-15 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌mysql中已经存在的表，加索引，会不会产生锁表？

在线DDL添加索引

在MySQL 5.5及更早版本，InnoDB不支持在线DDL操作，添加索引会锁定表，阻止任何读写操作，直到索引创建完成。

在MySQL 5.6及以上版本中，InnoDB存储引擎支持在线添加索引，这意味着在大多数情况下，表仍然可以被读取和写入。只有在索引创建的初始和最终阶段会短暂锁定表。

使用方法

要在线添加索引，你可以使用标准的ALTER TABLE语句。MySQL会自动决定是否可以在线完成操作。

1	ALTERTABLE table_name ADD INDEX index_name (column_name);

行为

初始和最终阶段锁定：在索引创建的开始和结束阶段，表会被短暂锁定。
中间阶段无锁定：在索引创建的中间阶段，表可以继续进行读写操作。

使用Percona Toolkit的pt-online-schema-change（主流）

对于一些复杂的DDL操作或者在不支持在线DDL的环境中，可以使用Percona Toolkit的pt-online-schema-change工具进行在线模式变更。这是一个强大的工具，可以在不中断服务的情况下进行DDL操作。

1	pt-online-schema-change --alter "ADD INDEX idx_last_name (last_name)" D=database_name,t=employees --execute

注意事项

性能影响：虽然在线DDL操作不会完全锁定表，但仍然会对性能产生一定影响，特别是在高负载的环境中。
空间需求：在线添加索引可能需要额外的磁盘空间，因为MySQL会创建一个临时表来构建新的索引。
版本要求：确保你的MySQL版本在5.6及以上，并且使用InnoDB存储引擎，以支持在线DDL操作。

redis什么情况下会变慢

发表于 2025-02-15 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis什么情况会变慢?

1. 内存不足

原因

Redis 是一个内存数据库，当数据量超过可用内存时，系统可能会开始交换内存到磁盘，这会显著降低性能。

解决方法

确保系统有足够的内存。
使用 Redis 的内存淘汰策略（如 LRU、LFU）来管理内存。
考虑使用 Redis 集群来分散内存负载。

2. 大量慢查询

原因

慢查询会阻塞 Redis 的事件循环，导致其他请求变慢。

解决方法

使用SLOWLOG命令监控和优化慢查询。
尽量避免在 Redis 中执行复杂的查询操作。

3. 网络延迟

原因

网络延迟会增加请求和响应之间的时间，导致整体性能下降。

解决方法

确保 Redis 服务器和客户端之间的网络连接稳定。
使用本地缓存减少网络请求。

4. 大批量操作

原因

大批量的操作如MSET、MGET、LRANGE等会占用大量的 CPU 和内存资源。

解决方法

将大批量操作拆分成小批量操作。
使用管道（pipeline）来批量发送命令，减少网络往返次数。

5. 持久化操作

原因

Redis 提供 RDB 和 AOF 两种持久化方式，持久化操作会占用 CPU 和 I/O 资源，影响性能。

解决方法

调整 RDB 和 AOF 的配置参数，减少持久化操作的频率。
使用异步持久化操作，避免阻塞主线程。

6. 大键值对（Big Keys）

原因

存储和操作大键值对（如大字符串、大列表、大集合等）会占用大量内存和 CPU 资源。

解决方法

尽量避免存储大键值对。
将大键值对拆分成多个小键值对。

7. CPU 瓶颈

原因

Redis 是单线程的，CPU 使用率高时会影响性能。

解决方法

优化 Redis 的配置和使用，减少 CPU 负载。
使用 Redis 集群或分片（sharding）来分散负载。

8. 不合理的配置

原因

不合理的配置参数（如最大客户端连接数、最大内存限制等）会影响 Redis 的性能。

解决方法

根据实际需求调整 Redis 的配置参数。
参考 Redis 官方文档和最佳实践进行配置。

9. 客户端连接过多

原因

过多的客户端连接会占用 Redis 的文件描述符资源，影响性能。

解决方法

限制客户端连接数。
使用连接池来管理客户端连接。

10. 数据结构选择不当

原因

不合理的数据结构选择会影响 Redis 的性能。

解决方法

根据实际需求选择合适的数据结构。
参考 Redis 官方文档了解各数据结构的性能特性。

原文: https://www.yuque.com/jingdianjichi/xyxdsi/wruq3nw7xph7ascq

jedis与redisson对比有什么优缺点

发表于 2025-02-12 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

jedis与redisson对比有什么优缺点？

口语化回答

好的，面试官。jedis 是一个轻量级的 redis 客户端，比较容易集成和使用。redisson 是后面的升级版框架，在分布式方面增加了很多的处理。最大的区别在于线程安全和分布式上面，jedis 需要一些操作来保证安全性，redission 则天然支持，内部封装了很多处理。还有就是集群方面 jedis 如果使用集群非常的麻烦，需要配置很多东西，redisson 则非常容易，天然支持。redisson 还提供了很多现成的功能，分布式锁，限流等等这些，不需要再从头编写。如果业务比较简单，jedis 就够了。复杂的话大型项目还是建议使用 redisson。以上。

题目解析

这道题真不常考，也可以说几乎不考。不是重点，大家了解一下即可。别到时候人家说这两个名词，不知道是什么就行。

面试得分点

线程安全，集群支持，api 功能扩展

题目详细答案

Jedis和Redisson是两种常用的Java Redis客户端。Jedis是一个轻量级的Redis客户端，易于集成和使用。Redisson是一个在Redis的基础上实现的Java驻内存数据网格。它不仅提供了一系列的分布式的Java常用对象，还提供了许多分布式服务。

二者相比主要是以下的优点和缺点：

Jedis

优点

直观的API：提供了直接且简单的API，便于操作Redis的各种数据结构和命令。

性能高：由于其轻量级特性，Jedis在单线程操作中性能较高。

广泛使用：Jedis是较早的Java Redis客户端之一，有着广泛的社区支持和文档资源。

缺点

线程安全性：Jedis实例不是线程安全的，需要通过连接池（JedisPool）来管理连接，增加了复杂性。

功能有限：Jedis主要提供了对Redis命令的直接封装，缺乏高级特性，如分布式锁、限流器等。

集群支持：虽然Jedis支持Redis集群，但配置和使用相对复杂，且在某些场景下性能不如Redisson。

Redisson

优点

线程安全：Redisson的所有对象都是线程安全的，简化了多线程环境下的使用。

高级特性：提供了许多高级特性，如分布式锁、分布式集合、分布式队列、分布式缓存、限流器等，适合复杂的分布式系统。

易用性：Redisson的API设计更加面向对象，提供了丰富的分布式数据结构和并发工具，使开发更加简便。

集群支持：Redisson对Redis集群的支持更加友好和高效，配置和使用相对简单。

缺点

重量级：Redisson的功能丰富，但也带来了较大的依赖包和内存占用，相比Jedis更为重量级。

性能开销：由于提供了许多高级特性，Redisson在某些场景下的性能可能不如Jedis。

学习曲线：Redisson的API和功能较多，学习和掌握所有特性需要一定的时间。

选择建议

1、如果你的应用场景比较简单，只需要基本的Redis操作，并且对性能有较高要求，Jedis是一个不错的选择。

2、复杂分布式系统：如果你的应用需要使用Redis的高级特性，如分布式锁、限流器、分布式集合等，或者需要在多线程环境中使用Redis，Redisson会更合适。

3、集群支持：如果需要使用Redis集群，Redisson的配置和使用相对简单、性能较好，更加推荐使用。

redis key的过期时间和永久有效分别怎么设置

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

redis key的过期时间和永久有效分别怎么设置?

在Redis中，你可以使用多种命令来设置键的过期时间或将键设置为永久有效。

使用EXPIRE命令，EXPIRE命令用于设置键的过期时间，以秒为单位。

1
2
3

EXPIRE key seconds
例如：
EXPIRE mykey 60  # 设置 mykey 的过期时间为60秒

使用PEXPIRE命令，PEXPIRE命令用于设置键的过期时间，以毫秒为单位。

1
2
3

PEXPIRE key milliseconds
例如：
PEXPIRE mykey 60000  # 设置 mykey 的过期时间为60000毫秒（即60秒）

以上的两个区别就是秒级和毫秒级的区别。

使用EXPIREAT命令，EXPIREAT命令用于设置键的过期时间为指定的 Unix 时间戳，以秒为单位。

1
2
3

EXPIREAT key timestamp
例如：
EXPIREAT mykey 1672531199  # 设置 mykey 的过期时间为指定的 Unix 时间戳

使用PEXPIREAT命令，PEXPIREAT命令用于设置键的过期时间为指定的 Unix 时间戳，以毫秒为单位。

1
2
3

PEXPIREAT key milliseconds-timestamp
例如：
PEXPIREAT mykey 1672531199000  # 设置 mykey 的过期时间为指定的 Unix 时间戳（毫秒）

使用SET命令带选项，SET命令可以在设置键值的同时指定过期时间。

SET key value EX seconds
SET key value PX milliseconds
例如：
SET mykey "value" EX 60  # 设置 mykey 的值为 "value" 并使其在60秒后过期
SET mykey "value" PX 60000  # 设置 mykey 的值为 "value" 并使其在60000毫秒（即60秒）后过期

设置键为永久有效

使用PERSIST命令，PERSIST命令用于移除键的过期时间，使其变为永久有效。

1
2
3

PERSIST key
例如：
PERSIST mykey  # 移除 mykey 的过期时间，使其变为永久有效

redis 回收进程如何工作

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis回收进程如何工作的?

题目详细答案

Redis的回收进程负责定期扫描和删除过期键。服务器运行时自动执行。主要就是定期回收和惰性回收，其实也可以看之前的 redis 过期策略。来进行合二为一，其实二者答案差不多，就是内容有一定区别。

定期回收任务

Redis回收进程的核心是一个定期任务，这个任务在Redis的事件循环中执行。

事件循环：Redis使用一个单线程的事件循环模型来处理所有的客户端请求和后台任务。

定期任务：在事件循环中，Redis会定期触发一个函数来执行过期键的检查和删除操作。这个函数默认每100毫秒运行一次。

实现步骤如下：

选择数据库：每次执行定期任务时，Redis会遍历所有的数据库（默认16个）。
随机抽样：对于每个数据库，Redis会随机选择一部分带有过期时间的键进行检查（默认20个）。
检查过期键：检查这些键是否已经过期，如果过期则删除。
重复检查：如果发现超过一定比例的键是过期的（默认25%），则继续进行更多次的检查和删除，直到过期键的比例下降到合理范围内。

惰性回收

惰性回收不是一个独立的进程，而是每次客户端访问键时触发的检查机制。它的工作原理如下：

访问键：每当客户端访问一个键时，Redis会检查该键是否设置了过期时间。
检查过期：如果该键已经过期，Redis会立即删除该键，并返回空结果或相应的错误信息。

redis 如何实现延迟队列

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis如何实现延时队列

题目详细答案

可以使用有序集合（Sorted Set）来实现延时队列。有序集合中的每个元素有一个关联的分数，可以用来表示任务的执行时间戳。具体的步骤如下，非常简单

添加任务到延时队列

将任务添加到有序集合中，使用任务的执行时间作为分数（score）。

// 示例代码：添加任务到延时队列
String queueName = "delay_queue";
String taskId="task_1";
long delay=5000; // 延迟时间（毫秒）
long executionTime= System.currentTimeMillis() + delay;
Jedis jedis = newJedis("localhost");
jedis.zadd(queueName, executionTime, taskId);
jedis.close();

轮询延时队列并执行任务

定期检查有序集合中的任务，找到那些执行时间已经到达或超过当前时间的任务，并执行这些任务。

// 示例代码：轮询延时队列并执行任务
String queueName = "delay_queue";
Jedis jedis=new Jedis("localhost");
while (true) {
    long currentTime= System.currentTimeMillis();
    Set<Tuple> tasks = jedis.zrangeByScoreWithScores(queueName, 0, currentTime, 0, 1);

    if (tasks.isEmpty()) {
        // 没有任务需要执行，休眠一段时间
        Thread.sleep(1000);
        continue;
    }

    for (Tuple task : tasks) {
        StringtaskId= task.getElement();
        // 执行任务
        executeTask(taskId);

        // 从队列中移除已执行的任务
        jedis.zrem(queueName, taskId);
    }
}

jedis.close();
private static void executeTask(String taskId) {
    // 实现任务执行逻辑
    System.out.println("Executing task: " + taskId);
}

redis 常见性能问题和解决方案

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis常见性能问题和解决方案?

口语化回答

好的，面试官，redis 常见性能问题主要有内存空间不足，大 key 问题，阻塞操作等等。像内存空间问题，主要发生在大规模的数据量下产生，针对这种我们可以采取数据结构层面的优化，或者集群模式的水平扩。大 key 问题一般就是最初设计的时候，没有考虑清楚，导致业务日积月累，一个小的 key 变成了大 key。会导致我们的性能下降，耗时增加，这种需要从根上进行业务的梳理和处理拆分。还有就是阻塞，如果执行一些 keys 命令会大致阻塞，生产要避免进行这些操作。以上

题目解析

这道题大家主要是从以下的几个问题中，选取常见的 3 个即可。建议大家选择空间不足，大 key 和阻塞，这三点比较好回答，也好解释和扩展。

面试得分点

内存不足，大 key，阻塞，网络延迟，慢查询，持久化性能

题目详细答案

问题一、redis 内存空间不足

****由于Redis的数据存储在内存中，当数据量增大时，可能会出现内存不足的情况，导致性能下降或服务不可用。

解决方案：

内存优化：使用更高效的数据结构（如哈希表、压缩列表）来存储数据，减少内存占用。

水平扩展：使用Redis集群模式，将数据分片存储在多个节点上，扩展内存容量。

问题二、redis 的大 key

****某些键可能存储了大量数据（如大列表、大哈希表），操作这些大键可能导致阻塞，影响性能。

解决方案：

拆分大键：将大键拆分成多个小键，减少单个键的操作时间。

分批处理：对于需要迭代处理的大键，使用SCAN、SSCAN、HSCAN、ZSCAN等命令进行分批处理，避免单次操作时间过长。

监控和预警：定期监控Redis中的大键，及时发现并处理。

问题三、阻塞操作

某些Redis命令（如KEYS、FLUSHALL、SAVE等）会阻塞服务器，导致其他操作无法执行。

解决方案：

避免阻塞命令：尽量避免使用阻塞命令，使用非阻塞的替代命令（如SCAN代替KEYS）。

异步操作：对于需要执行的阻塞操作，尽量使用异步方式（如FLUSHALL ASYNC）。

问题四、网络延迟

Redis是基于TCP协议的网络服务，高网络延迟会影响Redis的性能。

解决方案：

本地部署：尽量将Redis服务器部署在与应用服务器同一内网，减少网络延迟。

连接池：使用连接池来复用Redis连接，减少连接建立和关闭的开销。

问题五、慢查询

****某些复杂的查询或数据操作可能会导致Redis响应变慢，影响整体性能。

解决方案：

慢查询日志：启用Redis的慢查询日志功能，定期检查慢查询并优化。

索引优化：合理使用Redis的数据结构和索引，优化查询性能。

问题六、主从复制延迟

****在主从复制架构中，从服务器可能会因为网络或负载问题导致复制延迟，影响数据一致性。

解决方案：

优化网络：确保主从服务器之间的网络连接稳定，带宽充足。

调整复制参数：优化Redis的复制参数（如repl-backlog-size、repl-timeout等），减少复制延迟。

监控复制状态：定期监控主从复制状态，及时发现并处理延迟问题。

问题七、持久化性能问题

****Redis的持久化操作（如RDB快照和AOF日志）可能会影响性能，尤其是在大数据量或高并发情况下。

解决方案：

合理配置持久化策略：根据业务需求配置合理的持久化策略，平衡性能和数据安全性。

异步持久化：使用异步持久化方式（如AOF的fsync策略），减少对主线程的影响。

redis 内存用完之后会发生什么

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis的内存用完了会发生什么？

口语化回答

好的，面试官。redis 内存用完之后发生的现象主要取决于我们配置的内存回收策略。默认是noeviction，这个策略不会删除任何的键，当内存不足的时候，就会报错。这种策略，我们一般不使用。常见使用的就是 lru，回收最近最少使用的有过期时间的键。其他的策略还比如 randow，可以回收随机的键。ttl 按照最短的过期时间来进行回收。以上。

题目解析

这道题还算是比较常问的一道题，大家需要理解其中的策略，然后答题的时候，能说上几种就可以了。最后再说一下方案的选择优点就可以了。

面试得分点

lru，lfu，random，无过期

题目详细答案

当Redis的内存用完时，会根据配置的内存回收策略采取不同的措施。可以在内存达到限制时决定如何处理新的写请求。主要的策略有如下 8 种。

内存回收策略

noeviction：不删除任何键，当内存不足时返回错误。这是默认策略。

当内存达到限制时，Redis将不再接受任何写请求，并返回错误。例如，客户端尝试设置新键时，会收到类似以下的错误信息：

1	(error) OOM command not allowed when used memory > 'maxmemory'.

allkeys-lru：使用最近最少使用（LRU）算法回收所有键。
volatile-lru：使用最近最少使用（LRU）算法回收设置了过期时间的键。

Redis将根据LRU算法选择最近最少使用的键进行删除，以腾出空间存储新的数据。allkeys-lru会在所有键中选择，volatile-lru只会在设置了过期时间的键中选择。

allkeys-random：随机回收所有键。
volatile-random：随机回收设置了过期时间的键。

Redis会随机选择一些键进行删除，以腾出空间。allkeys-random会在所有键中选择，volatile-random只会在设置了过期时间的键中选择。

volatile-ttl：回收那些剩余生存时间（TTL）最短的键。

Redis将选择那些剩余生存时间（TTL）最短的键进行删除。

volatile-lfu：使用最长时间没有被使用（LFU）算法回收设置了过期时间的键。
allkeys-lfu：使用最长时间没有被使用（LFU）算法回收所有键。

Redis将根据LFU算法选择最近最少使用的键进行删除。volatile-lfu只会在设置了过期时间的键中选择，allkeys-lfu会在所有键中选择。

配置内存回收策略的方式

redis.conf文件中配置内存回收策略，例如：

1 2	maxmemory 100mb maxmemory-policy allkeys-lru

也可通过命令行参数设置：

1	redis-server --maxmemory 100mb --maxmemory-policy allkeys-lru

redis 同步机制

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis的同步机制是什么?

口语化回答

好的，面试官。redis 的同步机制主要是主从同步，一开始从服务器发送同步命令，主服务器接收到之后，就会生成一个 rdb 的文件，然后传输给从服务器，从服务器接收到之后，立马进行数据的恢复。然后当主服务器再次接收到写命令的时候，会发给从服务器。这个过程是一个异步复制，主服务器不会等待结果。这样就完成了主从复制，主要的核心步骤就是这些。如果同步机制发生问题的话，从服务器可以进行断线重连。还可以做集群、哨兵，来自动切换。以上。

题目解析

主要还是考主从同步原理和如何进行配置，还可以带一点故障的处理。面试官主要是想看看你对集群有没有一定的了解，redis 主从的数据复制有没有了解。

面试得分点

rdb 快照，增量同步，故障机制

题目详细答案

redis的同步机制主要涉及主从复制，主从复制机制允许一个服务器（主服务器）将数据复制到一个或多个服务器（从服务器）。从服务器可以是只读的，也可以接受写操作，但这些写操作不会被同步回主服务器。

初次同步

当从服务器第一次连接到主服务器时，或者当从服务器与主服务器的连接中断后重新连接时，会触发一次全量同步过程。

从服务器发送SYNC命令：从服务器向主服务器发送SYNC命令，请求进行同步。
主服务器生成RDB快照：主服务器接收到SYNC命令后，会生成一个RDB（Redis Database）快照文件，并在生成过程中将所有新写入的命令记录到一个缓冲区中。
传输RDB文件：主服务器将生成的RDB文件发送给从服务器。从服务器接收到RDB文件后，会清空自身的数据库并加载这个RDB文件。
传输缓冲区中的命令：主服务器将缓冲区中的所有写命令发送给从服务器，从服务器依次执行这些命令，以确保数据完全同步。

增量同步

在初次同步完成后，主从服务器会保持连接状态，主服务器会将后续的所有写命令实时发送给从服务器，从服务器执行这些命令以保持数据的一致性。

同步机制如何配置

主服务器配置

主服务器的配置通常不需要特别设置，只需要确保其能够接受从服务器的连接请求。

从服务器配置

在从服务器的配置文件中，需要指定主服务器的IP地址和端口号：

1 2	replicaof <master-ip> <master-port> replicaof 192.168.1.100 6379

同步机制的故障处理

断线重连

当从服务器与主服务器的连接中断时，从服务器会自动尝试重连。在重连成功后，从服务器会根据情况选择进行全量同步或增量同步。

主从切换

在高可用环境中，可以使用Redis Sentinel或Redis Cluster来实现自动主从切换。当主服务器发生故障时，Sentinel或Cluster会自动选举一个新的主服务器，并通知其他从服务器进行同步。

redis 高级数据类型有哪些

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis的高级数据类型有哪些？

口语化回答

好的，面试官，面对一些复杂的场景，redis提供了一些高级数据类型，来进行了功能的扩展。主要有四种，bitmaps，hyperloglog，geo，stream。stream 不是非常常用，主要是用来实现消息队列功能。常用的就是 bitmap，bitmap 的 0，1 特性，非常实用于签到，或者存在，不存在这种类型判断，以及在大量数据下，快速统计是否结果。bitmap 非常节省空间，相比于传统的存储数据后，在 mysql 等层面统计，bitmap 更加适用。其次就是hyperloglog 主要是用于一些数量的统计，不过要允许误差，他不会存具体的内容，会帮助我们进行数据的统计，像常见的网站访问统计，就非常适合这个数据结构。geo 主要是做地理位置的计算，通过经度和纬度来定位位置，经过运算可以得到距离，附近范围的坐标等等。像比如美团外卖的附近商家，地图的距离测算，都可以通过 geo 的结构来进行实现，以上。

题目解析

这道题问的比较少，如果在问你基础数据类型的时候，你补了一句，还有三种高级类型，如果面试官感兴趣的话，会继续的追问你。不过三种里面最常用的就是 bitmap，其他用的比较少，重点关注 bitmap 即可。hyperloglog，geo 都不常见，无需关注。作为了解即可。

面试得分点

bitmap，二进制位统计，签到功能，hyperloglog，大数据量统计，geo，地理位置，经纬度，附近的人

题目详细答案

一、 Bitmaps

位图就是一个用二进制位（0和1）来表示数据的结构。可以把它想象成一排开关，每个开关只能是开（1）或者关（0）。这些开关排成一行，从左到右编号，编号从0开始。

目的就是操作某一个位置的数据变成 1 或者 0。

主要操作命令

1	SETBIT jichi 4 1

按照上图，我们其实就是把 4 位设置成了 1。

1	GETBIT jichi 4

1	BITCOUNT jichi //获取bitmap里面有多少个1

举个例子

基于上面我们按照大家常见的比如用户签到系统，来做一个例子的说明。

假设我们有一个用户签到系统，我们可以用 bitmap 来记录每个用户每天是否签到。比如，一个月有30天，我们可以用30个位来表示这个月的签到情况，我们就可以如此设计。

第1天签到：第0位设为1。第2天没签到：第1位设为0。第3天签到：第2位设为1。以此类推…

这个例子就用上面三个命令即可完成，setbit 设置签到位置，getbit 判断某一天有没有签到，bitcount 获取总共签了多少次到。

假设用户在第1天和第3天签到，那么 bitmap 的值就是下面这样的：

1	101000000000000000000000000000

为什么用 bitmap

类似签到，活跃情况，这些场景，假设我们用数据库存储，可能是一条一条的，统计起来也费时和麻烦，如果使用 bitmap，可以进行非常快速的统计，并且 bitmap 每个位只是二进制位，非常节省空间。

扩展起来，其实比如判断用户有没有权限，假设把某个权限作为一个位置，新增作为 1，删除作为 2，那么这种场景也是可以很快知道用户是否有权限的一种方式。

总之涉及单位置判断的，是否的场景，bitmap 比较靠谱。

二、HyperLogLog

HyperLogLog 用于计算数据集中不重复元素的数量，是 Redis 提供的一种基数统计的数据结构。当我们需要统计大量数据中有多少不同的元素时，直接存储所有元素会占用大量内存。例如，统计一个网站一天内有多少不同的IP地址访问。如果直接存储所有IP地址，内存消耗会非常大。HyperLogLog通过巧妙的数学方法，可以在很小的内存占用下，提供一个非常接近的估算值。在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。这和计算基数时，元素越多耗费内存就越多的集合形成鲜明对比。

什么是基数？？

比如数据集 {1, 3, 5, 7, 5, 7, 8}，那么这个数据集的基数集为 {1, 3, 5 ,7, 8}, 基数(不重复元素)为5。基数估计就是在误差可接受的范围内，快速计算基数。

常用命令

HyperLogLog 在 Redis 中以字符串的形式存在，但是只能作为计数器来使用，并不能获取到集合的原始数据。

主要涉及三个命令：

添加元素：

1 2	PFADD key element1 element2 ... 例如：PFADD jichihll jichi jitui

估算基数：

PFCOUNT key
PFCOUNT jichihll

返回的就是 2

合并多个HyperLogLog：

1	PFMERGE destkey sourcekey1 sourcekey2 ...

应用场景

凡是大量的数据下，统计不同数据的数量的情况都可以使用，非常的方便，同时要接受误差的场景。比如

网站访问统计：估算鸡翅 club 网站每天有多少独立访客。

日志分析：估算日志文件中有多少不同的错误类型。

三、 Geospatial Indexes

Geo数据指的是与地理位置相关的数据。简单来说，就是关于“东西在哪里”的数据。它可以描述物体的位置、形状和关系，比如城市的坐标、商店的位置、路线的路径等等。

有主要的三个要素，经度，纬度，和位置名称。

比如鸡哥所在的位置

1	GEOADD jichi 16.281231 37.1231241 jd

常用命令

添加地理位置：

1 2	GEOADD key longitude latitude member [longitude latitude member ...] GEOADD cities 116.4074 39.9042 "Beijing"

获取地理位置：

GEOPOS key member
GEOPOS cities "Beijing"
会返回
116.4074
39.9042

计算距离：

1 2	GEODIST key member1 member2 [unit] GEODIST cities "Beijing" "Shanghai" km（计算北京和上海之间的距离，单位为公里）

查找附近的位置：

1 2	GEORADIUS key longitude latitude radius [unit] GEORADIUS cities 116.4074 39.9042 100 km（查找北京附近100公里内的所有城市）

查找某个位置附近的位置：

1 2	GEORADIUSBYMEMBER key member radius [unit] GEORADIUSBYMEMBER cities "Beijing" 100 km（查找北京附近100公里内的所有城市）

georadius 以给定的经纬度为中心，返回键包含的位置元素当中，与中心的距离不超过给定最大距离的所有位置元素。

georadiusbymember 和 GEORADIUS 命令一样，都可以找出位于指定范围内的元素，但是 georadiusbymember 的中心点是由给定的位置元素决定的，而不是使用经度和纬度来决定中心点。

应用场景

附近的人：比如类似微信的附近的人，以自己为中心，找其他的人，这种场景，就可以使用GEORADIUS 。

基于地理位置推荐：比如推荐某个位置附近的餐厅，都可以实现

计算距离：大家会遇到这种场景，比如当你购物的时候，美团外卖会告诉你商家距您多远，也可以通过 geo 来进行实现。

四、Stream（不是重点）

stream 是 redis5.0 版本后面加入的。比较新，以至于很多老八股题目，都没有提到这个类型。还有就是本身应用度的场景真的不多，类似 mq，但是如果 mq 的场景，大家一般会选择正宗的 rokcetmq 或者 rabbit 或者 kafka，所以这种类型，大家稍微知道即可。

Redis中的流结构用来处理连续不断到达的数据。你可以把它想象成一条流水线，数据像流水一样源源不断地流过来，我们可以在流水线的不同位置对这些数据进行处理。

主要目的是做消息队列，在此之前 redis 曾经使用发布订阅模式来做，但是发布订阅有一个缺点就是消息无法持久化。非常脆弱，redis 宕机，断开这些，都会产生造成丢失。stream 提供了持久化和主备同步机制。

概念解析

消息（Message）：流中的每一条数据。每条消息都有一个唯一的ID和一组字段和值。

流（Stream）：存储消息的地方。可以把它看作一个消息队列。

消费者组（Consumer Group）：一个或多个消费者组成的组，用来处理流中的消息。

消费者（Consumer）：处理消息的终端，可以是应用程序或服务。

应用场景

如果需要轻量级，很轻很轻，没有 mq 的情况下，可以使用 redis 来做，适合处理需要实时处理和快速响应的数据。比如做成用户消息实时发送和接收、服务器日志实时记录和分析、传感器数据实时收集和处理。

不过需要注意的是，正常来说 mq，mqtt 等等在各自场景有比较好的应用。

常见命令

添加消息到流：

1
2
3

XADD stream-name * field1 value1 [field2 value2 ...]
XADD mystream * user jichi message "Hello, world!"
他会向流mystream添加一条消息，消息内容是user: jichi, message: "Hello, world!"。

读取消息：

1
2
3

XREAD COUNT count STREAMS stream-name ID
XREAD COUNT 2 STREAMS mystream 0
会从流mystream中读取前两条消息，也就是读取到jichi 的hello world

创建消费者组：

1
2
3

XGROUP CREATE stream-name group-name ID
XGROUP CREATE mystream mygroup 0
会为流mystream创建一个名为mygroup的消费者组。

消费者组读取消息：

1
2
3

XREADGROUP GROUP group-name consumer-name COUNT count STREAMS stream-name ID
XREADGROUP GROUP mygroup consumer1 COUNT 2 STREAMS mystream >
会让消费者组mygroup中的消费者consumer1读取流mystream中的前两条消息。

确认消息处理完成：

消费者处理完成，应该进行 ack。

1
2
3

XACK stream-name group-name ID
XACK mystream mygroup 1526569495631-0
确认消费者组mygroup已经处理完了ID为1526569495631-0的消息。

redis 过期策略有哪些

发表于 2025-02-11 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌redis过期策略有哪些？

口语化回答

好的，面试官，过期策略主要分为主动和被动，主动又分为定时、定期，被动就是常说的惰性清理。先说结论，redis 采取的方案是定期+惰性配合的方式来进行实现。定期策略主要是通过周期性执行的函数来扫描即将过期的键，立马将其进行失效操作。这种方式比较消耗 cpu。于是产生了定期操作，没隔多少 ms 来进行执行，这种减少了 cpu 的消耗。也能比较准时的删除过期的键。算是定时的一种优化，比较难的点就是寻求平衡。最后就是拖性删除，所有的 key 即使过期了也不会立马删除，当这个键过期之后，下一次访问的时候，才会被删除，容易造成内存泄漏的问题。最后 oom 就会触发内存淘汰策略了，优点就是大大减轻了 cpu 的压力。以上两种方式配合，能达到一个平衡。

题目解析

常考题，很多人把过期策略和淘汰策略混在一起。二者既不同，当惰性删除的时候，又有联系。大家要注意多层面来回答，注意辩证 cpu 性能的问题处理。

面试得分点

定期删除，定时删除，惰性删除，主动于被动

题目详细答案

从行为上，我们可以把过期策略分为两大点。主动删除，被动删除。主动删除又分为定时删除和定期删除。

主动删除

定时删除

当设置键的过期时间时，Redis会为该键创建一个定时器，当过期时间到达时自动删除该键。redis.c 下的 activeExpireCycle 函数实现了定期删除粗略，配合 Redis的服务器的 serverCron函数，在服务器周期执行serverCron 的时候，activeExpireCycle函数就会被调用，在一定的时间内，分多次遍历 redis 中的数据库，从数据库的expires字典中检查一部分键的过期时间，此操作是随机性的，然后删除其中的过期键。

优点：删除操作会在数据到期时立即进行，确保内存及时释放。

缺点：定时器的管理会消耗系统资源，特别是在大量键设置过期时间的情况下，删除 key 会对响应时间和吞吐量产生影响。

定期删除

Redis会定期扫描数据库中的键，并删除其中已过期的键。通过随机抽取一定数量的键，并检查它们是否过期，如果过期就删除，Redis默认每隔100ms（可以通过配置文件中的hz参数进行调整）就执行一次过期扫描任务。

配置redis.conf的hz选项，默认为10，1s刷新的频率。即1秒执行10次，相当于100ms执行一次，hz值越大，说明刷新频率越快，Redis性能损耗也越大

优点：通过限制删除操作执行的时长和频率来减少删除操作对CPU的影响，同时能有效释放过期键占用的内存。

缺点：难以确定删除操作执行的时长和频率，如果执行的太频繁，会对CPU造成负担，就变成了定时删除；如果执行的太少，则过期键长时间占用的内存没有及时释放，造成内存浪费。

内存不足

当Redis的内存达到最大限制时，还会触发内存淘汰策略，策略不同决定哪些数据会被删除以腾出空间。
no eviction：禁止淘汰，达到内存限制时拒绝新的写请求。
allkeys-lru：从所有键中淘汰最近最少使用的键。
volatile-lru：从设置了过期时间的键中驱逐最近最少使用的键。
allkeys-random：从所有键中随机驱逐键。
volatile-random：从设置了过期时间的键中随机驱逐键。
volatile-ttl：从设置了过期时间的键中驱逐剩余时间最短的键。

被动删除

惰性删除

Redis不会在键过期时立即删除它，而是在下一次访问这个键时检查其是否过期，然后删除过期的键。假设这个键已经过期，但是后面一直没有被访问，则会永远存在。不会被删除，这就是惰性删除。

惰性删除策略由db.c/expireIfNeeded函数实现，所有读写数据库的Redis命令在执行之前都会调用expireIfNeeded函数对输入键进行检查。如果输入键已经过期，那么expireIfNeeded函数将输入键从数据库中删除；如果输入键未过期，那么expireIfNeeded函数不做动作。

优点：惰性删除不会增加额外的系统开销，不浪费 cpu，只在访问时进行检查。

缺点：如果某个键永远不会被访问，即使设置了过期时间，它也不会被自动删除，造成内存泄漏问题。

Redis 实际使用的是定期删除+惰性删除的方式！定期删除减少 cpu 消耗和浪费，配合惰性删除，二次检查保险。

Mysql中的索引

发表于 2024-11-20 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

一、MySQL 为什么使用 B+ 树？

与B+ 树相比，平衡二叉树、红黑树在同等数据量下，高度更高，性能更差，而且它们会频
繁执行再平衡过程，来保证树形结构平衡。
与B+ 树相比，跳表在极端情况下会退化为链表，平衡性差，而数据库查询需要一个可预期
的查询时间，并且跳表需要更多的内存
与B+ 树相比，B 树的数据存储在全部节点中，对范围查询不友好;非叶子节点存储了数
据，导致内存中难以放下全部非叶子节点，可能需要磁盘IO；

二、MySQL 对 NULL 值的索引支持特点如下：

索引会存储并支持 NULL 值
查询条件 IS NULL 和 IS NOT NULL 可以利用索引。

与其他数据库相比，MySQL 的索引对 NULL 的支持更完善且优化更好。

索引的优化

优化方面：sql本身优化、服务器/引擎（配置）优化、操作系统优化、硬件资源问题

1、sql优化达到的目的：

减少磁盘IO：避免全面扫描、使用索引（覆盖索引）
减少内存cpu消耗：尽可能减少排序、分组、去重之类的操作
修改索引或者说表定义变更的核心问题是数据库会加表锁，直到修改完成

示例：

1、使用覆盖索引和索引下推减少回表；索引下推中范围查询排序的字段使用不当，使用了index where，增加字段走索引下推，优化 ORDER BY 将排序列加入索引。

2、用 WHERE 替换 HAVING（注意sql的执行顺序）；如果不是使用聚合函数来作为过滤条件，最好还是将过滤条件优先写到WHERE 里面。

HashMap

发表于 2024-11-15 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

1、HashMap 线程不安全 key和value能存null值


        HashMap<Object, Object> map = new HashMap<>();
        map.put(1,1);
        map.put(1,1);
        map.put(null,2);
        map.put(null,"12");
        System.out.println(map.get(1));
````
### HashMap 能存null值 不会出现空指针的原因是：HashMap 的key如果是null 底层在去hashCode 的时候是默认赋值为0；

```java
    static final int hash(Object key) {
        int h;
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

2、ConcurrentHashMap 线程安全是因为加了锁 key和value不能存null值

1 2	ConcurrentHashMap<Object, Object> objectObjectConcurrentHashMap = new ConcurrentHashMap<>(); objectObjectConcurrentHashMap.put(null, null);

key 如果是null，key.hashCode() 会报空指针

部分原码


final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null,
                         new Node<K,V>(hash, key, value, null)))
                break;                   // no lock when adding to empty bin
        }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);
        else {
            V oldVal = null;
            synchronized (f) {}
            }
        }
}

Mysql数据库调优

发表于 2024-11-13 | 更新于 2025-09-14 | 分类于数据库

字数统计 | 阅读时长

数据库调优到底调什么？

调SQL语句：根据需求创建结构良好的SQL语句【实现同一个需求，SQL语句写法很多】
调索引：索引创建原则
调数据库表结构
调MySQL配置：最大连接数，连接超时，线程缓存，查询缓存，排序缓存，连接查询缓存…
调MySQL宿主机OS：TCP连接数，打开文件数，线程栈大小…
调服务器硬件：更多核CPU、更大内存
MySQL客户端：连接池（MaxActive，MaxWait），连接属性

前置工作：

1、数据库压力测试

配置数据库驱动
配置线程组
配置 JDBC 连接池
添加 JDBC 请求
添加结果监听器

2、客户端-连接池

连接池参数设置

MaxWait 参数表示从连接池获取连接的超时等待时间，单位毫秒。
MaxActive

正式调优

一、SQL语句优化

1、查看SQL执行计划【Explain】

id：SELECT识别符，这是SELECT查询序列号。
select_type：表示单位查询的查询类型，比如：普通查询、联合查询(union、union all)、子查询等复杂查询。
table：表示查询的表
partitions：使用的哪些分区（对于非分区表值为null）。
type（重要）表示表的连接类型。
possible_keys：此次查询中可能选用的索引
key：查询真正使用到的索引
key_len：显示MySQL决定使用的索引size
ref：哪个字段或常数与 key 一起被使用
rows：显示此查询一共扫描了多少行，这个是一个估计值，不是精确的值。
filtered: 表示此查询条件所过滤的数据的百分比
Extra：额外信息

2、索引优化

3、深分页LIMIT优化

4、子查询优化（减少子查询，多用join）

5、其他查询优化

小表驱动大表
避免全表扫描
WHERE条件中尽量不要使用not in语句，建议使用not exists
利用慢查询日志、explain执行计划查询、show profile查看SQL执行时的资源使用情况

6、SQL语句性能分析

二、数据库优化

1、慢查询日志

2、连接数max_connections

3、线程使用情况

4、数据库优化-结构优化

将字段很多的表分解为多个表
增加中间表
增加冗余字段

三、服务器层面的优化

1、缓冲区优化

修改buffer_pool

2、减少磁盘写入次数

3、MySQL数据库配置优化

4、服务器硬件优化

Mysql笔记

发表于 2024-11-13 | 更新于 2025-09-14 | 分类于数据库

字数统计 | 阅读时长

1、隔离级别

为什么mysql默认使用RR；

级别太高会影响并发度，太低会出现脏读现象；
最重要的是主从同步的问题；
当binlog的格式为statement时，binlog 里面记录的就是 SQL 语句的原文
为了兼容历史上的那种statement格式的bin log。
在RC情况下，主库因为隔离级别没有问题，但是从库会发生数据不一致的问题；
在RR中不会出现这种问题，是因为在其中存在间隙锁和临建锁，确保一个事务提交以后才能执行下一个事务；

2、RR和RC区别

只有这两个才会使用快照读；
在 RC 中，每次读取都会重新生成一个快照，总是读取行的最新版本

在数据库的 RC 这种隔离级别中，还支持”半一致读” ，一条update语句，如果 where 条件匹配到的记录已经加锁，那么InnoDB会返回记录最近提交的版本，由MySQL上层判断此是否需要真的加锁。

在 RC 中，只会对索引增加Record Lock，不会添加Gap Lock和Next-Key Lock。
在 RR 中，为了解决幻读的问题，在支持Record Lock的同时，还支持Gap Lock和Next-Key Lock；
所以 RC并发更好，减少锁的问题；

在RC 中读取到别的事务修改的值其实问题不太大的，只要修改的时候的不基于错误数据就可以了，所以我们都是在核心表中增加乐观锁标记，更新的时候都要带上锁标记进行乐观锁更新

Innodb的RR到底有没有解决幻读？

间隙锁解决了部分当前读的幻读问题；
MVCC解决了快照读的幻读问题；

MVCC

时机
在 RC 中，每次读取都会重新生成一个快照，总是读取行的最新版本。
在 RR 中，快照会在事务中第一次SELECT语句执行时生成，只有在本事务中对数据进行更改才会更新快照。

在同一个事务里面，如果既有快照读，又有当前读，那是会产生幻读的

MVCC只是解决了快照读中的欢度问题，但是对于当前读还是会有幻读的问题；
在RR中，如果本事务中发生了数据的修改，那么就会更新快照，那么最后一次查询的结果也就发生了变化。

间隙锁是导致死锁的一个重要原因

MVCC理解

并发问题：MVCC解决是读-写并发的问题；

快照读是MVCC实现的基础，而当前读是悲观锁实现的基础。

undo log是Mysql中比较重要的事务日志之一，顾名思义，undo log是一种用于回退的日志，在事务没提交之前，MySQL会先记录更新前的数据到 undo log日志文件里面，当事务回滚时或者数据库崩溃时，可以利用 undo log来进行回退。
针对一条记录的多个快照，通过隐藏主键+回滚指针生成一个快照链表
Read View 主要来帮我们解决可见性的问题的, 即他会来告诉我们本次事务应该看到哪个快照，不应该看到哪个快照。

本地缓存

发表于 2024-11-12 | 更新于 2025-09-14 | 分类于缓存

字数统计 | 阅读时长

多级缓存

多级缓存是通过在数据访问路径的不同层级上部署缓存来提高数据访问效率的技术。通常包括：

本地缓存：位于应用服务器本地，访问速度非常快，但容量有限。常用的本地缓存框架有Caffeine和Guava，它们提供了缓存过期策略、缓存项管理等高级功能。
分布式缓存：通常部署在多台服务器上，容量大，适合存储热点数据。常用的分布式缓存框架有Redis和Memcached。分布式缓存通过网络访问，速度比本地缓存慢，但提供了更高的可用性和可扩展性。

查询逻辑

在多级缓存系统中，查询数据的逻辑通常是：

首先查询本地缓存。
如果本地缓存未命中，则查询分布式缓存。
如果分布式缓存命中，则将结果存入本地缓存（通常称为“回写”或“预热”缓存）。
如果分布式缓存也未命中，则可能需要查询数据库或其他持久化存储。

代码示例

您提供的代码示例中有几个问题和遗漏，下面是修正后的版本：

public String query(String key) {
    // 查询本地缓存
    String localResult = localCache.get(key);
    if (localResult != null) {
        // 本地缓存命中，直接返回结果
        return localResult;
    }

    // 本地缓存未命中，查询分布式缓存
    String remoteResult = remoteCache.get(key);
    if (remoteResult != null) {
        // 分布式缓存命中，将结果存入本地缓存
        localCache.put(key, remoteResult); // 注意：这里需要指定key和value
        return remoteResult;
    }

    // 分布式缓存也未命中，这里可能需要处理，例如查询数据库
    // 注意：此示例未包含该逻辑

    // 如果没有其他数据源或查询失败，返回null或适当的默认值
    return null;
}

特殊场景：黑名单与Bloom Filter

对于某些特殊场景，如黑名单检查，可以使用Bloom Filter来进一步优化。Bloom Filter是一种空间效率很高的概率型数据结构，用于判断一个元素是否在一个集合中。它允许一定程度的假阳性（即判断为在集合中但实际上不在），但不会有假阴性（即判断为不在集合中但实际上在）。

在使用Bloom Filter作为本地缓存的场景中，如果Bloom Filter判断某个元素可能在集合中（即可能命中黑名单），则需要再次查询分布式缓存或数据库以确认。如果确认命中，则可以进行相应的处理；如果未命中，则可以直接返回结果。

这种组合使用Bloom Filter和分布式缓存的方法可以在保持高性能的同时，降低对分布式缓存的访问频率和带宽消耗。

你提出的问题涉及到了本地缓存一致性的保证方法，这是一个在使用本地缓存时经常需要考虑的问题。以下是对你问题的详细解答：

如何保证本地缓存的一致性？

本地缓存的一致性问题主要是由于数据在多个节点（或进程）间的不同步更新导致的。为了解决这个问题，我们可以采取以下几种策略：

使用版本号或时间戳：
- 当本地缓存更新时，将新的数据及其版本号或时间戳存储到数据库中。
- 其他节点在访问本地缓存时，先检查数据库中的版本号或时间戳，如果发现自己本地缓存的版本较旧，则从数据库中更新本地缓存。
借助配置中心：
- 当本地缓存更新时，将变更通知到配置中心。
- 配置中心将变更推送到所有相关节点，节点监听配置变化并更新本地缓存。
使用消息队列（MQ）：
- 当本地缓存更新时，发送一个广播消息到消息队列。
- 所有订阅了该消息的节点接收到消息后，更新自己的本地缓存。
设置合理的失效时长：
- 根据业务对数据一致性的需求，设置本地缓存的失效时长。
- 在失效时长内，本地缓存的数据是有效的，但可能不是最新的。失效后，查询将触发从分布式缓存或数据库中更新本地缓存。
使用自动更新策略：
- 一些缓存库（如Caffeine）支持自动更新策略。
- 可以配置定时刷新策略，让缓存库在后台定期从分布式缓存或数据库中更新数据。

注意事项：

评估数据变化频率：频繁更新的数据不适合放在本地缓存中。
评估业务一致性需求：根据业务需求决定是否使用本地缓存，以及能接受的不一致时长。
选择合适的缓存库：一些缓存库提供了丰富的配置选项，可以帮助更好地管理本地缓存。

RocketMQ消息分发：

RocketMQ支持两种消息模式：广播消费和集群消费。

广播消费：消息会发送给集群内的所有消费者，确保每个消费者都能收到消息。这种模式适用于需要向所有消费者广播消息的场景。
集群消费：消息只会被发送到集群中的一个消费者（根据负载均衡算法选择）。这种模式适用于需要处理大量消息且不需要每个消费者都收到所有消息的场景。

总结：

保证本地缓存的一致性是一个复杂的问题，需要根据业务需求和数据变化频率来选择合适的策略。在实际应用中，通常会结合多种策略来确保数据的一致性和系统的性能。同时，也需要关注缓存库的选择和配置，以充分利用其提供的特性来优化系统性能。

高并发下的缓存问题

发表于 2024-11-12 | 更新于 2025-09-14 | 分类于高并发

字数统计 | 阅读时长

在高并发的情况下，特别是当本地缓存（如 Guava, Caffeine 等）接到每秒 2000 万（QPS）的请求时，系统面临的挑战主要有两个方面：

缓存的读写性能瓶颈：即如何高效地处理大量的读写请求。
缓存的内存管理问题：如何合理利用内存，以应对大量数据的存储需求，并防止内存泄漏或过载。
为了应对这些挑战，可以采取以下几种优化和设计策略：

选择合适的本地缓存库
对于高并发场景，选择一个高效的本地缓存库至关重要。常见的库有：

Caffeine：一个高性能的 Java 本地缓存库，基于 Google 的 Guava，通过基于时间的过期策略和大小限制来管理缓存，并提供异步加载和弱引用缓存支持。
Guava：较为成熟的缓存库，但对于高并发处理可能稍逊色于 Caffeine。
Caffeine 的性能通常优于 Guava，尤其在处理大量并发请求时，它在缓存淘汰算法（如 LRU）和内存管理（如使用弱引用、自动过期等）上做了很多优化。

内存和缓存的容量管理
本地缓存的一个关键问题是如何管理缓存容量，尤其是在高并发时。可以通过以下方式进行优化：

设置合理的缓存大小限制：根据应用的内存容量设置合理的缓存大小，避免缓存占用过多内存导致的内存溢出。常见的策略是按大小（maximumSize）或按时间（expireAfterWrite）限制缓存大小。

LRU（Least Recently Used）策略：通过限制缓存条目的数量，当缓存的条目数超过限制时，自动淘汰最久未使用的数据。

自动过期（TTL）：为缓存数据设置一个过期时间（例如 expireAfterWrite 或 expireAfterAccess），避免缓存占用过多内存。

批量过期机制：在高并发环境下，可以通过批量清除缓存或定期刷新缓存来减少单个请求的压力。

缓存穿透、雪崩和击穿的处理
在高并发情况下，避免缓存穿透、缓存雪崩和缓存击穿是非常重要的：

缓存穿透：是指查询的数据在缓存和数据库中都不存在。为了避免这种情况，可以使用布隆过滤器（Bloom Filter）来快速判断某个数据是否存在，避免无效查询。

缓存雪崩：是指缓存中的大量数据在同一时刻过期，导致大量请求直接访问数据库。可以通过以下方式避免：

设置不同的过期时间（例如，随机化过期时间，避免所有缓存同时过期）。
使用后台异步更新机制，确保缓存能够及时更新。
缓存击穿：是指某一时刻大量并发请求访问同一缓存条目，导致缓存失效后直接访问数据库。可以通过以下方式避免：

使用锁机制（例如 ReentrantLock、synchronized 等）来确保只有一个请求能去加载数据，其他请求等待加载完成后共享缓存结果。
使用队列或信号量来限制并发请求对数据库的访问。
4. 使用异步加载和缓存预加载
在高并发场景下，异步加载缓存可以显著提高性能，避免同步加载带来的性能瓶颈。

异步加载：通过异步方式加载缓存数据，使得当缓存数据不存在时，其他线程可以并发等待数据的加载结果，而不是阻塞。

缓存预加载：对于一些访问频繁的数据，可以提前预加载到缓存中，避免高并发时大量缓存未命中的情况。

多级缓存策略
在高并发的情况下，采用多级缓存策略非常有效。例如：

本地缓存 + 分布式缓存：对于极其频繁的查询，使用本地缓存（如 Caffeine）进行快速响应；对于数据量较大、频率较低的查询，则使用分布式缓存（如 Redis）来保证数据的一致性和持久性。

本地缓存与二级缓存结合：当本地缓存未命中时，可以查询 Redis 等分布式缓存。若 Redis 中也没有，则最终回退到数据库。

限流与请求排队
在高并发环境中，可以使用限流和请求排队技术来避免请求过载，减少对本地缓存和数据库的压力。

限流：可以通过令牌桶或漏桶算法实现请求限流，确保系统不会因为过载而崩溃。
请求排队：对于高并发请求，可以通过队列对请求进行排队处理，保证系统的稳定性。
7. 监控与预警
在高并发情况下，必须监控缓存的使用情况、命中率、缓存大小和过期情况等，以便及时发现和处理性能瓶颈。

监控缓存命中率和缓存填充率，确保缓存系统的健康运行。
对缓存容量、加载时间、过期时间、缓存清除策略等进行实时监控，及时调整系统参数。
8. 分布式缓存的结合
在极高 QPS 的情况下，单机本地缓存可能无法承载如此大的流量，此时可以考虑使用分布式缓存（如 Redis、Memcached 等）作为备份或辅助缓存。

分布式缓存提供了跨机器的缓存能力，能有效扩展缓存容量和处理高并发的请求。
与本地缓存结合，采用分层缓存模型，将常用的数据放在本地缓存中，其他数据存储在 Redis 等分布式缓存中。

小结

当面对每秒 2000 万（QPS）的请求时，本地缓存和分布式缓存的设计需要特别注意：

使用高效的缓存库（如 Caffeine）来处理高并发的缓存读写。
合理设置缓存的大小限制和过期策略，避免内存溢出和缓存过载。
通过多级缓存、异步加载、缓存预加载和限流机制来减轻系统负载，确保系统的稳定性和性能。
缓存穿透、缓存雪崩和缓存击穿的问题也需要特别注意，通过布隆过滤器、过期时间随机化、加锁等机制来应对。
如果有更多关于高并发缓存设计的具体问题，随时可以提问！

AtomicInteger的实现方式及场景

发表于 2024-11-12 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌AtomicInteger的实现方式及场景

题目详细答案

AtomicInteger是 Java 中提供的一种用于在多线程环境下进行原子操作的类。它属于java.util.concurrent.atomic包，提供了一种无锁的线程安全方式来操作整数值。AtomicInteger基于底层的硬件原子操作（例如 CAS 操作）实现，确保在多线程环境中进行高效的数值更新。

AtomicInteger的实现方式

AtomicInteger通过使用 CAS（Compare-And-Swap）操作来实现原子性。CAS 是一种硬件级别的原子操作，能够确保在多线程环境下对变量进行无锁的更新。

底层变量：使用volatile关键字声明一个int类型的变量，确保变量的可见性。
CAS 操作：通过Unsafe类提供的原子操作方法来实现无锁更新。

import java.util.concurrent.atomic.AtomicInteger;

public class AtomicIntegerExample {
    private final AtomicInteger atomicInteger = new AtomicInteger(0);

    public void increment() {
        atomicInteger.incrementAndGet();
    }

    public int getValue() {
        return atomicInteger.get();
    }

    public static void main(String[] args) {
        AtomicIntegerExample example = new AtomicIntegerExample();

        Runnable task = () -> {
            for (int i = 0; i < 1000; i++) {
                example.increment();
            }
        };

        Thread t1 = new Thread(task);
        Thread t2 = new Thread(task);

        t1.start();
        t2.start();

        try {
            t1.join();
            t2.join();
        } catch (InterruptedException e) {
            e.printStackTrace();
        }

        System.out.println("Final value: " + example.getValue());
    }
}

在这个示例中，我们使用AtomicInteger实现了一个简单的计数器，并在两个线程中并发地对计数器进行自增操作。最终的结果是线程安全的。

AtomicInteger的主要方法

get(): 获取当前值。

set(int newValue): 设置当前值。

getAndSet(int newValue): 获取当前值，并设置为新值。

compareAndSet(int expect, int update): 如果当前值等于预期值，则将其设置为新值。

getAndIncrement(): 获取当前值，并自增。

incrementAndGet(): 自增，并获取自增后的值。

getAndDecrement(): 获取当前值，并自减。

decrementAndGet(): 自减，并获取自减后的值。

getAndAdd(int delta): 获取当前值，并加上指定的值。

addAndGet(int delta): 加上指定的值，并获取加后的值。

使用场景

计数器：在多线程环境中用于计数，例如统计请求数、用户数等。
序列生成器：生成全局唯一的序列号。
并发控制：用于实现并发控制机制，如限流器、资源池等。
状态管理：用于管理多线程环境下的共享状态，确保状态更新的原子性。
锁的替代：在某些情况下，可以使用AtomicInteger来替代传统的锁机制，减少锁竞争，提高性能。

优缺点

优点

高效：基于硬件级别的原子操作，性能高于使用锁的方式。
无锁：避免了锁竞争和上下文切换，减少了开销。
简单易用：提供了丰富的方法，简化了并发编程。

缺点

适用范围有限：适用于简单的数值更新操作，对于复杂的数据结构或操作，仍需要使用锁。
CAS 操作失败重试：在高并发情况下，CAS 操作可能会频繁失败，需要多次重试，影响性能。

原文: https://www.yuque.com/jingdianjichi/xyxdsi/vpbqzzcb5t0ur8hm

CAS与Synchronized的使用情景?

发表于 2024-11-12 | 更新于 2025-09-14 | 分类于面试

字数统计 | 阅读时长

👌CAS与Synchronized的使用情景?

题目详细答案

CAS（Compare-And-Swap）和synchronized是两种不同的并发控制机制，适用于不同的使用情景。

CAS（Compare-And-Swap）

特点：

无锁操作：CAS 是一种无锁的并发控制机制，不需要显式地获取锁。

高性能：由于不需要锁定资源，CAS 的性能通常比锁机制更高，尤其在高并发场景下。

乐观锁：CAS 基于乐观锁的思想，假设竞争不频繁，只有在检测到冲突时才会重试。

原子操作：CAS 操作是原子的，通常由硬件指令支持（如 x86 架构的cmpxchg指令）。

使用场景：

高并发场景：适用于需要高并发访问的场景，如计数器、自旋锁、无锁队列等。
轻量级操作：适用于操作简单且执行时间短的场景，因为 CAS 操作本身是原子的，但如果操作复杂，可能会导致频繁重试。
避免锁竞争：在锁竞争激烈的场景下，CAS 可以避免线程阻塞，提高系统的吞吐量。

示例：

使用AtomicInteger类实现 CAS 的示例：

import java.util.concurrent.atomic.AtomicInteger;

public class CASExample {
    private AtomicInteger counter = new AtomicInteger(0);

    public void increment() {
        int oldValue, newValue;
        do {
            oldValue = counter.get();
            newValue = oldValue + 1;
        } while (!counter.compareAndSet(oldValue, newValue));
    }

    public int getCounter() {
        return counter.get();
    }

    public static void main(String[] args) {
        CASExample example = new CASExample();
        example.increment();
        System.out.println(example.getCounter()); // 输出: 1
    }
}

synchronized

特点：

互斥锁：synchronized是一种互斥锁机制，确保同一时刻只有一个线程可以执行被锁定的代码块。

简单易用：synchronized是 Java 语言内置的关键字，使用简单，易于理解和维护。

阻塞操作：被锁定的线程会进入阻塞状态，直到获取到锁。

内存可见性：synchronized确保锁释放后，修改的变量对其他线程可见。

使用场景：

复杂操作：适用于需要对共享资源进行复杂操作的场景，确保操作的原子性和一致性。
低并发场景：适用于并发度不高的场景，因为synchronized会导致线程阻塞，进而影响性能。
需要内存可见性：适用于需要确保变量修改对其他线程立即可见的场景。

示例

public class SynchronizedExample {
    private int counter = 0;

    public synchronized void increment() {
        counter++;
    }

    public synchronized int getCounter() {
        return counter;
    }

    public static void main(String[] args) {
        SynchronizedExample example = new SynchronizedExample();
        example.increment();
        System.out.println(example.getCounter()); // 输出: 1
    }
}

CAS适用于高并发、轻量级操作和避免锁竞争的场景，具有高性能的优势，但可能会导致重试。synchronized适用于复杂操作、低并发场景和需要内存可见性的场景，使用简单，但会导致线程阻塞和性能下降。

原文: https://www.yuque.com/jingdianjichi/xyxdsi/ehiutd9peq73al3g

GitHub