Leetcode460. LFU 缓存

题目描述

请你为 最不经常使用(LFU)缓存算法设计并实现数据结构。

实现 LFUCache 类:

  • LFUCache(int capacity) - 用数据结构的容量 capacity 初始化对象
  • int get(int key) - 如果键存在于缓存中,则获取键的值,否则返回 -1。
  • void put(int key, int value) - 如果键已存在,则变更其值;如果键不存在,请插入键值对。当缓存达到其容量时,则应该在插入新项之前,使最不经常使用的项无效。在此问题中,当存在平局(即两个或更多个键具有相同使用频率)时,应该去除 最近最久未使用 的键。

注意「项的使用次数」就是自插入该项以来对其调用 getput 函数的次数之和。使用次数会在对应项被移除后置为 0 。

为了确定最不常使用的键,可以为缓存中的每个键维护一个 使用计数器 。使用计数最小的键是最久未使用的键。

当一个键首次插入到缓存中时,它的使用计数器被设置为 1 (由于 put 操作)。对缓存中的键执行 getput 操作,使用计数器的值将会递增。

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
输入:
["LFUCache", "put", "put", "get", "put", "get", "get", "put", "get", "get", "get"]
[[2], [1, 1], [2, 2], [1], [3, 3], [2], [3], [4, 4], [1], [3], [4]]
输出:
[null, null, null, 1, null, -1, 3, null, -1, 3, 4]

解释:
// cnt(x) = 键 x 的使用计数
// cache=[] 将显示最后一次使用的顺序(最左边的元素是最近的)
LFUCache lFUCache = new LFUCache(2);
lFUCache.put(1, 1); // cache=[1,_], cnt(1)=1
lFUCache.put(2, 2); // cache=[2,1], cnt(2)=1, cnt(1)=1
lFUCache.get(1); // 返回 1
// cache=[1,2], cnt(2)=1, cnt(1)=2
lFUCache.put(3, 3); // 去除键 2 ,因为 cnt(2)=1 ,使用计数最小
// cache=[3,1], cnt(3)=1, cnt(1)=2
lFUCache.get(2); // 返回 -1(未找到)
lFUCache.get(3); // 返回 3
// cache=[3,1], cnt(3)=2, cnt(1)=2
lFUCache.put(4, 4); // 去除键 1 ,1 和 3 的 cnt 相同,但 1 最久未使用
// cache=[4,3], cnt(4)=1, cnt(3)=2
lFUCache.get(1); // 返回 -1(未找到)
lFUCache.get(3); // 返回 3
// cache=[3,4], cnt(4)=1, cnt(3)=3
lFUCache.get(4); // 返回 4
// cache=[3,4], cnt(4)=2, cnt(3)=3

提示:

  • 0capacity,key,value1040 \leq capacity, key, value \leq 10^4
  • 最多调用 $10^5 $次 getput 方法

**进阶:**你可以为这两种操作设计时间复杂度为 O(1) 的实现吗?

解题思路

首先得定义一个缓存的结点结构:

1
2
3
4
5
6
7
struct Node
{
int key;
int value;
int frenquency;
Node(int _key,int _value,int _frequency):key(_key),value(_value),frenquency(_frequency){}
};

里面包含keyvaluefrenquency信息。

如果要让get操作达到O(1)O(1)的时间复杂度,缓存结点可以存储在动态数组或者哈希表中。但是如果用动态数组存储的话,put操作肯定无法达到O(1)O(1)的时间复杂度。要使put操作达到O(1)O(1)的时间复杂度,得用双向链表来组织缓存结点。所以,如果要让putget操作同时达到O(1)O(1)的时间复杂度,我们可以考虑用哈希表+双向链表的方式来实现。

首先定义一个frequency_table哈希表,索引为频率frenquency,每一个索引存放一个双向链表,这个双向链表里面存放所有使用频率为frenquency的缓存。每一次添加的时候在这个双向链表的头部进行插入,在删除的时候在双向链表的尾部删除,这样就可以实现访问时间的有序排列,用于实现LFU。然后我们还需要定义一个变量来记录最小的使用频率minfreq,用于删除操作。

接着,我们还需要定义一个key_table的哈希表,索引为key,每一个索引存放这key值对应的frequency_table中链表的具体节点内存地址。然后利用这两个哈希表就可以让putget操作同时达到O(1)O(1)的时间复杂度。

对于 get(key) 操作,我们能通过索引keykey_table 中找到缓存在 frequency_table 中的链表的结点的内存地址,如果不存在直接返回 -1,否则我们能获取到对应缓存的相关信息,这样我们就能知道缓存的键值还有使用频率,直接返回 key 对应的值即可。但是,进行一次get(key)操作,这个缓存的使用频率就要加一,同时就需要更新这两个哈希表的值。还有可能需要更新minfreq的值。在整体的操作中,都是常数时间的复杂度,所以时间复杂度为O(1)O(1)

对于 put(key, value) 操作,我们先通过索引 key key_table 中查看是否有对应的缓存,如果有的话,其实操作s类似于 get(key) 操作,唯一的区别就是我们需要将当前的缓存里的值更新为 value。如果没有的话,相当于是新加入的缓存,如果缓存已经到达容量,需要先删除最近最少使用的缓存,再进行插入。

先考虑插入,由于是新插入的,所以缓存的使用频率一定是 1,所以我们将缓存的信息插入到 frequency_table1 索引下的列表头即可,同时更新key_table[key]的信息,以及更新 minfreq = 1

那么剩下的就是删除操作了,由于我们实时维护了 minfreq,所以我们能够知道 frequency_table 里目前最少使用频率的索引,同时因为我们保证了链表中从链表头到链表尾的插入时间是有序的,所以frequency_table[minfreq]的链表中链表尾的节点即为使用频率最小且插入时间最早的节点,我们删除它同时根据情况更新 minfreq ,整个时间复杂度均为 O(1)O(1)

具体细节如下述代码所述:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
struct Node
{
int key;
int value;
int frenquency;
Node(int _key,int _value,int _frequency):key(_key),value(_value),frenquency(_frequency){}
};

class LFUCache {
public:
LFUCache(int _capacity) {
capacity=_capacity;
minfreq=0;
frequency_table.clear();
key_table.clear();
}

int get(int key) {
if(capacity==0) return -1;
auto it=key_table.find(key);
if(it==key_table.end()) return -1;
auto node=it->second;
int val=node->value;
int freq=node->frenquency;
//删除操作
frequency_table[freq].erase(node);
if(frequency_table[freq].size()==0)
{
//记录freq频率的双链表没结点了
frequency_table.erase(freq);
if(minfreq==freq) minfreq++;
}
//添加结点
frequency_table[freq+1].push_front(Node(key,val,freq+1));
key_table[key]=frequency_table[freq+1].begin();
return val;
}

void put(int key, int value) {
if(capacity==0) return;
auto it=key_table.find(key);
//key表中找不到值,分缓存满和不满两种情况
if(it==key_table.end())
{
//缓存已经满的情况
if(key_table.size()==capacity)
{
auto it2=frequency_table[minfreq].back();
key_table.erase(it2.key);
frequency_table[minfreq].pop_back();
if(frequency_table[minfreq].size()==0)
{
frequency_table.erase(minfreq);
}
}
//两种情况都要添加操作,所以合并在一起
frequency_table[1].push_front(Node(key,value,1));
key_table[key]=frequency_table[1].begin();
minfreq=1;
}
else{
//如果表中存在,需要更新frequency的值
auto node=it->second;
int freq=node->frenquency;
//删除操作
frequency_table[freq].erase(node);
if(frequency_table[freq].size()==0)
{
//记录freq频率的双链表没结点了
frequency_table.erase(freq);
if(minfreq==freq) minfreq++;
}
//添加结点
frequency_table[freq+1].push_front(Node(key,value,freq+1));
key_table[key]=frequency_table[freq+1].begin();
}
}

private:
int minfreq;
int capacity;
unordered_map<int,list<Node>>frequency_table;
unordered_map<int,list<Node>::iterator>key_table;
};

时间复杂度:putget操作都为O(1)O(1)

空间复杂度:O(capacity)O(capacity)