leetcode [295] 数据流的中位数
Contact me:
Blog -> https://cugtyt.github.io/blog/index
Email -> cugtyt@qq.com
GitHub -> Cugtyt@GitHub
中位数是有序列表中间的数。如果列表长度是偶数,中位数则是中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
void addNum(int num) - 从数据流中添加一个整数到数据结构中。
double findMedian() - 返回目前所有元素的中位数。
示例:
addNum(1)
addNum(2)
findMedian() -> 1.5
addNum(3)
findMedian() -> 2
进阶:
如果数据流中所有整数都在 0 到 100 范围内,你将如何优化你的算法?
如果数据流中 99% 的整数都在 0 到 100 范围内,你将如何优化你的算法?
来自题解:
排序当然可以,但是如果要优化时间复杂度的话,可以考虑堆。堆的插入可以做到对数。这里维护两个堆,两个堆的容纳量差不超过1,一个最大堆存中位数左边的,一个最小堆存中位数右边的。计算的时候,只需要考虑两个堆的顶点即可。注意插入代码的细节。
import heapq
class MedianFinder:
def __init__(self):
self.left = [] # 最大堆,小于中位数
self.right = [] # 最小堆,大于中位数
def addNum(self, num: int) -> None:
# 先插入左边堆,我们的目标是 右边堆数量>= 左边堆数量
heapq.heappush(self.left, -num)
# 如果说右边为空,或者插入左边后出现大小问题,或者数量有偏差,那么弹出左边堆的最大值,插入右边堆
if not self.right or -self.left[0] > self.right[0] or len(self.left) > len(self.right):
tmp = heapq.heappop(self.left)
heapq.heappush(self.right, -tmp)
# 注意,如果插入的数据一直递增,导致右侧堆偏斜,因此需要检查右侧堆是否太大
if len(self.right) - len(self.left) > 1:
tmp = heapq.heappop(self.right)
heapq.heappush(self.left, -tmp)
def findMedian(self) -> float:
leng = len(self.left) + len(self.right)
if leng == 0: return 0
if leng % 2 != 0:
return self.right[0]
else:
return (self.right[0] - self.left[0]) / 2