前一陣子遇到一個問題,需要求x軸上的依次排開的一排矩形的最高的那條線,實際上就是所謂的“天際線問題”。當時為了解決這個問題抓耳撓腮,打了無數補丁,生了無數bug,最后還是不理想。后來參考了大神的方法,采用“排序+堆”的思想解決這個問題,但是他的文章中不是用python實現的,下面主要分享用python實現的過程。
另外這里鳴謝大佬,主要參考文章:
1)有關題設和解題思想:https://segmentfault.com/a/1190000003786782。
2)有關堆的解釋和構建 :http://www.lxweimin.com/p/d174f1862601。(有些地方有幾個Bug,構造代碼在源代碼基礎上略做改動)
一、題設:
顧名思義,求如下矩形最高點連成的線。也即求頂點的坐標。給定的是各個矩形的在橫軸上左坐標、右坐標、以及高度(其他格式的話也可做相應變換至上述格式)。
給定描述矩形格式為:
rectangles =[ [2 ,9 ,10], [3, 7 ,15], [5, 12, 12], [15 ,20 ,10], [19 ,24, 8] ]
每個list中從左至右分別為矩形在數軸上的左邊界、右邊界、高。
二、求解思路:
從矩形信息生成矩形左上右上頂點的坐標,并按x軸刻度從小到大排列;相同x刻度的,高度h小的靠前。定義一個堆存放各頂點的高度,通過堆來得知當前圖形的最高位置,最大堆的堆頂就是所有頂點中的最高點,只要這個點沒被移出堆,說明這個最高的矩形還沒結束。循環剛才排列好的list,對于左頂點,我們將其加入堆中。對于右頂點,我們找出堆中其相應的左頂點,然后移出這個左頂點,同時也意味這這個矩形的結束。判斷當堆頂元素發生變化時,記錄變化前和變化后的堆頂元素放入skyline list,最終list中存儲的即為天際線。
算法復雜度:
時間復雜度 O(NlogN) 空間復雜度 O(N)
三、Python 3 代碼:
##題設給定矩形
rectangles =[ [2 ,9 ,10], [3, 7 ,15], [5, 12, 12], [15 ,20 ,10], [19 ,24, 8] ]
import matplotlib.pyplot as plt
import math
import pandas as pd
from collections import deque
'''################Step-1 構造堆及相關方法################'''
def heap_sort(L):
L_length = len(L) - 1
first_sort_count = int(L_length / 2 )#有孩子節點的節點
for i in range(first_sort_count):
heap_adjust(L, first_sort_count - i, L_length)
'''
##原文生成升序排列的list,此處不需要,因此注釋掉
for i in range(L_length - 1):
L = swap_param(L, 1, L_length - i)
heap_adjust(L, 1, L_length - i - 1)
'''
return [L[i] for i in range(1, len(L))]
def swap_param(L, i, j):
L[i], L[j] = L[j], L[i]
return L
def heap_adjust(L, start, end):
temp = L[start]
i = start
j = 2 * i
while j <= end:
if (j < end) and (L[j] < L[j + 1]):
j += 1
if temp < L[j]:
L[i] = L[j]
i = j
j = 2 * i
else:
break
L[i] = temp
#構建入堆出堆函數
def heap_in(heap,item):#list,int
heap.append(item)
L = deque(heap)
L.appendleft(0)
#print(heap_sort(L))
heap=heap_sort(L)
return heap
def heap_out(heap,item):#list,int
heap.remove(item)
L = deque(heap)
L.appendleft(0)
#print(heap_sort(L))
heap=heap_sort(L)
return heap
'''################Step-2 處理數據并計算天際線################'''
#導入原始數據
data_pd=pd.DataFrame(rectangles)##,columns=['Li','Ri','Hi'])
#處理左右頂點
dta1=pd.DataFrame(data_pd.iloc[:,[0,2]])
dta1.columns =['x','h']
dta2=pd.DataFrame(data_pd.iloc[:,[1,2]])
dta2.columns =['x','h']
#為了標識左右頂點,將右頂點置為負數
dta2.h=-dta2.h
#拼接左右頂點
data=pd.concat([dta1,dta2],axis=0)
#排序
data=data.sort(columns = ['x','h'],axis = 0,ascending = True)
#初始化堆
heap=[]
skyline=[]
#地平線入堆
heap=heap_in(heap,0)
#生成天際線
for x,h in zip(data.x,data.h):
print(x,h)
tmp = heap[0]
if h>=0:
#左頂點入堆
heap=heap_in(heap,-h)
else:
#右頂點出堆
heap=heap_out(heap,-(-h))
if heap[0] != tmp:
skyline.append([x,abs(tmp)])
skyline.append([x,abs(heap[0])])
pd_skyline=pd.DataFrame(skyline)
'''###################Step-3 繪圖及可視化####################'''
#給定矩形坐標畫圖
def plot_ori_rec(rectangles):
data_pd=pd.DataFrame(rectangles,columns=['Li','Ri','Hi'])
l=len(rectangles)
fig = plt.figure()
ax = fig.add_subplot(111)
plt.xlim(0, max(data_pd.loc[:,'Ri'])*1.1 )
plt.ylim(0, max(data_pd.loc[:,'Hi'])*1.1 )
for rectangle,colorr in zip(rectangles,[x for x in 'rgb'*math.ceil(l/3)][0:l]):
Li=rectangle[0]
Ri=rectangle[1]
Hi=rectangle[2]
#print(Li,Ri,Hi)
rect = plt.Rectangle((Li,0), Ri-Li, Hi, color = colorr,alpha=0.3)#'r', alpha = 0.3)#左下起點,長,寬,顏色,不透明度
ax.add_patch(rect)
plt.show()
plot_ori_rec(rectangles)
#畫出天際線頂點
plt.scatter(pd_skyline[0],pd_skyline[1],color='r')
#畫出天際線
plt.plot(list(pd_skyline[0]),list(pd_skyline[1]),color='black')
最終效果:
長出一口氣,大功告成!!!
PS:
可視化的時候有個小插曲,發現用plt.plot畫線圖的時候,如果輸入的是dataframe就會首尾連接,如果是list就不會。。所以加個list()就好了,一臉懵逼。。。
PPS:
markdown調格式有點好玩哈哈哈。。。