時間:2021年03月20日 分類:電子論文 次數:
摘要:針對大范圍內住宅建筑圖斑自動識別較為困難的問題,該文提出基于決策樹模型的分類方法,利用基礎測繪中高精度的建筑數據、地理省情監測數據、POI數據、DSM、DEM、騰訊大數據等,以建筑物本身特征和建筑物不同鄰域內建筑類型相關因素的空間特征作為決策變量,分別采用QUEST、CHAID、C&RT和C5.0算法構建用于住宅分類識別的決策樹模型并進行優選。以濟南市(不含原萊蕪市)為研究區域進行了實驗,結果顯示4個模型均未出現過擬合現象,可以用于住宅建筑圖斑識別。
關鍵詞:住宅建筑;周邊特征;決策樹模型;C5.0;混淆矩陣;接受者操作性能曲線
0引言
近年來,隨著我國社會經濟的不斷發展,城市化進程進一步快速推進,尤其是城市地區土地利用類型中建設用地呈現增長趨勢。房屋建筑是人類活動最主要的場所,其數據信息在城市規劃[1]、人口估計[2]、應急救援與災害評估[3]等方面的應用中都具有極其重要的意義。
目前對于建筑物的提取研究已有多年,方法也較為成熟,主要方法有以下方面:基于模板匹配的地物提取方法[4]、基于知識的目標提取方法[5]、基于面向對象技術的方法[6]、基于知識和面向對象相結合的方法[7]、基于機器學習的方法[8-9]等。其中,基于機器學習的方法是近些年來研究的重點和熱點,常見的方法有決策樹分類、基于規則分類、神經網絡、支持向量機(supportvectormachine,SVM)和樸素貝葉斯分類等[10]。以上研究均為基于遙感數據的建筑物識別,主要目的是為了提取出建筑物數據,而對于建筑物更進一步的詳細類型則沒有進行劃分。
而建筑物中的住宅與人類生活息息相關,其分布和位置以及周邊設施等直接影響居民的生活質量,如果能獲取精細住宅建筑數據,那么對于居民生活環境分析、基礎設施均衡化評價、常住人口分布、政府規劃決策等方面提供精準有效的輔助支撐。目前,對于住宅建筑的識別也有一些研究,文獻[2]基于建筑物三維空間分布數據,運用面向對象分類方法剔除非住宅建筑物,得到住宅建筑分布數據;文獻[11]中通過對遙感影像進行目視解譯,通過矢量化方法提取居住建筑圖斑。這些方法都停留在結合地圖和實地調查或者影像的目視解譯層面,提取數據效率低,人工工作量大,不適于大范圍區域。近些年,我國的基礎測繪建設逐漸完善,成果資源豐碩,對于海量數據的深度挖掘與應用也是近些年測繪行業關注和探索的重點。
本次研究以山東省濟南市(不包含原萊蕪市)范圍內基礎測繪中高精度的建筑基底圖斑數據為基礎,結合地理省情監測數據、興趣點(pointofinformation,POI)數據、數字地表模型(digitalsurfacemodel,DSM)、數字高程模型(digitalelevationmodel,DEM)、騰訊大數據等,按照城市和農村不同區域,實現住宅建筑識別,探討和研究濟南市住宅建筑圖斑高效提取方法及其分布形態。由于具有可讀性、分類速度快、能夠生成分類規則集等優點,因此本研究選擇決策樹算法進行建模。
1研究區域
濟南市位于山東省中部,是山東省省會城市,地理位置介于36°01′~37°32′N,116°11′~117°44′E,面積7998km2;南部為泰山山地,北部為黃河平原,背山面水,地勢南高北低,地形復雜多樣[12]。
2018年年底濟南市常住人口746.04萬人,戶籍人口655.90萬人,全市地區生產總值7856.56億元[13]。濟南市地表覆蓋類型以種植業為主,其次為林草覆蓋和房屋建筑(區),房屋建筑(區)主要集中在濟南市中部低海拔平原地區。2019年1月,原萊蕪市所轄區域劃歸濟南市,由于本次研究數據現勢性主要為2018年,所以研究區域為未進行行政區劃調整前的濟南市范圍。
2數據來源
2.1基礎測繪數據
基礎測繪數據是測繪行業最全面、基礎的數據成果,特別是及時更新矢量數據,已經實現每年甚至更短時間的更新頻率,具有較強的現勢性。本文采用基礎測繪及時更新數據中的建筑基底面狀數據作為基礎數據;此外,POI數據是最重要的輔助數據。數據現勢性為2018年。
2.2地理省情監測數據采用房屋建筑(區)和城鎮綜合功能單元、城市空間格局數據。數據現勢性為2018年6月30日。
2.3激光點云數據和DEM數據利用激光點云數據中的DSM數據,結合DEM數據,可以獲取建筑物高度信息。DSM和DEM現勢性分別為2014年、2015年。
2.4騰訊位置大數據社交位置數據與人類活動有很強的相關性,獲取騰訊大數據平臺上濟南市范圍內社交位置數據,按照白天和晚上不同時段進行獲取,即從一定程度上可以反映人為活動及聚集密度。數據現勢性為2018年7月。
3研究方法
濟南市建筑物圖斑約1.6×106個,涵蓋住宅、工商企業、機關單位、公共設施等類別的建筑物,還包括一些附屬建筑和臨時性建筑。本次研究目的主要為從海量建筑基底圖斑中識別出住宅建筑圖斑數據,因此對于非住宅類的建筑數據不再進行詳細劃分。而由于不同區域住宅建筑在形狀、高度、聚集情況等有所差異,需要按照區域及住宅不同的類型建立多層次的分類系統。
3.1特征變量選擇
用于住宅識別的變量首先應當包括建筑物自身的屬性特征,包括幾何屬性和通過其他數據獲取的屬性。此外,地理學第一定律和地理學第二定律分別說明了事物的空間相關性和空間異質性,本文引入了大量的周邊空間特征變量,根據住宅建筑自身及周邊位置事物之間的關系特征進行識別。
3.1.1建筑物圖斑特征
建筑物圖斑特征即建筑物圖斑自身特征,包括建筑自身的幾何特征和由其他數據確定的屬性特征。幾何特征變量主要有:層數、面積、周長、節點數、朝向(與正北方向夾角)、長寬、形狀因子等。
3.2決策樹分類算法模型選取
決策樹模型是通過訓練形成一組決策規則并且可以對未知對象進行預測或分類的樹狀系統,它主要包括兩個階段:分裂和剪枝。決策樹的構建過程是一種從上向下、遞歸分治的過程,先根據特征變量選擇最有效的樣本集劃分方式,形成新的決策分支;后對分支進行修剪來優化決策樹。常見的決策樹分類算法有以下方面。
1)卡法自動交互檢測算法(chi-squaredautomaticintera-ctiondetector,CHAID)。CHAID[14]算法是一種使用卡方統計選擇特征變量(卡方值最顯著特征),從而建立決策樹的分類方法,其特征變量選擇和分支點選擇同時進行。剪枝策略為預剪枝。2)快速無偏有效的統計樹(quickunbiasedefficientstat-isticaltree,QUEST)。QUEST[15]算法是對CHIAD的改進,該算法將特征變量選擇和分支點選擇分開進行。如果特征變量為分類變量,則采用卡方檢驗;如果特征變量為有序或連續變量,則使用F檢驗;選擇P值最小且小于顯著水平α的特征變量作為當前最佳分支變量。剪枝策略為后剪枝。
4結果與分析
4.1決策樹分類模型精度評價
采用決策樹分類模型,對城區、農村分區域進行建模,訓練集、驗證集的混淆矩陣正確率。可以看出,4個決策樹分類模型中,C5.0模型的精度最高。訓練集、測試集精度分別為城區96.6%、94.81%,農村97.73%、95.14%。農村地區模型略優于城區。其他3類模型精度差異不大,均未超過90%,遠低于C5.0模型。所以C5.0模型更適用于建筑物識別分類。
5結束語
本文利用測繪行業多源、多尺度數據,基于多種決策樹模型,實現濟南市城市和農村不同區域建筑物圖斑分類識別,并且對模型結果做精度比對評價,實現了對測繪大數據的有效挖掘,同時也拓寬了現有地理信息數據的維度,對地理省情監測統計分析等應用工作進行了有效的探索。
計算機論文范例:計算機應用技術與信息管理的整合
主要結論如下:本文用于建筑物圖斑識別的變量除了建筑物自身屬性特征外,結合地理學第一定律,引入了周邊不同緩沖空間范圍內其他影響因地區和農村地區分類特征變量重要性進行分析,城市地區建筑物圖斑識別特征變量重要性前6位依次為:層高、地表覆蓋類型、節點數、周邊100m內建筑物數量、周邊50m建筑物數量、寬等;而農村地區依次為周邊50mPOI數、地表覆蓋類型、距離辦公商業最近距離、距離交通運輸點距離、面積、周邊50m道路總段數等。
可以看出:城市和農村用于識別的特征變量有較大差別,城市地區特征變量貢獻比較大的為建筑物自身特征,說明城市住宅和非住宅建筑物細節特征差異比較明顯;而農村地區建筑自身細節差別較小,需要依據周邊特征幫助區分。
參考文獻
[1]李垚,趙衛東,衛剛.城市規劃建筑圖紙電子報批系統實施與關鍵技術[J].計算機應用,2007,27(S2):242-243.(LIYao,ZHAOWeidong,WEIGang.Implementationandkeytechnologyofelectronicapprovalsystemforurbanplanningandbuildingdrawings[J].JournalofComputerApplications,2007,27(S2):242-243.)
[2]卓莉,黃信銳,陶海燕,等.基于多智能體模型與建筑物信息的高空間分辨率人口分布模擬[J].地理研究,2014,33(3):520-531.(ZHUOLi,HUANGXinrui,TAOHaiyan,etal.Highspatialresolutionpopulationdistributionsimulationbasedonbuildinginformationandmulti-agent[J].GeographicalResearch,2014,33(3):520-531.)
[3]眭海剛,劉超賢,黃立洪,等.遙感技術在震后建筑物損毀檢測中的應用[J].武漢大學學報(信息科學版),2019,44(7):1008-1019.(SUIHaigang,LIUChaoxian,HUANGLihong,etal.Applicationofremotesensingtechnologyinearthquake-inducedbuildingdamagedetection[J].GeomaticsandInformationScienceofWuhanUniversity,2019,44(7):1008-1019.)
作者:牛宵