資源整理。
1 Coding:
1.開源項目openeo api。oponEO開發(fā)了一個開放的API,以簡單統(tǒng)一的方式將R,python和javascript客戶端連接到對地觀測大數(shù)據(jù)云平臺的后臺。 此存儲庫包含此API,即oponEO(核心)API。
2.開源項目quantized mesh viewer,在Cesium中渲染自定義量化網(wǎng)格瓦片并使用THREE.js渲染器調(diào)試單個瓦片。
3.開源項目spade,rust語言的空間數(shù)據(jù)結(jié)構(gòu)。
4.用TensorFlow進行機器學習書籍附帶TensorFlow機器學習的源代碼。有關(guān)代碼說明,請參閱本書。
5.R語言包ggsoccer,ggplot2的拓展包,用于繪制足球場及足球賽事的包。
6.開源項目firspaper,關(guān)于寫第一篇論文的很多東西。很切實的經(jīng)驗之談。值得關(guān)注。
7.R語言包datapasta,一個幫助在不同平臺復制粘貼的包。
8.R語言包rgeopat2,支持使用'GeoPAT'2軟件處理的空間數(shù)據(jù)分析。
9.開源項目weathercontext,twitter上的機器人,每天中午定時發(fā)布天氣信息,同時也可以查詢歷史天氣(來自ECMWF的ERA-interim數(shù)據(jù))。
10.R語言包geojsonsf,R中GeoJSON和Simple Feature對象之間的簡單,低依賴性和快速轉(zhuǎn)換工具。
11.R語言包adaptMCMC,通用自適應(yīng)蒙特卡羅馬爾可夫鏈采樣器的R語言實現(xiàn)。
12.R語言包usmap,在R中創(chuàng)建包括阿拉斯加和夏威夷在內(nèi)的美國地圖。
13.R語言包s2,用于橢球體的Google s2庫的R接口。
14.開源項目TheGeolocationManual,R markdown組織的文件,應(yīng)該跟Geolocation相關(guān)的內(nèi)容。詳情見倉庫。
15.Fotran庫LAPACK,用于解決數(shù)值線性代數(shù)中最常出現(xiàn)的問題。
16.R語言包pkgdown,用于生成R包的靜態(tài)網(wǎng)頁。
17.node建立的自然語言處理庫,具有實體提取,情感分析,自動語言識別等功能。
18.開源項目KivyMD,Kivy Material Design標準的小部件的集合。
19.用于ODSC介紹貝葉斯工作流的幻燈片和材料。
20.開源項目NUTS,來自Hoffman&Gelman的2011年無轉(zhuǎn)換采樣器(NUTS)的python版本。
21.R語言包cowsay,R中有更多動物的cowsay。就是用注釋畫出動物的樣子。
22.R語言包lato,使用'Lato'字體的最小和靈活的'ggplot2'主題。
23.QGIS的Google Earth Engine插件。
2 Paper:
繪制紅樹林的范圍和物種對于了解它們對環(huán)境變化的反應(yīng)以及觀察其提供商品和服務(wù)的完整性非常重要。然而,準確繪制紅樹林范圍和物種是遙感的持續(xù)挑戰(zhàn)。新推出的可自由使用的Sentinel-2(S2)傳感器為這些挑戰(zhàn)提供了新的機會。本研究首次開展了一項研究,旨在研究中國東寨港第一個國家紅樹林自然保護區(qū)紅樹林范圍和物種的原始條帶,光譜指數(shù)和紋理信息。為了繪制紅樹林的范圍和物種,利用和修改了基于紅樹林生態(tài)系統(tǒng)的空間結(jié)構(gòu)和基于地理對象的圖像分析的三級層次結(jié)構(gòu)。在實驗過程中,為了克服優(yōu)化高維和相關(guān)特征空間的挑戰(zhàn),引入了遞歸特征消除(RFE)算法。最后,基于隨機森林算法,來自RFE的所選特征被用于紅樹林物種鑒別。將結(jié)果與Landsat 8(L8)和Pléiades-1(P1)數(shù)據(jù)進行了比較,結(jié)果表明S2和L8可以準確地提取紅樹林的范圍,但P1顯然高估了它。關(guān)于紅樹林物種群落水平,S2的總體分類準確度為70.95%,低于P1圖像(78.57%),略高于L8數(shù)據(jù)(68.57%)。同時,前者差異具有統(tǒng)計顯著性,后者則不然。優(yōu)勢物種基本上是在S2和P1圖像中提取的,這些特征對于紅樹林物種鑒別是最重要的。最重要的特征是紅光波段,其次是短波紅外,近紅外,藍光和其他可見光波段。這項研究表明S2傳感器可以準確地繪制紅樹林的范圍,并基本上區(qū)分紅樹林物種群落,但對于后者,由于紅樹林物種的復雜性,應(yīng)該謹慎。遙感影像在紅樹林提取方面的成果。事實證明哨兵的數(shù)據(jù)在提取范圍上準確度較高,而提取物種上卻效果不佳。從與Landsat 8和Pléiades-1的比較來看,相信未來紅樹林遙感制圖的關(guān)鍵是這幾個多源衛(wèi)星的信息融合。
空氣污染流行病學研究越來越依賴于高分辨率暴露預測模型。但是,到目前為止,很少有這種類型分辨率的數(shù)據(jù)可供在中國使用。目標:我們制定了國家土地利用回歸模型(LUR),以估算中國2014年至2016年的月平均PM2.5,PM10和NO2。方法:我們使用廣義加性混合模型開發(fā)了時空半?yún)?shù)模型。模型中包括各種預測變量:時變氣象數(shù)據(jù),Globaland 30的高分辨率土地覆蓋數(shù)據(jù),氣溶膠光學深度的衛(wèi)星測量和地理信息系統(tǒng)(GIS)衍生的預測變量。我們使用兩種交叉驗證(CV)方法評估模型性能,包括保持CV和10折CV。結(jié)果:在1382個監(jiān)測點進行了超過22,000次月度觀測,以估算空氣污染暴露情況。時變空間項解釋了87%,71%和69%的變異性,PM2.5,PM10和NO2模型的保持交叉驗證R2分別為0.85,0.62和0.62。模型顯示,氣象變量,人口密度,海拔,道路距離和土地覆蓋類型是空氣污染暴露的重要預測因子。結(jié)論:我們開發(fā)了一種新的全國范圍的模型來估算居住水平的空氣污染暴露,可用于研究空氣污染的慢性不利影響。LUR的全國尺度上的研究,并且涵蓋了三大關(guān)鍵大氣污染物,比較扎實的研究。且是比較高時間分辨率(月)的LUR。
隔離涉及一個以上的人口群體,隔離措施量化了不同人口群體在空間中的分布方式。隔離研究的關(guān)鍵概念和方法論基礎(chǔ)之一是考慮跨地區(qū)單位的兩個或更多人口群之間空間相互作用的潛力。這個基礎(chǔ)意味著需要一種空間方法來描繪鄰居之間的空間(以及社會)互動。通常,簡單的百分比(例如,黑色百分比)不是隔離的量度。由于地方空間隔離措施直到最近才出現(xiàn),本文的目標有三個:(1)解釋用于測量鄰域(或地方)層面隔離水平的空間方法,(2)證明不足之處。使用一定比例的種族/族裔群體作為隔離措施,以及(3)澄清兩種常用的不同和多樣性指數(shù)的適當性。來自密蘇里州圣路易斯和伊利諾伊州芝加哥的數(shù)據(jù)用于討論這三點。一個偏向社會學的GIS應(yīng)用,似乎是涉及到種族隔離方面的研究。
室外空氣污染是全球的主要殺手,也是中國疾病負擔的第四大因素。中國是世界上人口最多的國家,每年空氣污染死亡人數(shù)最多,但中國現(xiàn)有國家空氣污染估算的空間分辨率普遍較低。我們通過開發(fā)和評估中國的國家經(jīng)驗模型(包括土地利用回歸(LUR),衛(wèi)星測量和普遍克里金法(UK))來解決這一research gap。我們用幾種方法測試得到的模型,包括(1)比較使用前向逐步回歸與偏最小二乘(PLS)回歸開發(fā)的模型,(2)比較使用和不使用衛(wèi)星測量開發(fā)的模型,使用和不使用UK,以及( 3)10倍交叉驗證(CV),以省為單元的留一交叉驗證(LOPOCV)和以城市為單元的留一交叉驗證(LOCOCV)。衛(wèi)星數(shù)據(jù)和克里金法在使預測更準確方面具有互補性:克里金法改進了良好采樣區(qū)域的模型;衛(wèi)星數(shù)據(jù)大大提高了遠離監(jiān)視器的位置的性能。逐步前向選擇與10倍CV中的PLS類似地執(zhí)行,但是優(yōu)于LOPO-CV中的PLS。我們的最佳模型采用前向選擇和UK,我們?yōu)橹袊哪昶骄鶟舛戎谱髁说谝粋€高分辨率國家LUR模型。模型應(yīng)用于1 km網(wǎng)格以支持未來的研究。 2015年,超過80%的中國人口居住在超過中國國家PM2.5標準的地區(qū),這里的結(jié)果將公開,可能對環(huán)境健康研究有用。類似于上面第二篇的土地利用回歸模型。不過這篇增加了和人口相關(guān)的研究,切實地做到了暴露的研究。
5.Thermal evaluation of urbanization using a hybrid approach/使用混合方法對城市化進行熱評估
城市發(fā)展增加了建筑物和路面的徑流溫度,這可能對水生生物有害。但是,我們根據(jù)土地利用預測徑流溫度的能力有限。本文探討了可用于模擬徑流溫度的工具,這是一種敏感物種溪鱒(Salvelinus sp。)。明尼蘇達城市熱量輸出工具(MINUHET)和暴雨水管理模型(SWMM)被應(yīng)用于弗吉尼亞州布萊克斯堡附近的Stroubles Creek流域的14.1平方公里的部分,持續(xù)兩個夏天。流量,水溫和天氣數(shù)據(jù)來自Virginia Tech StREAM實驗室(流研究,教育和管理)監(jiān)測站。 SWMM和MINUHET分別針對流量和流溫度進行校準和驗證。模型對不透水性(SWMM預測的流量)和露點溫度(MINUHET預測的水溫)敏感。雖然模型輸出時間步長為15分鐘,但使用Nash-Sutcliffe效率(NSE)按小時時間步長評估模擬流量流中的模型性能。 SWMM的NSE值分別為0.67和0.65,校準和驗證期間的MINUHET分別為0.62和0.57,表明SWMM在流量模擬中的表現(xiàn)優(yōu)于MINUHET。在驗證期間使用MINUHET模擬流溫度,NSE值為0.58,證明了令人滿意的水溫模擬。由于SWMM不能進行簡單混合以外的溫度模擬。 SWMM和MINUHET的水文和熱輸出以混合方式組合,強調(diào)每個相應(yīng)模型的強度,即SWMM用于徑流和徑流,MINUHET用于水溫。使用MINUHET和Hybrid模型模擬熱負荷;混合模型(0.56)單獨使用比MINUHET(0.45)更大的NSE。 MINUHET預測表明,在校準和驗證期分別為39%和38%的情況下,水溫將超過21°C的鱒魚毒性閾值。由于觀察到的溫度分別超過了校準和驗證期的59%和53%的毒性閾值,因此MINUHET不是溫度持續(xù)時間超過毒性閾值的保守預測因子。小尺度城市化與徑流溫度對物種危害的研究,耦合了兩個模型。
在過去的研究中,個人環(huán)境暴露主要是以靜態(tài)方式測量的。在這項研究中,我們開發(fā)并實施一個動態(tài)表示環(huán)境背景(環(huán)境背景立方體)的分析框架,并有效地整合個人日常運動(行為時空軌跡),以準確地推導出個人環(huán)境暴露(環(huán)境背景暴露指數(shù))。該框架用于檢查食物環(huán)境暴露與46名參與者的超重狀態(tài)之間的關(guān)系,使用俄亥俄州哥倫布市的全球定位系統(tǒng)(GPS)收集的數(shù)據(jù)和二元邏輯回歸模型。結(jié)果表明,與其他廣泛使用的方法相比,所提出的框架可以對個體食物環(huán)境暴露產(chǎn)生更可靠的測量。考慮到個體環(huán)境暴露的復雜空間和時間動態(tài),擬議的框架也有助于緩解不確定的地理環(huán)境問題(UGCoP)。它可用于其他環(huán)境健康研究,涉及環(huán)境影響廣泛的健康行為和結(jié)果。關(guān)美寶老師團隊的新文章,關(guān)注的是個體食物環(huán)境暴露與時空軌跡相關(guān)的研究。近期連續(xù)看到兩篇關(guān)美寶老師團隊相關(guān)的文章。食物環(huán)境暴露是一個比較新的話題,值得關(guān)注。屬于環(huán)境健康方面的另一個研究,但是之前見過一些做城市代謝研究的似乎也略有涉及。
矩陣分解是推薦系統(tǒng)中最常用的方法之一。但是,它面臨著與興趣點(POI)建議中的登記數(shù)據(jù)相關(guān)的兩個挑戰(zhàn):數(shù)據(jù)稀缺性和隱式反饋。為解決這些問題,本文提出了一種特征空間分離因子分解模型(FSS-FM)。該模型將POI要素空間表示為單獨的切片,每個切片代表一種特征。因此,可以容易地添加空間和時間信息以及其他上下文以補償稀缺數(shù)據(jù)。此外,將因子分解模型的兩個常用目標函數(shù)(加權(quán)最小二乘和成對排序函數(shù))組合以構(gòu)建混合優(yōu)化函數(shù)。對兩個真實數(shù)據(jù)集進行了廣泛的實驗:Gowalla和Foursquare,并將結(jié)果與基線方法的結(jié)果進行比較以評估模型。結(jié)果表明,F(xiàn)SS-FM在兩種數(shù)據(jù)集的精確度和召回率方面均優(yōu)于最先進的方法。具有單獨特征空間的模型可以改善推薦的性能。包含空間和時間上下文進一步利用了性能,空間上下文比時間上下文更有影響力。此外,還證明了混合優(yōu)化在改進POI推薦方面的能力。推薦系統(tǒng)算法和VGI數(shù)據(jù)的結(jié)合,事實上POI作為關(guān)鍵的地圖導航點,對模糊搜索之類的功能有很高的要求,因此這個研究是相對具有較大工程意義的。來自于地理所裴韜老師團隊的成果。
PM1可能比PM2.5(空氣動力學直徑≤1μm且≤2.5μm的顆粒物質(zhì))更危險。然而,由于缺乏PM1監(jiān)測數(shù)據(jù),PM1濃度及其健康影響的研究受到限制。目標:利用衛(wèi)星遙感,氣象和土地利用信息,估算2005 - 2014年中國PM1濃度的時空變化。兩種類型的中分辨率成像光譜儀(MODIS)產(chǎn)品6氣溶膠光學深度(AOD)數(shù)據(jù)(基于暗目標(DT)和深藍色(DB)反演的)。開發(fā)廣義相加模型(GAM)以將地面監(jiān)測的PM1數(shù)據(jù)與AOD數(shù)據(jù)和其他空間和時間預測因子(例如,城市覆蓋,森林覆蓋和日歷月)聯(lián)系起來。進行10折交叉驗證以評估預測能力。結(jié)果表明,PM1水平在冬季最高,而在夏季最低。總的來說,整個中國的PM1水平在過去十年中并未發(fā)生實質(zhì)性變化。對于當?shù)刂匚廴镜貐^(qū),河北西南部和京津地區(qū)的PM1水平大幅上升。結(jié)論:具有衛(wèi)星反演AOD,氣象和土地利用信息的GAM具有較高的預測能力來估計地面PM1。在過去十年中,環(huán)境PM1在中國達到了很高的水平。估計結(jié)果可用于評估PM1的健康影響。在見慣了大量PM2.5各類反演研究后,這一篇確實耳目一新,因為做的是PM1。可以說細顆粒物將在未來對人類健康產(chǎn)生持續(xù)的影響,也是需要重點關(guān)注的大氣污染物。