We demonstrate the utility of remotely sensed data and the newly developed Software for Assisted Habitat Modeling (SAHM) in predicting invasive species occurrence on the landscape. An ensemble of predictive models produced highly accurate maps of tamarisk (Tamarix spp.) invasion in Southeastern Colorado, USA when assessed with subsequent field validations.
Tidlig påvisning av invasive plantearter er viktig for forvaltningen av naturressurser og vern av økosystemprosesser. Bruk av satellitt fjernmåling for å kartlegge fordelingen av invasive planter blir stadig mer vanlig, har imidlertid vanlige bildebehandlingsprogrammer og klassifiseringsmetoder har vist seg å være upålitelig. I denne studien, tester vi og vurdere bruken av fem arter distribusjonsmodeller passer med satellittfjernmålingsdata for å kartlegge invasiv tamarisken (Tamarix spp.) Langs Arkansas-elven i Sørøst Colorado. De testede modeller inkludert styrket regresjon trær (BRT), Random Forest (RF), multivariate adaptive regresjon splines (Mars), generalisert lineær modell (GLM), og Maxent. Disse analysene ble utført ved hjelp av en nyutviklet programvarepakke kalt Programvare for pasning Habitat Modeling (SAHM). Alle modellene ble trent med 499 tilstedeværelse poeng, 10.000 pseudo-fravær poeng, og Predictor variablene acquIRED fra Landsat 5 Thematic Mapper (TM) sensor over en åtte måneders periode for å skille tamarisken fra opprinnelig elvebreddebufferen vegetasjon hjelp påvisning av fenologiske forskjeller. Fra Landsat scener, brukte vi enkelte band og beregnet Normalisert Difference Vegetasjon Index (NDVI), Jord-Justert Vegetasjon Index (SAVI), og tasseled avkortet transformasjoner. Alle fem modeller identifiserte nåværende tamarisken fordeling i landskapet vellykket basert på terskelen selvstendig og terskel avhengige evaluering beregninger med uavhengige posisjonsdata. Å gjøre rede for modellspesifikke forskjeller, produserte vi et ensemble av alle fem modeller med kart utgang fremheve deler av avtalen og områder av usikkerhet. Våre resultater viser nytten av arter distribusjonsmodeller i å analysere fjernavføles data og nytten av ensemblet kartlegging, og vise evnen til SAHM i pre-prosessering og gjennomføring av flere komplekse modeller.
Elvebreddebufferen og våtmarks økosystemer over hele det sørvestlige USA blir truet av invasjon av tamarisk (Tamarix spp.), En ikke-innfødte treaktig busk innført fra Eurasia på 1800-tallet en. Tamarisk har mange fysiologiske mekanismer som gjør at slekten til å utnytte vannressursene, utkonkurrere lokale arter, og endre økosystemprosesser 1-2. Kartlegging tamarisktrær distribusjoner for å vurdere miljøkonsekvenser og formulere effektive kontrollstrategier er høyt prioritert ressurs ledere. Selv om grunnundersøkelser forblir regelmessig brukt, de er upraktisk for svært store områder på grunn av de tilhørende kostnadene av arbeidskraft, tid og logistikk.
Satellitt fjernmåling har spilt en viktig, men begrenset, rolle i deteksjon og kartlegging av tamarisktrær angrep. Konvensjonell klassifisering analyser og fjernmåling programvare har hatt marginal suksess 3-5. Flere nyere studierhar utforsket utradisjonelle metoder for å oppdage invasive planter ved hjelp av fjernmåling data 1,6. Tamarisk, som mange invasive planter, viser fenologiske variasjon gjennom hele vekstsesongen som avviker fra innfødte elvebreddebufferen arters fenologi. I enkelte områder, for eksempel, er tamarisk blad-out før noen innfødte elvebreddebufferen planter, og tamarisk beholder sin løvverk lenger enn andre lokale arter. Ved å bruke spektrale band og spektral indekser som stammer fra en tidsserie av satellittdata gjennom hele vekstsesongen, kan vi skille tamarisken fra lokale planter basert på følgende fenologiske forskjeller 1,6. Bygge på arbeidet til Evangelista et al. 2009 1, i denne studien innlemmet vi enkelte band 1-7 fra en tidsserie av Landsat 5 Tematisk Mapper (TM) satellittbilder og avledet normalisert forskjell vegetasjon indeks (NDVI), jord justert vegetasjon indeks (SAVI), og tasseled cap transformasjoner fra disse bandene. normalisert difference vegetasjon indeks (NDVI) er en av de mest brukte spektral indekser for beregning av vegetasjon biomasse, canopy cover, og bladareal indekser 8-9, og er en ikke-lineær transformasjon av forholdet mellom det synlige (rød) og nær- infrarøde band 10. Jordjustert vegetasjon indeks (SAVI) er en modifisert NDVI brukes til å minimalisere virkningene av jord bakgrunn på vegetasjonsindekser 11. Tasseled cap transformasjoner vektes kompositter av de seks Landsat bandene inn i tre ortogonale band som måler lysstyrke jord (tasseled cap, bånd 1), vegetasjon Grønne (tasseled cap, bandet 2), og jord / vegetasjon fuktighet (tasseled cap, bånd 3) og blir ofte brukt for å skille vegetasjon preparat, alder klasse, og strukturere 12-14. Vi brukte koeffisientene rapportert i Crist (1985) 15 for alle tasseled cap transformasjoner.
I denne studien, tester vi fem arter distribusjonsmodeller med en tidsserie av spektrale band og vegvegetasjonsindekser avledet fra Landsat 5 TM å kartlegge tamarisk langs nedre Arkansas River i det sørøstlige Colorado, USA. Arkansas River, som strekker seg over 2364 km (1469 miles), er den nest største sideelv i Missouri-Mississippi system. Dens vannskille dekker 435 123 km 2 (168002 mi 2) med utspring i Colorado Rocky Mountains. Fra sin opprinnelse på 2965 m, synker Arkansas betydelig i høyde og kvitterte ut i nærheten av Pueblo, CO, og meandrerende gjennom jordbruksområder og kort gress prærien. Elva er gjenstand for sesongmessige flom og er avhengig av for kommunal og landbruks bruk av vann i Rocky Ford, La Junta, og Lamar, før du fortsetter i Kansas, Oklahoma, og Arkansas hvor det renner ut i Mississippi-elven. Tamarisk ble først observert på Arkansas River av R. Niedrach i 1913 nær dagens byen Lamar 16. I dag har det vært anslått at tamarisken dekker mer enn 100 km 2 mellom Pueblo og Kansas State line, med ytterligere 60 km 2 langs sideelvene til Arkansas River 17. Studien Området omfatter vanning grøfter, våtmarker, jordbruksland, og Confluences av flere sideelver; alle med varierende grad av tamarisken angrep. Havbeite og jordbruk er den viktigste land bruker ved siden av elvebreddebufferen korridorer består i stor grad av alfalfa, høy, korn og høsthvete.
Arter distribusjonsmodeller stole på georefererte forekomster (dvs. breddegrad, lengdegrad) for å identifisere relasjoner mellom en arts forekomst og dets omgivelser 18. De miljødata kan omfatte flere fjernmåling og andre romlige lag. De fem arter distribusjonsmodeller vi testet inkluderer styrket regresjon trær (BRT) 19, tilfeldige skoger (RF) 20, multivariate adaptive regresjon splines (MARS) 21, en generalisert lineær modell (GLM) 22, og Maxent 23. Disse fem model algoritmer er blant de mest vanlig ansatt for arter distribusjon modellering, og en rekke studier har vist sin effekt 24-25. Vi brukte programvaren for pasning Habitat Modeling (SAHM) v. 2.0 moduler for å gjennomføre de fem modellene, som finnes i VisTrails v.2.2.2 26 visualisering og prosessering programvare. Det er flere fordeler med å bruke SAHM for komparativ modellering. I tillegg til formalisering og medgjørlig opptak av modelleringsprosesser, tillater SAHM brukerne å arbeide med flere arter distribusjon modell algoritmer som enkeltvis, har ulike grensesnitt, programvare og filformate 27. SAHM produserer konsistente terskel-uavhengige og terskelavhengige evaluering beregninger for å evaluere modellen ytelse. En av disse er arealet under Receiver Operating Karakteristisk kurve (AUC), en terskel uavhengig beregning som vurderer muligheten for en modell for å diskriminere tilstedeværelse fra bakgrunnen 28. En AUC value på 0,5 eller mindre indikerer modellprediksjoner er ikke bedre eller verre enn tilfeldig; verdier mellom 0,5 og 0,70 indikerer dårlig ytelse; og verdiene øker 0,70 til 1,0 indikere gradvis høyere ytelse. En annen beregning er prosent korrekt klassifisert (PCC), en terskel avhengig beregning som veier sensitivitet og spesifisitet basert på en brukerdefinert terskel metrisk; følsomhet måler den prosentvise av observerte nærvær klassifisert som egnet og spesifisitet måler den prosentvise bakgrunns steder klassifisert som uegnet. Enda en beregning er True Skill statistikk (TSS = følsomhet + spesifisitet – 1), som legger mer vekt på modellen sensitivitet enn spesifisitet, med verdier som varierer mellom -1 og 1, hvor verdier> 0 indikerer bedre modell ytelse enn sjansen 29.
For å kartlegge tamarisken hjelp modell utgang, bygget vi binære klassifikasjoner hjelp av terskel som utjevner sensitivitet og spesifisitet for å definere presence eller fravær av tamarisken. Disse enkelt modell avledet kartene ble deretter summert for å skape et ensemble kartet 30. Ensemble kart kombinere spådommer om enkelte arter distribusjonsmodeller for å produsere en klassifisert kart som rangerer tariffavtalen av modellene som ble testet. For eksempel, et ensemble celleverdien av en indikerer at bare en modell klassifisert som celle som er egnet habitat, mens en verdi på fem angir at alle fem modellene klassifisert i cellen som egnet habitat. En fordel for denne tilnærmingen er at ensemblet maps gi en lavere gjennomsnittlig feil enn noen enkelt modell. Den lar også brukere til å visuelt sammenligne resultatene av hver modell testet. Vårt overordnede mål var å gi en detaljert beskrivelse av disse metodene som kan skreddersys for å modellere dagens fordeling av arter i landskapet.
Våre resultater viser montering BRT, RF, MARS, GLM, og Maxent med tilstedeværelse poeng for tamarisken og en tidsserie av fjernavføles Landsat satellitt bildedata kan skille tamarisken på landskapet og er et effektivt alternativ til tradisjonelle single-scene klassifiseringsmetoder. Det er klart fra våre resultater at juni er en spesielt viktig tid for å oppdage tamarisken innenfor vårt studieområde; dette stemmer med Evange et al. 2009 en som indikerte juni fuktighet var den viktigste prediktor for tamarisken forekomst i dette området basert på en Maxent modell passform med en tidsserie av Landsat-bilder.
De andre spektrale indekser og band som var inkludert i BRT, RF, MARS, og Maxent modeller kan videre skille tamarisken fra jord underlag, andre lauvtrær inkludert Cottonwood (Populus spp.) Og vier (Salix spp.), Eller vannes jordbruk som er vanlig i den nedreArkansas River bassenget. Andre GIS lag, som topografi, jordsmonn, eller klimadata kan også betraktes som kovariater og inkludert i disse modellene, men vi anbefaler å holde disse til et minimum hvis målet er å oppdage dagens arter distribusjon på landskapet heller enn forutsi potensielle forekomst eller egnet habitat.
De testede for vår forskning modeller gitt sterk analytisk kapasitet og flere alternativer for å evaluere resultatene. Å ha alle disse samsvarende modeller innenfor et enkelt rammeverk som SAHM, gjør at formalisering og medgjørlig opptak av modelleringsprosessen. Før- og etterbehandling av respons og Predictor variablene er standardisert i SAHM, slik at bedre og effektiv modell sammenligninger, mens arbeidsflyter registrere hvert trinn av analysene tilrettelegging modifikasjon, gjentakelse og replikering.
Ensemble kartlegging mål å kombinere styrkene til flere samsvarende modeller, mens w minimereeakness ifølge hvilket som helst modell 30. Vi mener dette var tilfelle i vår studie; men advarer vi at modeller som dårligere (dvs. under forutse eller over forutsi) kan svekke det samlede resultatet. Begrenset bruk av ensemble kartlegging i litteraturen har hatt gode resultater, men de fleste av disse metodene har forsøkt å "spå" arter forekomst heller enn "oppdage". Videre gir ensemble kartlegging for en visuell vurdering av usikkerhet blant de ulike modelleringsmetoder, identifisere nivåer av modellavtalen. Oftest er det valget av modelleringsmetode (for eksempel GLM versus BRT) som har størst målbar effekt på modellresultater snarere enn andre avgjørelser i modellering prosessen som posisjonsdata usikkerhet 31. Selv om vi mener at vår beste tamarisken kartet er der alle de fem modellene er enige, ytterligere testing og bruk av ulike metoder for ensemble kartlegging anbefales (f.eks, vektet etter AUC) 32 </ Sup>, og best validert gjennom uavhengige feltobservasjoner. Oppsummert kan disse fremgangsmåter lett tilpasses for å modellere fordelingen av andre arter ved hjelp av miljømessige variabler avledet for en gitt studie region i SAHM.
The authors have nothing to disclose.
The authors would like to thank the U.S. Geological Survey, Natural Resource Ecology Laboratory at Colorado State University, Colorado State Forest Service and the Tamarisk Coalition for logistical support, data, use of facilities and expertise. Additionally, we thank Shelly Simmons, Lane Carter, John Moore, and Chandra Reed for their contributions to this work. Thomas J. Stohlgren was partially supported by the Bioenergy Alliance Network of the Rockies (BANR), USDA UV-B Monitoring and Research Program and USDA CSREES/NRI 2008-35615-04666. Any use of trade, product, or firm names is for descriptive purposes only and does not imply endorsement by the U.S. Government.
Earth Explorer | USGS | http://earthexplorer.usgs.gov | Open Access: Yes |
Remote Sensing Indices Derivation Tool | github | https://github.com/rander38/Remote-Sensing-Indices-Derivation-Tool | Open Access: Yes |
Software for Assisted Habitat Modeling | USGS | https://my.usgs.gov/catalog/RAM/SAHM | Open Access: Yes |
ArcGIS v.10.3 | Esri | https://www.arcgis.com/features/ | Open Access: No |