We demonstrate the utility of remotely sensed data and the newly developed Software for Assisted Habitat Modeling (SAHM) in predicting invasive species occurrence on the landscape. An ensemble of predictive models produced highly accurate maps of tamarisk (Tamarix spp.) invasion in Southeastern Colorado, USA when assessed with subsequent field validations.
Tidlig påvisning af invasive plantearter er afgørende for forvaltningen af naturressourcerne og beskyttelse af økosystemets processer. Brugen af satellit telemåling til kortlægning af fordelingen af invasive planter bliver mere almindelige, har dog konventionelle billedbehandling software og klassificering metoder vist sig at være upålidelige. I denne undersøgelse tester vi og evaluere brugen af fem arter distributionsmodel teknikker passer med satellit telemålingsdata at kortlægge invasive tamarisk (Tamarix spp.) Langs Arkansas-floden i det sydøstlige Colorado. De testede modeller inkluderet boostet regression træer (BRT), Random Forest (RF), multivariat adaptive regression splines (MARS), generaliseret lineær model (GLM), og MAXENT. Disse analyser blev udført ved hjælp af en nyudviklet software pakke kaldet Softwaren til Assisted Habitat Modeling (SAHM). Alle modeller blev trænet med 499 tilstedeværelse point, 10.000 pseudo-fravær punkter og prediktorvariabler AnskaffelserIRED fra Landsat 5 tematiske Mapper (TM) sensor over en otte måneders periode at skelne tamarisk fra indfødte vandløbsnære vegetation hjælp påvisning af fænologiske forskelle. Fra Landsat scener, vi brugte individuelle bands og beregnet Normalized Difference Vegetation Index (NDVI), Jord-Justeret Vegetation Index (SAVI), og tasseled udjævnede transformationer. Alle fem modeller identificerede nuværende tamarisk fordeling på landskabet med succes baseret på tærsklen uafhængig og tærskel afhængige evaluering målinger med uafhængige lokaliseringsdata. For at tage højde for model specifikke forskelle, vi producerede et ensemble af alle fem modeller med kort output fremhæve områder af aftale og områder af usikkerhed. Vores resultater viser nytten af distributions- arter modeller i at analysere fjernlæste data og nytten af ensemble kortlægning, og fremvise evne SAHM i forbehandling og udføre flere komplekse modeller.
Ripariske økosystemer og vådområder i hele det sydvestlige USA bliver truet af invasion af tamarisk (Tamarix spp.), En ikke-indfødt woody busk indført fra Eurasien i 1800-tallet en. Tamarisk har mange fysiologiske mekanismer, der tillader slægten til at udnytte vandressourcerne, udkonkurrere hjemmehørende arter, og ændre økosystem processer 1-2. Kortlægning tamarisk distributioner til at vurdere miljøpåvirkninger og formulere effektive kontrolstrategier er højt prioriterede ressource ledere. Selvom undersøgelser på stedet forbliver jævnligt brugt, de er upraktisk for ekstremt store områder på grund af de omkostninger, som arbejdskraft, tid og logistik.
Satellit telemåling har spillet en vigtig, men begrænset, rolle i påvisning og kortlægning af tamarisktræer skadedyrsangreb. Konventionel klassifikation analyser og telemåling software har haft marginal succes 3-5. Adskillige nyere undersøgelserhar udforsket utraditionelle tilgange til at opdage invasive planter ved hjælp af telemåling data 1,6. Tamarisk, ligesom mange invasive planter, udviser fænologiske variation i hele vækstsæsonen, der adskiller sig fra native vandløbsnære arter 'fænologi. På nogle områder, for eksempel, tamarisk blad-out er før nogle indfødte vandløbsnære planter, og tamarisk bevarer sin løv længere end andre hjemmehørende arter. Ved at bruge spektrale bånd og spektrale indeks afledt af en tidsserie af satellitdata i hele vækstsæsonen, kan vi skelne tamarisk fra indfødte planter på grundlag af disse fænologiske forskelle 1,6. Med udgangspunkt i det arbejde, Evangelista et al. 2009 1, i denne undersøgelse, vi indarbejdet individuelle bånd 1-7 fra en tidsserie af Landsat 5 Tematisk Mapper (TM) satellitbilleder og afledte normaliseret forskel vegetation indeks (NDVI), jord-justeret vegetation indeks (SAVI), og tasseled cap transformationer fra disse bands. normaliseret difference vegetation indeks (NDVI) er en af de mest almindeligt anvendte spektrale indeks for estimering vegetation biomasse, kronedækningsgrad, og bladareal indekser 8-9, og er en ikke-lineær transformation af forholdet mellem det synlige (rød) og nær- infrarøde bånd 10. Jord-justeret vegetation indeks (SAVI) er en modificeret NDVI bruges til at minimere virkningerne jord baggrund for plantevækst indeks 11. Tasseled cap transformationer vægtes kompositter af de seks Landsat bands i tre ortogonale bands, der måler jordens lysstyrke (tasseled cap, band 1), vegetation greenness (tasseled cap, bånd 2), og jord / vegetation fugtighed (tasseled cap, bånd 3), og bruges ofte til at skelne vegetation sammensætning, aldersklasse og strukturere 12-14. Vi brugte de koefficienter rapporteret i Crist (1985) 15 for alle tasseled cap transformationer.
I denne undersøgelse tester vi fem distributionsomkostninger arter modeller med en tidsserie af spektrale bånd og vegetation indekser afledt af Landsat 5 TM til at kortlægge tamarisk langs den nederste Arkansas-floden i det sydøstlige Colorado, USA. Den Arkansas-floden, der spænder over 2364 km (1469 mi), er den næststørste biflod i Missouri-Mississippi-system. Dens vandskel dækker 435.123 km 2 (168.002 mi 2) med udspring i Colorado Rocky Mountains. Fra sin oprindelse på 2965 m, Arkansas falder betydeligt i elevation, nivellering ud nær Pueblo, CO, og bugtende gennem lander landbrugs- og korte græs prærie. Floden er underlagt sæsonbestemte oversvømmelse og påberåbt for kommunalt og landbruget vandforbrug i Rocky Ford, La Junta, og Lamar, før du fortsætter ind i Kansas, Oklahoma og Arkansas, hvor den løber ud i Mississippi-floden. Tamarisk blev først observeret på Arkansas-floden ved R. Niedrach i 1913 nær den nuværende by Lamar 16. I dag er det blevet anslået, at tamarisk dækker mere end 100 km 2 mellem Pueblo og Kansas State line, med yderligere 60 km 2 langs bifloder til Arkansas-floden 17. Undersøgelsen Området omfatter kunstvanding grøfter, vådområder, landbrugsjord, og Confluences i flere bifloder; alle med varierende grader af tamarisk angreb. Ranching og landbrug er den primære jord-bruger støder op til de vandløbsnære korridorer består hovedsagelig af lucerne, hø, majs, og vinterhvede.
Arter distributionsmodeller afhængige geospecifikke hændelser (dvs. breddegrad, længdegrad) for at identificere sammenhænge mellem en arts forekomst og dens omgivelser 18. Miljødata kan omfatte flere telemåling og andre rumlige lag. De fem distributionscentre arter modeller vi testede omfatter boostede regression træer (BRT) 19, tilfældige skove (RF) 20, multivariat adaptive regression splines (MARS) 21, en generaliseret lineær model (GLM) 22, og MAXENT 23. Disse fem model algoritmer er blandt de mest almindeligt anvendte til distribution arter modellering, og en række undersøgelser har vist deres effektivitet 24-25. Vi brugte Softwaren til Assisted Habitat Modeling (SAHM) v. 2.0 moduler til at udføre de fem modeller, som er indeholdt i VisTrails v.2.2.2 26 visualisering og behandling software. Der er flere fordele ved at bruge SAHM til sammenlignende modellering. Ud over den formalisering og medgørlig registrering af modellering processer, SAHM giver brugerne mulighed for at arbejde med flere fordeling arter model algoritmer, individuelt, har forskellige grænseflader, software og fil formatering 27. SAHM producerer konsistente tærskel-uafhængige og tærskel-afhængige evaluering målinger til at vurdere model ydeevne. En af disse er Area Under Receiver Operating Karakteristisk Curve (AUC), en tærskel uafhængig metrik, der evaluerer evne af en model til at skelne tilstedeværelse fra baggrund 28. En AUC value på 0,5 eller derunder indikerer model forudsigelser er ikke bedre eller værre end tilfældig; værdier mellem 0,5 og 0,70 indikerer dårlige resultater; og værdier stigende 0,70-1,0 indikerer progressivt højere ydelse. En anden metrik er procent korrekt klassificeret (PCC), en tærskel afhængig metrik, der vejer sensitivitet og specificitet baseret på en brugerdefineret tærskel metriske; følsomhed måler andelen af observerede tilstedeværelse klassificeret som egnet og specificitet måler andelen af baggrundslokaliteter klassificeret som uegnet. Endnu en metrik er True Skill Statistik (TSS = sensitivitet + specificitet – 1), hvilket placerer mere vægt på model følsomhed end specificitet, med værdier på mellem -1 og 1, hvor værdier> 0 indikerer bedre model ydelse end chance 29.
At kortlægge tamarisk hjælp model output, konstruerede vi binære klassificeringer ved hjælp af tærskel, udligner sensitivitet og specificitet at definere presence eller fravær af tamarisk. Disse enkelte model afledte kort blev derefter summeres for at skabe et ensemble kort 30. Ensemble kort kombinerer forudsigelser enkelte distributionsomkostninger arter modeller til at producere et klassificeret kort, der rangerer den kollektive overenskomst af de testede modeller. For eksempel, et ensemble celle værdien af en viser, at kun én model klassificeret denne celle som passende habitat, mens en værdi på fem indikerer, at alle fem modeller klassificeret cellen som passende habitat. En fordel ved denne fremgangsmåde er, at ensemble kort giver en lavere betyde fejl end nogen enkelt model. Det giver også brugerne mulighed for at visuelt sammenligne effektiviteten af hver testet model. Vores overordnede mål var at give en detaljeret beskrivelse af disse metoder, som kan skræddersys til at modellere den nuværende fordeling af arter i landskabet.
Vores resultater viser montering BRT, RF, MARS, GLM, og MAXENT med tilstedeværelse point for tamarisk og en tidsserie af fjernlæste Landsat satellit billeddata kan skelne tamarisk på landskabet og er et effektivt alternativ til metoder traditionelle single-scene klassificering. Det fremgår af vores resultater, at Juni er en særlig vigtig tid til påvisning tamarisk inden for vores undersøgelse område; dette er enig med Evangelista et al. 2009 1, som angivet juni Fugtighed var den vigtigste prædiktor for tamarisk forekomst i dette område er baseret på en MAXENT model fit med en tidsserie af Landsat billedsprog.
De andre spektrale indekser og bands, der indgik i BRT, RF, MARS, og MAXENT modeller kan endvidere skelne tamarisk fra jord substrat, andre løvfældende træer, herunder Cottonwood (Populus spp.) Og pil (Salix spp.), Eller vandede landbrug, der er almindelig i den nedreArkansas River bækkenet. Andre GIS lag, såsom topografi, jordtyper, eller klimadata kunne også betragtes som kovariater og indgår i disse modeller, men vi anbefaler at holde disse til et minimum, hvis målet er at opdage nuværende fordeling arter på landskabet i stedet forudsige potentielle forekomst eller passende habitat.
De testede for vores forskning modeller leveres stærk analytisk kapacitet og flere muligheder for evaluering af resultater. Under alle disse korrelative modeller inden for en enkelt ramme, såsom SAHM, tillader formalisering og tractable registrering af modelleringsprocessen. Før og efter behandling af respons og prediktorvariabler er standardiseret i SAHM, så bedre og effektive model sammenligninger, mens arbejdsgange registrerer hvert trin af analyserne letter ændring, iteration og replikation.
Ensemble kortlægning har til formål at kombinere styrkerne i flere korrelative modeller, og samtidig minimere weakness ifølge ethvert model 30. Vi mener, at dette var tilfældet i vores undersøgelse; Men vi advare om, at modeller, der underpræsterer (dvs. under-forudsige eller over-forudsige) kan svække de samlede resultater. Den begrænsede brug af ensemble kortlægning i litteraturen har haft positive resultater, men de fleste af disse tilgange har forsøgt at "forudsige" arter forekomst snarere end "opdage". Desuden ensemble kortlægning giver mulighed for en visuel vurdering af usikkerhed blandt de forskellige modellering metoder, identificere niveauer af standardaftalen. Oftest er valget af modellering metode (f.eks GLM versus BRT), der har størst kvantificerbar effekt på modellens resultater snarere end andre beslutninger i modelleringsprocessen såsom lokaliseringsdata usikkerhed 31. Selvom vi mener, at vores bedste tamarisk kort er, hvor alle fem modeller er enige, yderligere testning og ved hjælp af forskellige metoder til ensemble kortlægning anbefales (f.eks, vægtet med AUC) 32 </ Sup>, og bedst validerede gennem uafhængige feltobservationer. Sammenfattende kan disse metoder let skræddersys til at modellere fordelingen af andre arter ved hjælp miljømæssige variabler afledt for en given undersøgelse region i SAHM.
The authors have nothing to disclose.
The authors would like to thank the U.S. Geological Survey, Natural Resource Ecology Laboratory at Colorado State University, Colorado State Forest Service and the Tamarisk Coalition for logistical support, data, use of facilities and expertise. Additionally, we thank Shelly Simmons, Lane Carter, John Moore, and Chandra Reed for their contributions to this work. Thomas J. Stohlgren was partially supported by the Bioenergy Alliance Network of the Rockies (BANR), USDA UV-B Monitoring and Research Program and USDA CSREES/NRI 2008-35615-04666. Any use of trade, product, or firm names is for descriptive purposes only and does not imply endorsement by the U.S. Government.
Earth Explorer | USGS | http://earthexplorer.usgs.gov | Open Access: Yes |
Remote Sensing Indices Derivation Tool | github | https://github.com/rander38/Remote-Sensing-Indices-Derivation-Tool | Open Access: Yes |
Software for Assisted Habitat Modeling | USGS | https://my.usgs.gov/catalog/RAM/SAHM | Open Access: Yes |
ArcGIS v.10.3 | Esri | https://www.arcgis.com/features/ | Open Access: No |