Waiting
Login processing...

Trial ends in Request Full Access Tell Your Colleague About Jove
Click here for the English version

Environment

Automatisk bildbehandling för att bestämma gemenskapens storleksstruktur för flodmakroinvertebrater

Published: January 13, 2023 doi: 10.3791/64320

Summary

Artikeln är baserad på skapandet av ett anpassat protokoll för att skanna, upptäcka, sortera och identifiera digitaliserade objekt som motsvarar bentiska flodmakroinvertebrater med hjälp av ett halvautomatiskt avbildningsförfarande. Denna procedur möjliggör förvärv av de individuella storleksfördelningarna och storleksmåtten för ett makroinvertebratsamhälle på cirka 1 timme.

Abstract

Kroppsstorlek är ett viktigt funktionellt drag som kan användas som en bioindikator för att bedöma effekterna av störningar i naturliga samhällen. Gemenskapens storleksstruktur svarar på biotiska och abiotiska gradienter, inklusive antropogena störningar mellan taxa och ekosystem. Den manuella mätningen av småkroppiga organismer som bentiska makroinvertebrater (t.ex. >500 μm till några centimeter långa) är dock tidskrävande. För att påskynda uppskattningen av gemenskapens storleksstruktur utvecklade vi här ett protokoll för att halvautomatiskt mäta den individuella kroppsstorleken hos bevarade flodmakroinvertebrater, som är en av de vanligaste bioindikatorerna för att bedöma den ekologiska statusen för sötvattenekosystem. Detta protokoll är anpassat från en befintlig metod som utvecklats för att skanna marina mesozooplankton med ett skanningssystem utformat för vattenprover. Protokollet består av tre huvudsteg: (1) skanning av delprover (fina och grova provstorleksfraktioner) av flodmakroinvertebrater och bearbetning av de digitaliserade bilderna för att individualisera varje upptäckt objekt i varje bild; (2) skapa, utvärdera och validera en inlärningsuppsättning genom artificiell intelligens för att halvautomatiskt separera de enskilda bilderna av makroinvertebrater från detritus och artefakter i de skannade proverna; och (3) skildrar storleksstrukturen hos makroinvertebratsamhällena. Förutom protokollet inkluderar detta arbete kalibreringsresultaten och räknar upp flera utmaningar och rekommendationer för att anpassa proceduren till makroinvertebratprover och att överväga för ytterligare förbättringar. Sammantaget stöder resultaten användningen av det presenterade skanningssystemet för automatisk kroppsstorleksmätning av flodmakroinvertebrater och tyder på att skildringen av deras storleksspektrum är ett värdefullt verktyg för snabb biobedömning av sötvattenekosystem.

Introduction

Bentiska makroinvertebrater används i stor utsträckning som bioindikatorer för att bestämma vattenförekomsternas ekologiska status1. De flesta index för att beskriva makroinvertebratsamhällen fokuserar på taxonomiska mätvärden. Nya biobedömningsverktyg som integrerar kroppsstorlek uppmuntras dock att ge ett alternativt eller kompletterande perspektiv till taxonomiska metoder 2,3.

Kroppsstorlek anses vara en metatrait som är relaterad till andra viktiga egenskaper som ämnesomsättning, tillväxt, andning och rörelse4. Dessutom kan kroppsstorlek bestämma trofisk position och interaktioner5. Förhållandet mellan individuell kroppsstorlek och den normaliserade biomassan (eller överflödet) efter storleksklass i ett samhälle definieras som storleksspektrumet6 och följer det allmänna mönstret för en linjär minskning av normaliserad biomassa när individuell storlek ökar på en logaritmisk skala7. Lutningen av detta linjära förhållande har studerats omfattande teoretiskt, och empiriska studier över ekosystem har använt det som en ekologisk indikator på samhällsstorleksstrukturen4. En annan syntetisk indikator på samhällsstorleksstruktur som framgångsrikt har använts i studier av biologisk mångfald-ekosystemfunktion är samhällsstorleksdiversitet, som representeras som Shannon-indexet för storleksklasserna i storleksspektrumet eller dess analog, som beräknas baserat på de individuella storleksfördelningarna8.

I sötvattensekosystem används storleksstrukturen för olika faunagrupper som en ataxisk indikator för att bedöma biotiska samhällens svar på miljögradienter 9,10,11 och på antropogena störningar 12,13,14,15,16. Makroinvertebrater är inget undantag, och deras storleksstruktur svarar också på miljöförändringar17,18 och antropogena störningar, såsom gruvdrift 19, markanvändning 20 eller kväve (N) och fosfor (P) anrikning20,21,22. Att mäta hundratals individer för att beskriva samhällets storleksstruktur är dock en tråkig och tidskrävande uppgift som ofta undviks som en rutinmätning i laboratorier på grund av tidsbrist. Således har flera halvautomatiska eller automatiska avbildningsmetoder för att klassificera och mäta prover utvecklats23,24,25,26. De flesta av dessa metoder är dock inriktade på taxonomisk klassificering mer än på organismernas individuella storlek och är inte redo att användas för alla typer av makroinvertebrater. Inom marin planktonekologi har ett skanningsbildanalyssystem använts i stor utsträckning för att bestämma storleken och taxonomiska sammansättningen av djurplanktonsamhällen 27,28,29,30,31. Detta instrument finns i flera marina institut över hela världen, och det används för att skanna bevarade djurplanktonprover för att få högupplösta digitala bilder av hela provet. Detta protokoll anpassar användningen av detta instrument för att uppskatta makroinvertebratsamhällets storleksspektrum i floder på ett snabbt automatiskt sätt utan att investera i att skapa en ny enhet.

Protokollet består av att skanna ett prov och bearbeta hela bilden för att automatiskt få enstaka bilder (dvs. vinjetter) av objekten i provet. Flera mått på form, storlek och grånivåfunktioner kännetecknar varje objekt och möjliggör automatisk klassificering av objekten i kategorier, som sedan valideras av en expert. Den individuella storleken på varje organism beräknas med hjälp av den ellipsoidala biovolymen (mm3), som härrör från organismens yta mätt i pixlar. Detta möjliggör att provets storleksspektrum erhålls på ett snabbt sätt. Så vitt vi vet har detta skanningsavbildningssystem endast använts för att bearbeta mesozooplanktonprover, men enheten kan potentiellt möjliggöra arbete med sötvattensbentiska makroinvertebrater.

Det övergripande målet med denna studie är därför att introducera en metod för att snabbt erhålla den individuella storleken på bevarade flodmakroinvertebrater genom att anpassa ett befintligt protokoll som tidigare använts med marina mesozooplankton 27,32,33. Proceduren består av att använda ett halvautomatiskt tillvägagångssätt som fungerar med en skanningsenhet för att skanna vattenprover och tre öppna program för att bearbeta de skannade bilderna. Ett anpassat protokoll för att skanna, upptäcka och identifiera digitaliserade flodmakroinvertebrater för att automatiskt förvärva gemenskapens storleksstruktur och relaterade storleksmått presenteras häri. Bedömningen av förfarandet och riktlinjerna för att förbättra effektiviteten presenteras också baserat på 42 skannade bilder av prover av makroinvertebrater från floder som samlats in från tre bassänger på den nordöstra (NE) iberiska halvön (Ter, Segre-Ebre och Besòs).

Proverna samlades in vid 100 m flodsträckor enligt protokollet för fältprovtagning och laboratorieanalys av bentiska flodmakroinvertebrater i vadbara floder från den spanska regeringen34. Proverna samlades in med en surber sampler (ram: 0,3 m x 0,3 m, mesh: 250 μm) efter en multihabitatundersökning. I laboratoriet rengjordes proverna och siktades genom en maska på 5 mm och 500 μm för att erhålla två delprover: ett grovt delprov (5 mm maska) och ett fint delprov (500 μm maska), som förvarades i separata injektionsflaskor och konserverades i 70 % etanol. Genom att separera provet i två storleksfraktioner kan man bättre uppskatta gemenskapens storleksstruktur, eftersom stora organismer är sällsyntare och färre än de små organismerna. Annars har det skannade provet en partisk representation av den stora storleksfraktionen.

Subscription Required. Please recommend JoVE to your librarian.

Protocol

OBS: Protokollet som beskrivs här är baserat på det system som utvecklats av Gorsky et al.27 för marina mesozooplankton. En specifik beskrivning av stegen för skanner (ZooSCAN), skanningsprogramvara (VueScan 9x64 [9.5.09]), bildbehandlingsprogramvara (Zooprocess, ImageJ) och automatisk identifieringsprogramvara (Plankton Identifier) finns i tidigare referenser32,33. För att bäst justera storleken på de bentiska makroinvertebraterna med avseende på mesozooplankton, när projektet har skapats enligt det ursprungliga protokollet32,33, ändra parametern för minsta storlek (minsizeesd_mm) till 0,3 mm och parametern för maximal storlek (maxsizeesd_mm) till 100 mm i konfigurationsfilen. För att hjälpa till att följa protokollet sammanfattas detta i ett arbetsdiagram (figur 1). Det skapade projektet lagras i datorns C-mapp och är organiserat i följande mappar: PID_process, Zooscan_back, Zooscan_check, Zooscan_config, Zooscan_meta, Zooscan_results och Zooscan_scan. Varje mapp består av flera undermappar som de olika programmen använder i följande steg i protokollet.

1. Förvärv av digitala bilder för prover av makroinvertebrater

  1. Skanna och bearbeta det tomma
    OBS: Skapa två tomma bilder dagligen innan du skannar för att extrahera bakgrundsskanningarna medan du bearbetar de skannade bilderna samma dag.
    1. Slå på skannern och slå på ljuset i dubbelt läge för att projicera vitt ljus från toppen och från botten.
      OBS: Vid skanning av mesozooplanktonprover används den uppåtgående ljusriktningen, men eftersom makroinvertebrater är mer ogenomskinliga rekommenderas att ljuset växlas till ett dubbelt läge.
    2. Rengör och skölj skanningsbrickan med kranvatten.
    3. Häll 110 ml kranvatten lagrat vid rumstemperatur (RT) i skanningsbrickan tills glaset är täckt. Placera den stora ramen (24,5 cm x 15,8 cm) på skanningsfacket i rätt läge (med hörnet längst upp till vänster i skanningsfacket) och fyll den med kranvatten tills ramsteget är täckt för att undvika en meniskeffekt, vilket skulle förändra den skannade bilden. Stäng skannerlocket.
      OBS: Använd vatten vid RT för att undvika kondens och bubbelbildning. Rengör ramen utan märken eller droppar för att undvika ljusreflektion.
    4. Gå till bildbehandlingsprogrammet, välj arbetsprojektet och klicka på Skanna (Konvertera) bakgrundsbild.
    5. Gå till skanningsprogramvaran och klicka på Förhandsgranska. Se till att förhandsgranska den skannade bilden, kontrollera att det inte finns några linjer eller fläckar och vänta i minst 30 sekunder innan du startar en ny skanning. Klicka på Skanna och tryck på OK i instruktionsfönstret före den andra skanningen för att skicka data från skanningsprogramvaran till bildbehandlingsprogrammet.
      OBS: Skanna två gånger för att få de två bakgrundsskanningarna som kommer att utgöra det tomma. Det här steget görs en gång varje dag innan provbearbetningen påbörjas och bilderna lagras i mappen Zooscan_back.
    6. Stäng skanningsprogramvaran när du har slutfört skanningen.
  2. Provberedning och skanning
    VARNING: Etanol är en brandfarlig vätska och kan orsaka allvarliga ögonskador / irritation.
    1. Fyll i exempelmetadata. Gå till bildbehandlingsprogrammet och välj Fyll i exempelmetadata. Ange exempelidentiteten, klicka på OK och fyll i metadata.
      Metafilen är speciellt skapad för mesozooplanktonprover, så den passar inte den bentiska provtagningsmetoden för makroinvertebrater, men alla fält i filen måste fyllas i före skanningen, annars dyker en felflagga upp.
    2. Häll 110 ml 70% etanol i skanningsbrickan tills glaset är täckt och placera den stora ramen (24,5 cm x 15,8 cm) med hörnet längst upp till vänster på skanningsfacket.
      OBS: Arbeta med etanol istället för vatten, eftersom makroinvertebraterna bevaras i etanol. I vatten flyter de och driver i skanningsfacket, vilket förhindrar en skarp bild och därmed tillförlitliga storleksmätningar. Etanol bör bevaras vid RT för att undvika kondens och bubbelbildning.
    3. Häll provet från makroinvertebrater i skanningsbrickan kantad av ramen och täck ramsteget med mer etanol om det behövs.
      OBS: Avstå från att tillsätta för mycket etanol för att undvika att organismerna flyter och driver.
    4. Homogenisera provet i hela ramområdet, placera de största individerna i mitten av brickan för korrekt bildbehandling och sänk de flytande organismerna med en tränål.
      OBS: Om ett delprov numeriskt innehåller mer än 1 000 individer, dela upp delprovet i två eller flera fraktioner för att minimera beröring av organismer i den skannade bilden och skanna fraktionerna separat.
    5. Separera de rörande organismerna och organismerna som rör vid ramkanterna med tränålen.
      OBS: Detta steg kräver 5-20 min. Vidrörande organismer anses vara ett enda objekt av programvaran; I dessa fall motsvarar således de beräknade individuella storlekarna inte de faktiska enskilda organismerna och kan påverka uppskattningen av gemenskapens storleksstruktur. Det finns möjlighet att redigera bilden med bildbehandlingsprogramvaran för att separera dem, men detta ytterligare steg innebär minst 1,5 timmars upparbetning; Således rekommenderas manuell separation.
    6. För att skanna provet, stäng skannerlocket, gå till bildbehandlingsprogrammet, välj arbetsprojektet och klicka på SCAN-prov med Zooscan (För arkiv, ingen process).
    7. Välj exemplet och följ instruktionerna.
    8. Gå till skanningsprogramvaran och klicka på Förhandsgranska. Se till att förhandsgranska den skannade bilden, kontrollera att det inte finns några linjer eller fläckar och vänta minst 30 s innan du startar en ny skanning.
    9. Efter minst 30 s klickar du på knappen Skanna i skanningsprogrammet.
      OBS: Tryck på OK i bildbehandlingsprogrammet efter att ha tryckt på Scan i skanningsprogrammet. Tryck inte på någon tangent på datorns tangentbord och undvik vibrationer i skanningen under skanningen. Tre filer genereras i Zooscan_scan > _raw-mappen : (i) ett taggat bildfilformat (.tif) (16 bitar); ii) ett standardtextdokument med namnet LOG (.txt) som registrerar information om skanningsparametrarna, iii) ett standardtextdokument med namnet META (.txt) med information om provtagningsmetoderna.
    10. Kontrollera att rågenomsökningen är korrekt.
      Om skanningen har ljusa ränder eller andra synliga problem kan du överväga att upprepa skanningen för att undvika problem i följande steg.
  3. Återvinning av prover
    1. Ta bort ramen och skölj den ovanför skanningsfacket med en pressflaska fylld med 70% etanol för att återvinna eventuella bifogade makroinvertebrater.
    2. Lyft den övre delen av skannern för att hämta alla organismer och etanol från brickan genom skanningstratten till en bägare. Med den övre delen av skannern fortfarande lyft, skölj brickan med klämflaskan för att svepa längs eventuella kvarvarande organismer.
    3. För proverna och etanolen från bägaren genom ett nät på 500 μm för att behålla de ryggradslösa djuren i nätet och förvara dem tillbaka i en injektionsflaska med 70% etanol.
    4. När alla prover har återhämtats i injektionsflaskan, rengör brickan med kranvatten.
      OBS: Tvätta brickan med kranvatten mellan proverna för att minimera etanolutfällning, vilket förändrar bildbehandlingen. Skölj ramen med kranvatten för att undvika potentiella skador relaterade till etanolanvändning. I slutet av dagen, rengör brickan med kranvatten och torka den försiktigt med papper för att undvika repor.
  4. Bildbehandling
    1. Gå till bildbehandlingsprogrammet och välj KONVERTERA & BEARBETA bilder och organismer i batchläge och sedan Konvertera OCH bearbeta bild OCH partiklar (bild i RAW-mapp). Behåll standardinställningarna och klicka på OK. NORMAL END visas i slutet av processen.
      OBS: En PID-fil och vinjetterna som motsvarar alla upptäckta objekt i den skannade bilden (i en gemensam fotografisk gruppfil [.jpg]) skapas i mappen Zooscan_scan > _work. En PID-fil är en enda fil som lagrar alla metadata (metafil), tekniska data som är associerade med loggfilen och en tabell med 36 uppmätta variabler för alla objekt som upptäcks i bilden. De uppmätta variablerna motsvarar olika uppskattningar av grånivå, fraktaldimension, form och storlek. De variabler som kan användas för storleksuppskattning är arean och huvud- och småaxlarna för en ellips med lika stor yta som objektet (se avsnitt 3 i protokollet). Bearbetningstiden beror på bilddensiteten och datorns egenskaper och kan startas mellan proverna medan du återställer och förbereder nästa prov. Annars rekommenderas att starta bearbetningen av de skannade proverna varje dag i batchläge under natten och kontrollera om det finns korrekt bildbehandling nästa morgon.
    2. Kontrollera om bakgrunden i den bearbetade bilden subtraheras på lämpligt sätt från exempelbilden med hjälp av bildbehandlingsprogrammet eller genom att kontrollera maskbilderna (avslutade i msk1.gif) som finns i Zooscan_scan > _work. Om bakgrunden innehåller mättade områden eller många punkter kan du överväga att upprepa skanningen för att säkerställa bilder av hög kvalitet.
      OBS: För att undvika mättade områden i bakgrunden ska skanningsfacket sköljas med kranvatten efter varje skanning med etanol. Det är också viktigt att (1) minska antalet skannade individer (genom att fraktionera provet och skanna i olika veck); (2) se till att stora organismer placeras i mitten av skanningsfacket; (3) använd ren, filtrerad etanol; (4) minska smuts på proverna; 5) se till att volymen etanol för skanningen är tillräcklig, och (6) se till att fördröjningen mellan förhandsgranskningen av provet och skanningen är minst 30 s.
  5. Separering av vidrörande organismer
    OBS: När det finns flera vinjetter med vidrörande organismer är det nödvändigt att separera bilderna av de vidrörande organismerna från andra organismer och / eller från fibrer / skräp för att säkerställa en korrekt uppskattning av gemenskapens storleksstruktur.
    1. Gå till bildbehandlingsprogrammet för att upptäcka vinjetterna med flera objekt. Välj SEPARATION med vinjetter och tryck på OK. I fönstret för konfigurationsval behåller du standardinställningarna och klickar på OK.
    2. I fönstret SEPARATION från VIGNETTES behåller du standardinställningarna, väljer dessutom LÄGG TILL konturer på vinjetter och väljer sedan det exempel som ska redigeras.
    3. Separera de rörande organismerna i varje vinjett som dyker upp genom att rita en linje med musen (tryck på rullknappen för att rita). När separationen i en vinjett är klar klickar du på X-knappen i det övre högra hörnet av fönstret och trycker på JA för att bearbeta nästa. Tryck på NEJ för att avsluta och spara ändringarna. I slutet av processen visas NORMAL END om allt är korrekt.
    4. Efter separationen bearbetar du om bilden för att hämta uppdaterade objektdata. Gå till bildbehandlingsprogrammet, klicka på PROCESS (Konverterad) bild (Process One) och välj Bearbeta igen partiklar från bearbetade bilder i WORK-undermappar. Välj exemplet och behåll standardinställningarna i fönstret Enkel bildprocess , markera Arbeta med separationsmask (CREATE-MODIFY-INCLUDE) och klicka sedan på OK. I slutet av processen visas NORMAL END om allt är korrekt.
    5. I fönstret Separationskontroll trycker du på OK för att spara bilden med konturerna före bearbetningen. Om det finns en tidigare bild kommer den att ersättas.
    6. I fönstret Separation Control Mask , om det behövs, välj EDIT för att lägga till separationslinjer i masken med musen för att separera vidrörande organismer som inte har dykt upp tidigare i separationen med hjälp av vinjetter steg. När du är klar avslutar du processen och i fönstret Separation Mask Control väljer du JA för att acceptera masken. I slutet av processen visas NORMAL END om allt är korrekt.
      OBS: Upparbetning av ett prov med en separationsmask är tidskrävande (detta kan ta mer än 1,5 timmar per prov). Det är att föredra att ägna den tid som krävs i steg 1.2.5 för att undvika detta ytterligare steg.

2. Automatisk igenkänning av objekten

OBS: Skapa en inlärningsuppsättning för att automatiskt förutsäga identiteten hos de upptäckta objekten och därmed separera organismerna från skräpet i provet.

  1. Skapa inlärningsuppsättning
    1. Kopiera bilderna och .pid-filerna som är associerade med bilderna som ska användas för att skapa kategorierna för inlärningsuppsättningen från Zooscan_scan > _work till PID_process > Unsorted_vignettes_pid.
      OBS: Välj en delmängd av prover med hög taxadiversitet och olika provtagningsplatser och/eller provtagningssäsonger för att säkerställa maximal representativitet för organismerna i proverna.
    2. I mappen PID_process > Learning set skapar du en undermapp med namnet på den nya inlärningsuppsättningen (dvs. yyyymmdd_raw_LS) och inuti den skapar du undermapparna som motsvarar varje kategori i inlärningsuppsättningen (dvs. makroinvertebrater, skräp, andra ryggradslösa djur).
      OBS: För att effektivt få gemenskapens storleksstruktur för flodmakroinvertebratprover rekommenderas det att använda en inlärningsuppsättning baserad på bara tre kategorier: makroinvertebrater, andra ryggradslösa djur och skräp. Denna inlärningsuppsättning skiljer i princip vinjetterna av objekt som motsvarar organismer från de som motsvarar skräp (t.ex. fibrer, partiklar eller trådlösa alger).
    3. Gå till bildbehandlingsprogrammet (endast avancerat läge) och välj EXTRAHERA vinjetter för PLANKTON IDENTIFIER (osorterade vinjetter för träning). Behåll standardalternativen och markera rutan Lägg till konturer .
    4. Gå till programvaran för automatisk identifiering, klicka på Lärande, välj från PID_process > Learning_set den skapade undermappen för den nya inlärningsuppsättningen (steg 2.1.2) och tryck på OK.
    5. I det vänstra avsnittet (Osorterade tummar) i det öppna fönstret väljer du mappen Osorterad vignettes_pid. Välj vinjetterna och dra dem med musen från de osorterade tummarna till mappen i motsvarande kategori i det högra avsnittet, Sorterade tummar, för att klassificera varje objekt i de definierade kategorierna. De flyttade vinjetterna markeras med ett rött X.
      OBS: Definiera kategorierna manuellt genom att skapa undermappar i den sorterade tummappen eller skapa dem genom att klicka på mappikonen i programvaran. Flytta inte mer än 50 vinjetter samtidigt.
    6. När alla kategorier är färdiga med de valda objekten (cirka 300 objekt per kategori), klicka på Skapa inlärningsfil och spara den med önskat namn.
      OBS: Inlärningsuppsättningen sparas som en . pid-fil i mappen PID_process > Learning set i projektet. Det rekommenderas att skapa och testa flera inlärningsuppsättningar med olika nivåer av kategorier (från grova till fina former) och med en annan balans mellan antalet objekt inom varje kategori. Börja med en grov inlärningsuppsättning med ett lågt antal kategorier och minst 50 objekt per kategori, och öka sedan antalet objekt i varje kategori och/eller skapa finare inlärningsuppsättningar. En kategori bör vara representativ för dess variabilitet i uppsättningen prover.
  2. Utvärdering av inlärningsuppsättningen
    OBS: Utför korsvalidering med två veck och fem försök med hjälp av Random Forest-metoden med den automatiska identifieringsprogramvaran för att få en förvirringsmatris av den resulterande klassificeringen av objekten.
    1. Gå till den automatiska klassificeringsprogramvaran och klicka på Dataanalys.
    2. I Välj inlärningsfil väljer du den skapade inlärningsuppsättningsfilen från PID_process > Learning-uppsättning.
    3. I Välj en metod väljer du metoden Slumpmässig skog för korsvalidering . I Ursprungliga variabler avmarkerar du positionsvariablerna (X, Y, XM, YM, BX, BY och Höjd). I Anpassade variabler markerar du endast ESD.
      OBS: Den här metoden använder en slumpmässig del av inlärningsuppsättningen för att känna igen den andra delen (två gånger), och detta upprepas fem gånger för att säkerställa att den är statistiskt robust.
    4. Klicka på Starta analys och spara resultaten som Analysis_name.txt i mappen PID_process > Förutsägelse. När analysen har slutförts avslutar du dataanalysen.
    5. Gå till mappen PID_process > Förutsägelse och klicka på korsvalideringsfilen. Ett fönster dyker upp med förvirringsmatrisen för den sanna klassificeringen (rader) kontra den automatiska klassificeringen (kolumner).
      OBS: Återkallelsen är procentandelen organismer som tillhör en grupp som automatiskt var välkänd, medan 1-precision är procentandelen organismer som klassificeras av algoritmen som en grupp som inte känns igen (kontaminering i en grupp). Återkallelsen bör vara över 70% och föroreningen (1-precision) bör vara lägre än 20%.
    6. Upprepa steg 2.1-2.5 om flera inlärningsuppsättningar skapades och återkallelsen och 1-precisionen för var och en måste erhållas.
      OBS: Om flera inlärningsuppsättningar har skapats, välj den med störst återkallelse (bra igenkänning) och precision (låg kontaminering) av intressegruppen (dvs. makroinvertebrater) för att testa den automatiska förutsägelsen av en uppsättning prover i nästa steg.
  3. Förutsägelse av identifiering av makroinvertebrater
    Använd den valda inlärningsuppsättningen för att förutsäga identiteten för alla objekt i en delmängd av proverna med hjälp av den automatiska identifieringsprogramvaran med en slumpmässig skogsalgoritm.
    1. Gå till programvaran för automatisk identifiering och klicka på Dataanalys.
    2. I Välj inlärningsfil väljer du inlärningsuppsättningsfilen från PID_process > Learning-uppsättning som måste användas för förutsägelsen.
    3. I Välj exempelfil (er) väljer du från mappen PID_results de exempel (PID-filer) som kommer att förutsägas.
      Bearbeta högst 20 .pid-filer samtidigt för att undvika fel relaterade till minnesproblem. Om för många .pid-filer bearbetas samtidigt kommer processen att visa ett korrekt slut men kanske inte behandlas bra, och ett fel kan uppstå i nästa steg vid bearbetning med bildbehandlingsprogrammet.
    4. I Välj en metod väljer du metoden Slumpmässig skog . Markera Spara detaljerade resultat för varje prov. I Ursprungliga variabler avmarkerar du positionsvariablerna (X, Y, XM, YM, BX, BY och Höjd). I Anpassade variabler markerar du endast ESD.
    5. Klicka på Starta analys och spara resultaten som Analysis_name.txt i mappen PID_process > Förutsägelse.
  4. Manuell validering
    En expert validerar förutsägelsen manuellt från föregående steg för att omklassificera felklassificerade objekt till rätt kategori.
    1. Kopiera de Analysis_sample_dat1.txt filerna som ska verifieras från mappen PID_process > förutsägelse till mappen PID_process > Pid_results.
    2. Gå till bildbehandlingsprogrammet och välj EXTRAHERA vinjetter i mappar enligt FÖRUTSÄGELSE eller VALIDERING. Välj sedan Använd PREDICTED Files från mappen "pid_results". Behåll standardinställningarna och tryck på OK.
    3. Programvaran skapar en mapp som heter sample_yyyymmdd_hhmm_to_validate med de förutsagda objekten i mappen PID_process > Sorterade vinjetter.
    4. Gå till mappen PID_process > Sorterade vinjetter och kopiera mappen sample_yyyymmdd_ hhmm_to_validate. Ersätt mappnamnet _to validera med _validated.
    5. Om du vill validera den automatiska klassificeringen manuellt öppnar du mappen sample_yyyymmdd_ hhmm_validated och granskar alla vinjetter från varje undermapp (kategori) för att identifiera om det finns felklassificerade objekt. När ett objekt är felklassificerat drar du vinjetten med musen till rätt mapp (kategori).
    6. Gå till bildbehandlingsprogrammet och välj LOAD Identifications från sorterade vinjetter. Behåll standardinställningarna och välj yyyymmdd_hhmm_name_validated som ska bearbetas.
    7. Gå till PID_process > Pid_results > Dat1_validated, där en fil med namnet Id_from_sorted_vignettes_yyyymmdd_hhmm.txt och en .txt fil för vart och ett av de validerade exemplen (sample_tot_1_dat1.txt) har skapats.
      Dessa .txt filer innehåller en ny kolumn som presenterar förutsägelsen, kallad pred_valid_Id_yyyymmdd_hhmm, som anger expertklassificeringen för varje objekt (dvs. den validerade klassificeringen). Nya kategorier (t.ex. finare taxonomiska kategorier) kan skapas vid denna tidpunkt under valideringen. Behåll dock namnet på den ursprungliga kategorin i det nya namnet (t.ex. macroinvertebrate_chironomidae). Detta gör det möjligt att spåra den ursprungliga kategorin vid beräkning av återkallelsen och precisionen och för att enkelt gruppera alla makroinvertebrater för att beräkna parametrarna för gemenskapens storleksstruktur (dvs. storleksspektrumet och storleksdiversiteten). Textfilen innehåller data som är associerade med varje objekt, inklusive de mindre och större axlarna som används för att erhålla den ellipsoida volymen för varje organism som ett mått på individuell kroppsstorlek. Dessutom innehåller de två sista kolumnerna i tabellen de förutsagda och validerade kategorierna för varje objekt (rad), vilket gör det möjligt att beräkna, per kategori, återkallelsen och precisionen för inlärningsuppsättningen på delmängden av prover.Figure 1

Figur 1: Arbetsschema som representerar avsnitt 1 och avsnitt 2 i protokollet. Tiderna är illustrativa och kan ändras beroende på datorn, överflödet av vinjetter att bearbeta och antalet kategorier i inlärningsuppsättningen. Detta fall motsvarar valideringen av en inlärningsuppsättning med tre kategorier på en uppsättning av 42 delprover (totalt 47 473 vinjetter). Klicka här för att se en större version av denna siffra.

3. Beräkning av individuell storleksfördelning, storleksspektra och storleksmått

OBS: Beräkningarna som nämns i detta avsnitt utfördes med hjälp av Matlab (se skript som tilläggsfil 1).

  1. Individuell storleksfördelning
    1. Den sista kolumnen i den Id_from_sorted_vignettes_YYYYMMDD_HHHH.txt filen innehåller den validerade klassificeringen av objekten. Välj endast de objekt som klassificeras som makroinvertebrater för att avbilda deras individuella storleksfördelning i provet.
      OBS: Individuell kroppsstorlek motsvarar den ellipsoida volymen hos de makroinvertebrata organismerna. Systemet tillhandahåller mätningar i pixlar.
    2. Sammanfoga vektorerna med storleksmätningarna från båda skanningarna, eftersom varje fraktion har en annan delsamplingsexponent. Före sammanfogningen korrigerar du för fraktioneringen genom att replikera storleksvektorerna så många gånger som motsvarande delprov har fraktionerats.
      OBS: Detta steg behövs om en skanning motsvarar en bråkdel av ett prov (dvs. grovt eller fint).
    3. Beräkna den ellipsoida volymen från huvud- (M) och mindre (m) axlarna av prolatellipsoider med samma pixelområden som organismerna. Innan du beräknar den ellipsoida volymen ska du konvertera huvudaxlarna (M) och mindre (m) från pixlar till millimeter (mm) med följande omvandlingsfaktor (cf):
      1 pixel = 2 400 dpi
      1 tum = 25,4 mm
      jfr = 25.4/2400
      Den ellipsoida volymen (ellipVol med enheter i mm3) motsvarar:
      Equation 1
    4. Avbilda sannolikhetstäthetsfunktionen för den individuella storleksfördelningen på log2-skalan .
  2. Storlek mångfald
    1. Beräkna storleksdiversiteten (Sd) efter Quintana et al. (2008)8, som i García-Comas et al. (2016)35:
      Equation 2
      där p x(x) är sannolikhetstäthetsfunktionen för storlek x och x representerar log2 (ellipVol). Detta mått är därför Shannons mångfaldsindex anpassat till ett kontinuerligt mått, såsom den individuella storleksfördelningen i ett samhälle.
  3. Normaliserat biovolymstorleksspektrum (NBSS)
    1. Definiera storleksklasserna för NBSS, fastställa spektrumets nedre gräns som 0,01-kvantilen för makroinvertebratstorleksfördelningen i proverna och skapa storleksklasser med en geometrisk skala av bas 2 tills den största organismen i proverna omfattas.
      Storleksklassens bredd ökar med storleken för att ta hänsyn till den större variationen i samband med större storlekar. NBSS för de makroinvertebratsamhällen som analyserades här hade 14 storleksklasser (tabell 1).
    2. Hämta den normaliserade biovolymen genom att dividera den totala biovolymen i varje storleksklass med storleksklassens bredd.
  4. Storlek spektrum lutning
    1. Beräkna den linjära lutningen för NBSS.
      OBS: Lutningen (μ) beräknas baserat på förhållandet mellan log 2 (storleksklass mittpunkt) och log2 (normaliserad biomassa) i storleksklasserna större än läget, ignorerar eventuella tomma (i denna studie, storleksklasserna från 3 till 14).
Gränser för storleksklass (mm 3) Storleksklass mittpunkt (mm 3)
0,1236 0,1855
0,2473 0,3709
0,4946 0,7418
0,9891 1,4837
1,9783 1,4837
3,9560 5,9348
7,9131 11,8696
15,8261 23,7392
31,6522 47,4783
63,3044 94,9567
126,6089 189,9133
253,2178 379,8267
506,4300 7597,7000
1012,9000 15193,0000
2025,7000

Tabell 1: Storleksklasser för det normaliserade biomassastorleksspektrumet (NBSS). Tabellen visar också de 15 storleksklassgränserna och storleksklassens mittpunkter för organismerna.

Subscription Required. Please recommend JoVE to your librarian.

Representative Results

Förvärv av digitala bilder av makroinvertebrata prover
Skanningsnyanser: Etanolavsättning i skanningsfacket
När man testade systemet för makroinvertebrater var flera skanningar av dålig kvalitet. Ett mörkt mättat område i bakgrunden förhindrade normal bearbetning av bilden och mätning av de enskilda storlekarna på makroinvertebraterna (figur 2). Flera skäl har angetts för utseendet på mättade områden i bakgrunden eller mycket pixelerade bilder: (1) närvaron av för många organismer på skanningsfacket; 2) förekomsten av smuts i proverna, 3) En otillräcklig fördröjning mellan förhandsgranskningen av provet och dess skanning. eller (4) använda i bildbehandlingen en bakgrundsbild av dålig kvalitet på grund av kondens, smuts eller dålig vattenkvalitet33. I makroinvertebratgemenskapsprover orsakar användningen av etanol istället för vatten nederbörd på brickan, vilket bildar en mörk skugga om den inte sköljs ordentligt med vatten mellan skanningarna. Detta är viktigt för att få skarpa bilder och för att minimera eventuell relaterad korrosion av skanningsbrickans glas.

Skanna nyanser: Skräpkoncentration
Från analysen av en delmängd av 47 473 vinjetter motsvarade en hög andel (86,1%) skräp, inklusive detritus, fibrer eller kroppsdelar (som ben eller gälar) eller skanningsartefakter (figur 3A-E). Ryggradslösa organismer motsvarade de återstående 13,9% av de detekterade föremålen (figur 3F-L). Således, trots den tidigare noggranna separationen av organismer från organiskt material i laboratoriet, kvarstod fortfarande mycket små skräp i flaskan.

Skanna nyanser: Vidröra objekt
Den signifikanta närvaron av skräp ökar beröringen mellan organismer, och därför skapandet av vinjetter med aggregat som innefattar flera vidrörande organismer och organismer fästa vid partiklar eller fibrer (Figur 4A-C). Dessa vinjetter är en källa till bias vid bestämning av formen på den individuella storleksstrukturen. I en uppsättning av fem prover (11 delprover), av alla vinjetter med makroinvertebrater, motsvarade 10% grupper med rörande organismer eller organismer som berör partiklar eller fibrer. Dessa vinjetter redigerades med bildbehandlingsprogrammet för att separera de rörande organismerna och organismerna med fästa partiklar. Upparbetning av proverna med separationsmasken innebar skapandet av nya vinjetter med de nyligen separerade objekten, som validerades för att säkerställa deras korrekta klassificering.

Automatisk igenkänning av objekten
Resultat för inlärningsuppsättning
En inlärningsuppsättning är en uppsättning vinjetter av objekt som klassificeras i olika kategorier av en expert och används i en övervakad inlärningsmodell, och detta kan också kallas en träningsuppsättning27. Det är möjligt att arbeta med en befintlig inlärningsuppsättning, uppdatera den befintliga inlärningsuppsättningen med nya vinjetter och/eller kategorier eller skapa en ny inlärningsuppsättning för ett specifikt projekt.

För att bestämma den bästa inlärningsuppsättningen för att snabbt få makroinvertebratstorleksstrukturen skapades och testades flera inlärningsuppsättningar genom korsvalidering med Random Forest-algoritmen. Den resulterande förvirringsmatrisen visar den sanna klassificeringen (rader) jämfört med den automatiska klassificeringen (kolumner). Återkallelsen är procentandelen organismer som tillhör en kategori som automatiskt klassificerades väl, medan 1-precisionen är procentandelen organismer som felaktigt klassificerats av algoritmen som tillhörande en kategori (kontaminering i en kategori)33. Som en tumregel bör återkallelsen vara över 70%, och föroreningen (1-precision) bör vara lägre än 20% för att hålla en kategori i inlärningsuppsättningen. Inlärningsuppsättningen med den största återkallelsen och precisionen för makroinvertebrater valideras sedan ytterligare med en delmängd av prover för att bestämma dess verkliga noggrannhet vid identifiering av makroinvertebrater.

Tre typer av ataxiska inlärningsuppsättningar (råa, mellanliggande och fina) med kategorier baserade på objektens morfologiska egenskaper testades. Den råa inlärningsuppsättningen inkluderade tre kategorier: makroinvertebrater, andra ryggradslösa djur (mikrokräftdjur) och skräp (fibrer, partiklar och artefakter som glasfläckar). Den mellanliggande inlärningsuppsättningen inkluderade 16 kategorier: 5 för makroinvertebrater, 3 för andra ryggradslösa djur och 8 för skräp. Den fina inlärningsuppsättningen inkluderade ytterligare 4 kategorier av makroinvertebrater, med totalt 20 kategorier (tabell 2).

Förutom att definiera kategorierna testades också effekten av antalet vinjetter per kategori. Varje inlärningsuppsättning testades separat med 50 vinjetter, 100 vinjetter och 300 vinjetter i varje kategori (och 500 vinjetter för den råa inlärningsuppsättningen med tre kategorier). Alla kategorier var balanserade i antal förutom "Ostracoda", "långrunda makroinvertebrater" och "makroinvertebrater med runt skal", som inkluderade färre individer i de 100 vinjett- och 300 vinjettinlärningsuppsättningarna eftersom inte tillräckligt med organismer i dessa kategorier upptäcktes i de skannade bilderna.

Återkallandet av och precisionen för makroinvertebrater (alla makroinverebratkategorier tillsammans) och organismer (kategorierna makroinvertebrater och andra ryggradslösa djur tillsammans) ansågs välja den bästa inlärningsuppsättningen genom korsvalidering (se tabellerna i tilläggsfil 2). Den bästa inlärningsuppsättningen var den råa inlärningsuppsättningen med tre kategorier (makroinvertebrater, andra ryggradslösa djur och skräp), med 300 objekt i varje kategori (tabell 2). Den råa inlärningsuppsättningen användes därefter för att validera den automatiska klassificeringen av objekten i delmängden av skannade prover.

Uppsättning för lärande Antal kategorier Bilder per kategori Återkalla organismer Minns makro-ryggradslösa djur 1-precision organismer 1-precision makroinvertebrater
3 50 0.97 0.84 0.12 0.24
100 0.96 0.87 0.06 0.17
300 0.95 0.91 0.09 0.15
500 0.93 0.88 0.13 0.2
Medium 16 50 0.83 0.77 0.17 0.24
100 0.84 0.79 0.15 0.21
300 0.87 0.84 0.14 0.18
Böter 20 50 0.89 0.86 0.14 0.18
100 0.9 0.87 0.11 0.14
300 0.9 0.86 0.13 0.14

Tabell 2: Skapade och testade inlärningsuppsättningar (råa, mellanliggande och fina) med kategorierna inom var och en och antalet objekt per kategori. Minns och 1-precision av de skapade inlärningsuppsättningarna. Kategorier av Raw-inlärningsuppsättningen: Makroinvertebrater (1), Andra ryggradslösa djur (2), Skräp (3). Kategorier av mediuminlärningsuppsättningen: Långa makroinvertebrater (1), Långa släta makroinvertebrater (2), Långa taggiga makroinvertebrater (3), Runda makroinvertebrater (4), Makroinvertebrater med runt skal (5), Cladocera (6), Copepoda (7), Ostracoda (8), Aggregat (9), Fibrer (10), Huvuden (11), Ben (12), Fläckar (13), Mörka fläckar (14), Ljusgrå fläckar (15), Runda fläckar (16). kategorier av fina inlärningsuppsättningar: Långa makroinvertebrater (1), Långa släta makroinvertebrater (2), Långa släta mörka makroinvertebrater (3), Långa runda makroinvertebrater (4), Långa taggiga makroinvertebrater (5), Runda makroinvertebrater (6), Runda makroinvertebrater (7), Runda mörka makroinvertebrater (8), Makroinvertebrater med rundskal (9), Cladocera (10), Copepoda (11), Ostracoda (12), Aggregat (13), Fibrer (14), Huvuden (15), Ben (16), Fläckar (17), Mörka fläckar (18), ljusgrå fläckar (19), Runda fläckar (20).

Validering av automatisk igenkänning med den bästa inlärningsuppsättningen
Objekten i en delmängd av 42 fina och grova delsamplingar klassificerades automatiskt av den valda inlärningsuppsättningen med algoritmen Random Forest. Efter manuell validering var återkallelsen för alla kategorier hög (i genomsnitt 0,94 för makroinvertebrater, 0,95 för andra ryggradslösa djur och 0,92 för skräp), medan föroreningen (1-precision) var ganska låg, förutom för andra ryggradslösa djur (0,25 för makroinvertebrater, 0,84 för andra makroinvertebrater och 0,01 för skräp) (Figur 5 ). Andra ryggradslösa djur (mikrokräftdjur) var sällsynta i proverna (förekommer i 17 av 42 delprover); Jämförelsen var således inte robust. Dessutom påverkades denna kategori starkt av föroreningen på grund av likheten i form och grånivåer med andra föremål.

Jämförelsen av automatisk kontra validerad förekomst av makroinvertebrater visade att dessa var starkt korrelerade (Pearsons r = 0,92, p-värde < 0,0001, n = 24 för grova delprover; Pearsons r = 0,98, p-värde < 0,0001, n = 18 för fina delprover), med en liten överskattning av den automatiska prestandan på grund av förorening från skräp (sluttningar < 1) (figur 6). När det gäller jämförelsen av den genomsnittliga ellipsoida volymen var korrelationen också hög (Pearsons r = 0,96, p-värde < 0,0001, n = 24 för grova prover; Pearsons r = 0,99, p-värde < 0,0001, n = 18 för fina prover) och storleksspektrumets lutning var nära −1 (figur 6). Skillnaden i sluttningarna mellan de fina och grova fraktionerna återspeglar den större effekten av felklassificering i de stora storleksfraktionerna, vilket är relaterat till deras låga organismantal.

Sannolikhetstäthetsfunktionerna för de individuella storleksfördelningarna för den automatiska förutsägelsen överensstämde starkt med de validerade förutsägelserna för de fina delproverna, liksom för de grova delproverna. Det fanns dock vissa undantag för de grova delproverna relaterade till antalet organismer och därmed större effekt av felklassificering i dessa fall, vilket framhållits tidigare (figur 7).

Effekt av att röra vid organismer på individuella storleksfördelningar, storleksspektra och storleksmått
En jämförelse av storleksfördelningarna erhållna före och efter separationen av de vidrörande organismerna och före valideringen i en delmängd av fem utvalda prover utfördes för att bedöma effekten av beröring av föremål. För att jämföra storleksfördelningarna kombinerades de grova och fina delproverna, beroende på deras fraktionering, för att rekonstruera ett prov som representerar makroinvertebratsamhället. I tre prover ökade mängden efter validering (>500 individer) (figur 8A). Trots denna ökning passar den genomsnittliga ellipsoidala volymen mycket nära den som beräknats i de validerade proverna (figur 8B).

Storleksfördelningarna för de korrigerade proverna (efter separation av vidrörande organismer) skilde sig något från de validerade. Således hade närvaron av flera objekt ett litet inflytande på storleksfördelningarna i dessa prover (figur 9A-E). Följaktligen korrelerade storleksdiversiteten beräknad baserat på de korrigerade proverna starkt med storleksdiversiteten hos de validerade (Pearsons r = 0,94, p-värde = 0,017, n = 5) (Figur 9F).

Teoretiskt sett har det normaliserade biovolymstorleksspektrumet (NBSS) i ett samhälle med flera trofiska nivåer en storleksspektrumlutning i log2-skalan som närmar sig -1 under steady state-förhållanden4. NBSS i naturliga samhällen har ofta en bump snarare än en linjär fördelning, och detta tillskrivs mestadels provtagningsbiasen för de minsta storleksklasserna36. I den aktuella studien var den tredje storleksklassen den vanligaste i NBSS.

NBSS: erna var ganska lika mellan stegen i protokollet (figur 10A-C), förutom några storleksklasser i ett par spektra (figur 10D-E). Följaktligen korrelerade storleksspektrumlutningen beräknad baserat på de korrigerade proverna starkt med lutningen baserat på de validerade (Pearsons r = 0,99, p-värde ≤ 0,0001, n = 5) (Figur 10F).

Figure 2
Figur 2: Exempel på skannade bilder med olika kvaliteter före och efter bearbetning. (A,B) Råbild (vänster) och bearbetad bild (höger) av ett fint delprov med god skanningskvalitet; (C,D) Rå bild (vänster) och bearbetad bild (höger) av ett fint delprov med dålig skanningskvalitet (mörk bakgrund och klippt bild på vänster kant); (E,F) råbild (vänster) och bearbetad bild (höger) av ett fint delprov med dålig skanningskvalitet (mycket pixelerad mörk bakgrund). Klicka här för att se en större version av denna siffra.

Figure 3
Figur 3: Konturvinjetter som representerar olika objekt som finns i proverna. (A-E) Skräp (fiber, rund fläck, makroinvertebratben, fläckar och organiskt skräp); (F-I) makroinvertebrater (Coleoptera, Diptera, Plecoptera och Trichoptera) och (J-L) andra ryggradslösa djur (Cladocera, Copepoda och Ostracoda). Skalstänger indikerar 1 mm gma = 1,1. Klicka här för att se en större version av denna siffra.

Figure 4
Bild 4: Exempel på vinjetter som innehåller flera objekt . A) Ett makroinvertebrat (Hydracarina) fäst vid en fiber. B) Flera organismer (Caenidae) som aggregerats av en fiber. och (C) två rörande makroinvertebrater (Chironomidae och Caenidae). Skalstänger indikerar 1 mm gma = 1,1. Klicka här för att se en större version av denna siffra.

Figure 5
Figur 5: Boxplots för återkallelse och kontaminering (1-precision). Boxplots för de tre kategorierna av makroinvertebrater, andra ryggradslösa djur och skräp (300 vinjetter per kategori) i den valda inlärningsuppsättningen validerade på en delmängd av proverna (n = 42). Klicka här för att se en större version av denna siffra.

Figure 6
Figur 6: Jämförelse mellan uppskattningar av överflöd och genomsnittlig ellipsoid volym i automatisk kontra validerad klassificering. (A) Uppskattningar av överflöd i delproverna (n = 42) och (B) genomsnittliga uppskattningar av ellipsoida volymer i delproverna (n = 42). De mörka prickarna motsvarar de grova delproverna (>0,5 cm nät); De grå prickarna motsvarar de fina delproverna (>500 μm nät). Den streckade linjen representerar förhållandet 1:1. Klicka här för att se en större version av denna siffra.

Figure 7
Figur 7: Sannolikhetstäthetsfunktioner som representerar det relativa bidraget (y-axeln) för den enskilda storleken i logskalan (x-axeln) för jämförelse mellan automatiska uppskattningar och mellan validerade uppskattningar. (A,B) Automatiska och validerade uppskattningar för grova delprov (n = 18), (C,D) Automatiska och validerade uppskattningar för fina delprover (n = 24). (A,C) Jämförelse mellan automatiska skattningar och (B,D) jämförelse mellan validerade skattningar. Färger representerar varje delprov för att hjälpa till att urskilja spektra. Klicka här för att se en större version av denna siffra.

Figure 8
Figur 8: Jämförelse mellan uppskattningar av överflöd och genomsnittlig ellipsoid volym i validerade delprover jämfört med delprover som validerats efter separation av vidrörande föremål från utvalda naturliga prover (fina och grova delprover tillsammans ). (A) Uppskattningar av överflöd genom urvalsram (n = 5) och (B) genomsnittliga ellipsoida volymuppskattningar (n = 5). Den streckade linjen representerar förhållandet 1:1. Klicka här för att se en större version av denna siffra.

Figure 9
Figur 9: Sannolikhetstäthetsfunktioner som representerar det relativa bidraget (y-axeln) för den enskilda storleken i log2-skalan (x-axeln) för automatisk förutsägelse, validerad förutsägelse och validerad förutsägelse med deras respektive storleksdiversitetsvärden (Sd). (A-E) Sannolikhetstäthetsfunktioner för utvalda naturliga prover (fina och grova delprover tillsammans) (n = 5). den röda linjen motsvarar den automatiska förutsägelsen, den blå linjen motsvarar den validerade förutsägelsen och den gröna linjen motsvarar de korrigerade proverna (validerade efter separation av vidrörande objekt). F) Jämförelse mellan validerade och korrigerade uppskattningar av storleksmångfald. Den streckade linjen motsvarar förhållandet 1:1. Klicka här för att se en större version av denna siffra.

Figure 10
Figur 10: Normaliserade biovolymstorleksspektra (NBSS) och jämförelse av NBSS-sluttningar (μ) mellan behandlingarna. (A-E) NBSS som representerar förhållandet mellan mittpunktsvärdet för varje storleksklass i logskalan (x-axeln) kontra den normaliserade biovolymen per skanningsram (y-axel) för de fem valda proverna för de automatiska (röda korsen), validerade (blå trianglar) och korrigerade (gröna cirklar) förutsägelser med deras respektive storleksspektrum sluttningar (μ) beräknade i storleksklasserna från från den modala storleksklassen och uppåt (den tredje storleksklassen indikeras av den vertikala streckade linjen). (F) Jämförelse av de lutningar som beräknats på de validerade proverna med de korrigerade (efter separation av vidrörande föremål). Den streckade linjen motsvarar förhållandet 1:1, r2. Klicka här för att se en större version av denna siffra.

Tilläggsfil 1: Matlab-skript för att utföra beräkningarna. Klicka här för att ladda ner den här filen.

Tilläggsfil 2: Korsvalidering, återkallelse och 1-precision för de skapade inlärningsuppsättningarna. (A) Råinlärningsuppsättning med 3 kategorier och 50 vinjetter per kategori; (B) Råinlärningsuppsättning med 3 kategorier och 100 vinjetter per kategori. (C) Råinlärningsuppsättning med 3 kategorier och 300 vinjetter per kategori. (D) Råinlärningsuppsättning med 3 kategorier och 500 vinjetter per kategori. (E) Råinlärningsuppsättning med 5 kategorier och 50 vinjetter per kategori. (F) Råinlärningsuppsättning med 5 kategorier och 100 vinjetter per kategori. (G) Råinlärningsuppsättning med 5 kategorier och 300 vinjetter per kategori. H) Mellanliggande inlärning med 16 kategorier och 50 vinjetter per kategori. I) Mellanliggande inlärning med 16 kategorier och 100 vinjetter per kategori. J) Mellanliggande inlärning med 16 kategorier och 300 vinjetter per kategori. (K) Fina inlärningsuppsättningar med 20 kategorier och 50 vinjetter per kategori. (L) fin inlärningsuppsättning med 20 kategorier och 100 vinjetter per kategori; och (M) fin inlärningsuppsättning med 20 kategorier och 300 vinjetter per kategori. Klicka här för att ladda ner den här filen.

Subscription Required. Please recommend JoVE to your librarian.

Discussion

Anpassningen av den metod som beskrivs av Gorsky et al. 2010 för flodmakroinvertebrater möjliggör hög klassificeringsnoggrannhet vid uppskattning av gemenskapens storleksstruktur hos sötvattensmakroinvertebrater. Resultaten tyder på att protokollet kan minska tiden för att uppskatta den individuella storleksstrukturen i ett prov till cirka 1 timme. Således är det föreslagna protokollet avsett att främja rutinmässig användning av makroinvertebraters storleksspektra som en snabb och integrerande bioindikator för att bedöma effekterna av störningar i sötvattenekosystem. Makroinvertebraternas storleksspektrum har redan använts som ett framgångsrikt index för att utvärdera den ekologiska statusen för kustlaguner22. Med utvecklingen av protokollet kan intensiva undersökningar av ryggradslösa djur genomföras för att möjliggöra fältövervakningskampanjer som täcker stora rumsliga och tidsmässiga skalor.

Eftersom syftet med detta protokoll är att få den individuella storleksfördelningen för det samplade samhället på ett snabbt sätt, utan hänsyn till taxonomi, rekommenderas det att skapa en enkel inlärningsuppsättning som den som föreslås här. Tester av finare inlärningsuppsättningar, med ett högre antal kategorier, ger lägre återkallelse och precision för makroinvertebrater som helhet (tabell 2), och valideringssteget är mer tidskrävande.

Den automatiska förutsägelsen överensstämde starkt med den validerade förutsägelsen av 42 naturliga delprover från olika provtagningsställen, vilket tyder på att metoden i automatiskt läge är lämplig för att räkna och mäta makroinvertebrater i naturliga prover (figur 6). Dessutom tyder likheten i NBSS mellan de automatiska och validerade förutsägelserna och den höga passformen till den linjära teoretiska modellen på att det automatiska läget är en lovande metod för att bedriva teoretiska ekologiska studier (figur 10).

Under anpassningen av detta protokoll uppstod flera problem, och de löstes eller minimerades på olika sätt. En fråga att ta hänsyn till vid skanning av makroinvertebratprover är utseendet på mörka mättade områden. Därför är det viktigt att kontrollera de bearbetade, skannade bilderna så snart som möjligt för att upptäcka detta problem och upprepa skanningen om det behövs. Detta problem har också hittats vid skanning av plankton33, men det ökar genom användning av etanol istället för kranvatten. Det rekommenderas inte att använda kranvatten, eftersom de organismer som bevaras i 70% etanol kommer att driva på ytan. Även om enheten är utformad för att motstå utspädd etanol (5%), bevaras de ryggradslösa proverna med 70% etanol. Att arbeta med lägre koncentrationer av etanol rekommenderas inte heller, eftersom organismerna kan skadas genom rehydrering och uttorkningsprocesser37. Den föreslagna lösningen, som rekommenderas starkt, är att skölja skanningsbrickan med färskt vatten flera gånger efter varje skanning som utförts med etanol. Detta undviker ansamling av utfällningar som kan förändra bildbakgrunden och skyddar glaset i skanningsfacket från korrosion.

Ett annat upptäckt problem är närvaron av vinjetter med flera organismer, vilket kan ändra storleksspektrumet på grund av underskattning av individer av vissa storlekar. När antalet vinjetter med flera objekt är lågt (<10%), som i denna studie, har närvaron av flera objekt ett litet inflytande på storleksfördelningarna och NBSS i dessa prover (figur 9 och figur 10). Detta indikerar att för att få en representativ storleksstruktur för makroinvertebratsamhället är det inte nödvändigt att investera tid i steg 1.5 i protokollet (separation av vidrörande organismer), för vilka bildupparbetningen varar ca 1,5 h. Istället rekommenderas det starkt att ta tid i steg 2.5 i protokollet (separera vidrörande organismer eller aggregat med hjälp av en tränål), vilket är mycket mindre tidskrävande (högst 30 min) och säkerställer en korrekt uppskattning av storleksfördelningarna i automatiskt läge30. Ett alternativ för att minska antalet vidrörande organismer är att arbeta med färre organismer per skanning, men det tidsåtagande som investeras i att skanna ett prov i ett stort antal fraktioner och möjligheten till aggregering av organismer bör beaktas. En annan lösning skulle vara att bevara endast ett delprov som skulle göra det möjligt att beräkna ett representativt storleksspektrum vid sortering av organismerna i laboratoriet istället för att bevara alla provtagna organismer, som görs i detta arbete. Minskningen av antalet organismer per prov skulle minska sannolikheten för att röra vid organismer. Dessutom, när färre individer lagras, innehåller provet mindre skräp, vilket underlättar separationen, särskilt om fibrer kan undvikas.

Den observerade begränsningen av den automatiska klassificeringsmetoden är relaterad till den låga närvaron av mikrokräftdjur (kategori: andra makroinvertebrater) i de använda proverna. Bristen på representation av mikrokräftdjur kan påverka deras korrekta klassificering och begränsa precisionen i den automatiska förutsägelsen för denna kategori. Ändå presenterar de andra kategorierna, skräp och makroinvertebrater, som är huvudsyftet med detta arbete, hög återkallelse och precision. Alternativ till att använda denna skanneranordning skulle vara att anpassa en gemensam skanner för att hålla vattenramar, främja öppen källkod för provbehandling och maskininlärning som den som tillhandahålls här och skriva koder för att mäta organismer under mikroskopet med en kamera eller genom flöde med en uppsättning kameror. Detta har gjorts vid flera tillfällen 23,24,25,26,38,39,40, men metoden som vi föreslår reglerar skanningsparameteriseringen för att få jämförbara storleksuppskattningar, vilket är svårt att kontrollera med de andra systemen. Dessutom är det föreslagna protokollet och skanningsanordningen redo att användas, öppen källkod och redan etablerade i det marina mesozooplanktonsamhället. Sammantaget visar anpassningen av detta protokoll en lovande väg för att använda denna automatiska avbildningsmetod för att effektivt få storleksstrukturen hos sötvattensmakroinvertebrater och för att testa potentialen för storleksmått för sötvattenbiobedömning.

Subscription Required. Please recommend JoVE to your librarian.

Disclosures

Författarna förklarar inga potentiella konkurrerande intressen.

Acknowledgments

Detta arbete stöddes av det spanska ministeriet för vetenskap, innovation och universitet (bidragsnummer RTI2018-095363-B-I00). Vi tackar CERM-UVic-UCC-medlemmarna Èlia Bretxa, Anna Costarrosa, Laia Jiménez, María Isabel González, Marta Jutglar, Francesc Llach och Núria Sellarès för deras arbete inom makroinvertebratfältprovtagning och laboratoriesortering och David Albesa för att ha samarbetat i provskanningen. Vi tackar slutligen Josep Maria Gili och Institut de Ciències del Mar (ICM-CSIC) för användningen av laboratoriefaciliteterna och skannerenheten.

Materials

Name Company Catalog Number Comments
Beaker Labbox Other containers could be used
Dionized water Icopresa  8420239600123 To dilute the ethanol
Funnel Vitlab 41094
Glass vials 8 ml Labbox SVSN-C10-195 1 vial/subsample
ImageJ Software  Free access Version 4.41o/ Image processing software
Large frame Hydroptic  Provided by ZooScan 24.5 cm x 15.8 cm
Monalcol 96 (Ethanol 96) Montplet 1050JE001
Plankton Identifier Software Free access Version 1.2.6/ Automatic identification software
Sieve Cisa 26852.2 Nominal aperture 500µ and nominal aperture 0,5 cm
Tweezers Bondline B5SA Stainless, anti-magnetic, anti-acid
VueScan 9 x 64 (9.5.09) Software Hydroptic Version 9.0.51/ Sacn software
Wooden needle Any plastic or wood needle can be used
Zooprocess Software  Free access Version 7.14/Image processing software
ZooScan  Hydroptic 54 Version III/ Scanner

DOWNLOAD MATERIALS LIST

References

  1. Birk, S., et al. Three hundred ways to assess Europe's surface waters: An almost complete overview of biological methods to implement the Water Framework Directive. Ecological Indicators. 18, 31-41 (2012).
  2. Basset, A., Sangiorgio, F., Pinna, M. Monitoring with benthic macroinvertebrates: advantages and disadvantages of body size descriptors. Aquatic Conservation: Marine and Freshwater Ecosystems. 14, S43-S58 (2004).
  3. Reyjol, Y., et al. Assessing the ecological status in the context of the European Water Framework Directive: Where do we go now. Science of the Total Environment. 497-498, 332-344 (2014).
  4. Brown, J. H., Gillooly, J. F., Allen, A. P., Savage, V. M., West, G. B. Toward a metabolic theory of ecology. Ecology. 85 (7), 1771-1789 (2004).
  5. Woodward, G., et al. Body size in ecological networks. Trends in Ecology & Evolution. 20 (7), 402-409 (2005).
  6. Sprules, W. G., Barth, L. E. Surfing the biomass size spectrum: Some remarks on history, theory, and application. Canadian Journal of Fisheries and Aquatic Sciences. 73 (4), 477-495 (2016).
  7. White, E. P., Ernest, S. K. M., Kerkhoff, A. J., Enquist, B. J. Relationships between body size and abundance in ecology. Trends in Ecology & Evolution. 22 (6), 323-330 (2007).
  8. Quintana, X. D., et al. A nonparametric method for the measurement of size diversity with emphasis on data standardization. Limnology and Oceanography - Methods. 6 (1), 75-86 (2008).
  9. Blanchard, J. L., Heneghan, R. F., Everett, J. D., Trebilco, R., Richardson, A. J. From bacteria to whales: Using functional size spectra to model marine ecosystems. Trends in Ecology & Evolution. 32 (3), 174-186 (2017).
  10. Petchey, O. L., Belgrano, A. Body-size distributions and size-spectra: Universal indicators of ecological status. Biology Letters. 6 (4), 434-437 (2010).
  11. Emmrich, M., et al. Geographical patterns in the body-size structure of European lake fish assemblages along abiotic and biotic gradients. Journal of Biogeography. 41 (12), 2221-2233 (2014).
  12. Arranz, I., Brucet, S., Bartrons, M., García-Comas, C., Benejam, L. Fish size spectra are affected by nutrient concentration and relative abundance of non-native species across streams on the NE Iberian Peninsula. Science of the Total Environment. 795, 148792 (2021).
  13. Vila-Martínez, N., Caiola, N., Ibáñez, C., Benejam, L. l, Brucet, S. Normalized abundance spectra of the fish community reflect hydropeaking on a Mediterranean large river. Ecological Indicators. 97, 280-289 (2019).
  14. Benejam, L. l, Tobes, I., Brucet, S., Miranda, R. Size spectra and other size-related variables of river fish communities: systematic changes along the altitudinal gradient on pristine Andean streams. Ecological Indicators. 90, 366-378 (2018).
  15. Sutton, I. A., Jones, N. E. Measures of fish community size structure as indicators for stream monitoring programs. Canadian Journal of Fisheries and Aquatic Sciences. 77 (5), 824-835 (2019).
  16. Murry, B. A., Farrell, J. M. Resistance of the size structure of the fish community to ecological perturbations in a large river ecosystem. Freshwater Biology. 59, 155-167 (2014).
  17. Townsend, C. R., Thompson, R. M. Body size in streams: Macroinvertebrate community size composition along natural and human-induced environmental gradients. In Body Size: The Structure and Function of Aquatic Ecosystems. Hildrew, A. G., Raffaelli, D. G., Edmonds-Brown, R. , Cambridge University Press. Cambridge, UK. (2007).
  18. Gjoni, V., et al. Patterns of functional diversity of macroinvertebrates across three aquatic ecosystem types, NE Mediterranean. Mediterranean Marine Science. 20 (4), 703-717 (2019).
  19. Pomeranz, J. P. F., Warburton, H. J., Harding, J. S. Anthropogenic mining alters macroinvertebrate size spectra in streams. Freshwater Biology. 64 (1), 81-92 (2019).
  20. García-Girón, J., et al. Anthropogenic land-use impacts on the size structure of macroinvertebrate assemblages are jointly modulated by local conditions and spatial processes. Environmental Research. 204, 112055 (2022).
  21. Demi, L. M., Benstead, J. P., Rosemond, A. D., Maerz, J. C. Experimental N and P additions alter stream macroinvertebrate community composition via taxon-level responses to shifts in detrital resource stoichiometry. Functional Ecology. 33 (5), 855-867 (2019).
  22. Basset, A., et al. A benthic macroinvertebrate size spectra index for implementing the Water Framework Directive in coastal lagoons in Mediterranean and Black Sea ecoregions. Ecological Indicators. 12 (1), 72-83 (2012).
  23. Ärje, J., et al. Automatic image-based identification and biomass estimation of invertebrates. Methods in Ecology and Evolution. 11 (8), 922-931 (2020).
  24. Raitoharju, J., et al. Benchmark database for fine-grained image classification of benthic macroinvertebrates. Image and Vision Computing. 78, 73-83 (2018).
  25. Lytle, D. A., et al. Automated processing and identification of benthic invertebrate samples. Journal of the North American Benthological Society. 29 (3), 867-874 (2010).
  26. Serna, J. P., Fernández, D. S., Vélez, F. J., Aguirre, N. J. An image processing method for recognition of four aquatic macroinvertebrates genera in freshwater environments in the Andean region of Colombia. Environmental Monitoring and Assessment. 192, 617 (2020).
  27. Gorsky, G., et al. Digital zooplankton image analysis using the ZooScan integrated system. Journal of Plankton Research. 32 (3), 285-303 (2010).
  28. Marcolin, C. R., Schultes, S., Jackson, G. A., Lopes, R. M. Plankton and seston size spectra estimated by the LOPC and ZooScan in the Abrolhos Bank ecosystem (SE Atlantic). Continental Shelf Research. 70, 74-87 (2013).
  29. Silva, N., Marcolin, C. R., Schwamborn, R. Using image analysis to assess the contributions of plankton and particles to tropical coastal ecosystems. Estuarine, Coast and Shelf Science. 219, 252-261 (2019).
  30. Vandromme, P., et al. Assessing biases in computing size spectra of automatically classified zooplankton from imaging systems: A case study with the ZooScan integrated system. Methods in Oceanography. 1-2, 3-21 (2012).
  31. Naito, A., et al. Surface zooplankton size and taxonomic composition in Bowdoin Fjord, north-western Greenland: A comparison of ZooScan, OPC and microscopic analyses. Polar Science. 19, 120-129 (2019).
  32. García-Comas, C., Picheral, E. Zooprocess/Plankton Identifier protocol for computer assisted zooplankton sorting. , Available from: https://manualzz.com/doc/43116355/zooprocess—plankton-identifier-protocol-for (2013).
  33. Picheral, E. ZooSCAN: Manual to scan and process samples. Quantitative Imaging Platform of Villefranche sur Mer (PlQv). , Available from: http://www.hydroptic.com/assets/uploads/files/documentations/ae4e0-zooscan_user_manual.pdf (2020).
  34. Protocolo de muestreo y laboratorio de fauna bentónica de invertebrados en ríos vadeables. CÓDIGO: ML-Rv-I-2013. Ministerio de Agricultura, Alimentación y Medio Ambiente. , Available from: https://www.miteco.gob.es/es/agua/temas/estado-y-calidad-de-las-aguas/ML-Rv-I-2013_Muestreo%20y%20laboratorio_Fauna%20bent%C3%B3nica%20de%20de%20invertebrado_%20R%C3%Ados%20vadeables_24_05_2013_tcm30-175284.pdf (2013).
  35. García-Comas, C., et al. Prey size diversity hinders biomass trophic transfer and predator size diversity promotes it in planktonic communities. Proceedings of the Royal Society Biological Sciences. 283 (1824), 20152129 (2016).
  36. García-Comas, C., et al. Mesozooplankton size structure in response to environmental conditions in the East China Sea: How much does size spectra theory fit empirical data of a dynamic coastal area. Progress in Oceanography. 121, 141-157 (2014).
  37. Marquina, D., Buczek, M., Ronquist, F., Lukasik, P. The effect of ethanol concentration on the morphological and molecular preservation of insects for biodiversity studies. PeerJ. 9, 10799 (2021).
  38. Bell, J. L., Hopcroft, R. R. Assessment of ZooImage as a tool for the classification of zooplankton. Journal of Plankton Research. 30 (12), 1351-1367 (2008).
  39. Colas, F., et al. The ZooCAM, a new in-flow imaging system for fast onboard counting, sizing and classification of fish eggs and metazooplankton. Progress in Oceanography. 166, 54-65 (2018).
  40. Bachiller, E., Fernandes, J. A., Irigoien, X. Improving semiautomated zooplankton classification using an internal control and different imaging devices. Limnology and Oceanography Methods. 10 (1), 1-9 (2012).

Tags

Miljövetenskap nummer 191
Automatisk bildbehandling för att bestämma gemenskapens storleksstruktur för flodmakroinvertebrater
Play Video
PDF DOI DOWNLOAD MATERIALS LIST

Cite this Article

Gurí, R., Arranz, I., Ordeix,More

Gurí, R., Arranz, I., Ordeix, M., García-Comas, C. Automatic Image Processing to Determine the Community Size Structure of Riverine Macroinvertebrates. J. Vis. Exp. (191), e64320, doi:10.3791/64320 (2023).

Less
Copy Citation Download Citation Reprints and Permissions
View Video

Get cutting-edge science videos from JoVE sent straight to your inbox every month.

Waiting X
Simple Hit Counter