Att utvärdera data
Datautvärderingen vid undersökning av ett förorenat område måste utgå från syftet med undersökningen. När syftet är att bedöma föroreningssituationen och ta fram föroreningskartor kan denna arbetsgång användas.
Bedöm föroreningsgraden:
-
a) Långtidsrisk: Beräkna en representativ halt för området, t.ex. skattad medelhalt, och jämför med en referenshalt, t.ex. ett riktvärde. Områden med stor variation i föroreningsgrad måste först delas in i delområden (egenskapsområden).
b) Akuta risker: Skatta hur stor andel av området som överskrider referenshalten för akuttoxicitet. Detta ger sannolikheten att exponeras för akuttoxiska halter. Notera att den beräknade sannolikheten är beroende av storleken på den jordvolym som provet representerar.
c) Bedöm sannolikheten för att provtagningen har missat en hotspot av en viss storlek, genom att göra en geometrisk simulering/beräkning baserad på områdets area och form samt provpunkternas placering.
Bedöm andelen förorenade massor. Bedöm andelen massor som har halter över riktvärdet, t.ex. med hjälp av en normalfördelningsplot. I många fall kan det vara lämpligare att använda en lognormalfördelningsplot.
Bedöm den rumsliga korrelationen. Bedöm om det finns något släktskap i halter mellan närliggande provpunkter. Här kan det räcka med en visuell analys av data med hjälp av variogram. En rumslig korrelation bör alltid kunna förklaras med någon form av fysisk process, t.ex. spill längs en transportväg.
Gör en interpolation för att avgränsa områden med förhöjda halter. Detta moment utförs bara om det finns en relevant rumslig korrelation, i annat fall är all form av interpolation meningslös. Välj interpolationsmetod, t.ex. triangulering eller kriging. Kontrollera sedan modellen och utför eventuellt kompletterande provtagning. De kartor som blir resultatet kan användas för att undersöka de beslutsosäkerheter som hör ihop med åtgärder, volymer och kostnader.
Några praktiska aspekter när man utvärderar data
- Hur delar man in i delområden (egenskapsområden)? Här är det viktigt att inte basera indelningen enbart på uppmätta halter. Indelningen bör även utgå från någon typ av process som har gett upphov till skillnaderna i föroreningsnivå. I många fall behöver man även väga in andra aspekter som historik, markmaterial, fastighetsgränser med mera.
- Hur hanterar man datakluster, dvs. mätdata från provpunkter som förekommer i grupper på grund av förtätad provtagning? Man kan delvis lösa problemet genom att ge mätvärdena olika vikt i beräkningarna. Detta kan göras manuellt eller med hjälp av särskilda programvaror.
- Hur hanterar man blandade typer av data? Ett sätt kan vara att i ett första skede utföra separata analyser på de olika datamängderna. Om resultaten blir likartade kan det vara möjligt att slå samman datamängderna, men då måste man beakta att variabiliteten kan skilja sig åt.
- Hur hanterar man data under rapporteringsgränsen? Sådana mätvärden är vanligt förekommande i analysresultat från förorenade områden och det är viktigt att de inte utesluts. Den vanligaste metoden, som kan vara tillräcklig i många fall, är att alla mätvärden under rapporteringsgränsen ersätts med ett förutbestämt värde, i första hand halva rapporteringsgränsen. Det finns även mer avancerade metoder som kan användas, så kallad ROS-teknik.
- Hur hanterar man duplikat? Dubbelprover analyseras ofta som en del i kvalitetskontrollen. Enklast är då att slumpmässigt välja ett av mätvärdena och bortse från duplikatet. Ett annat sätt är att betrakta provpunkten som ett datakluster och vikta mätvärdena för att skapa en representativ datamängd.
- Hur hanterar man replikat? Det enklaste sättet är att beräkna medelvärdet av replikaten och använda detta värde i den statistiska datautvärderingen.
- Hur hanterar man outliers? Outliers är mätvärden som numeriskt avviker kraftigt från resten av datamängden. De brukar identifieras med hjälp av en s.k. Box-plot. Sådana data bör man aldrig utesluta från utvärderingen enbart på grund av att de är outliers. Istället kan man komplettera med ett alternativt scenario där de utesluts och där man tydligt redovisar motiven till detta.
- Hur hanterar man data med olika support? Med olika support menas att data representerar olika volym, form och orientering. Notera att det är den använda provtagningsmetoden som avgör vilken volym ett prov representerar. Datamängder som har olika support bör utvärderas var för sig. Därefter kan man jämföra resultaten och dra slutsatser. Ibland kan man transformera data från en support till en annan, t.ex. räkna om halter som uppmätts med XRF till halter som motsvarar jordvolymen i en provgrop. Eventuellt kan man sedan hantera de två datamängderna som en.
- Hur hanterar man data från olika provtagningsdjup? Lämpligast är att utvärdera olika djupintervall för sig. I många fall har man inte tillräckligt stor datamängd för att kunna göra en detaljerad djupindelning. Då är enda lösningen att slå samman datamängder för flera djupintervall, men det innebär osäkerheter och tolkningsproblem.
- Hur gör man i projekt med få data? I sådana fall är det viktigt att inte dra för stora slutsatser av sina data. Vissa grova beräkningar kan dock göras: Om exempelvis ett (1) av fem prov uppvisar halter över riktvärdet så innebär detta att 20% av området kan vara förorenat över acceptabel nivå.
- Hur hanterar man data med osäker representativitet? Data kan ha osäker representativitet av flera olika skäl och det är inte möjligt att generellt avgöra om en sådan datamängd kan användas eller inte. Om data ändå används måste man kontrollera att slutsatserna inte är helt beroende av sådana data.
Mer information |
Metodik för statistisk utvärdering av miljötekniska undersökningar i jord (PDF, 2,91 MB), 2009. Från kunskapsprogrammet Hållbar Sanering, NV Rapport 5932. Beskriver hur man kan strukturera en statistisk utvärdering av tillgänglig information från förorenade områden – både förhandskunskap och insamlad data. Lyfter fram statistiska metoder för vissa delar i en riskbedömning, men också som underlag för kostnadsuppskattningar i en åtgärdsutredning. Beräkningsverktyg och hjälpmedel Beräkningsverktyg för statistisk utvärdering (Excel-format). Tar fram beskrivande statistik för användarens datamängd. Dessutom beräknas bland annat UCLM (Upper Confidence Limit of the Mean). Visar datamängden i olika grafer. Verktyget utvecklades för en kurs inom Kunskapsprogrammet Hållbar Sanering (NV rapport 5897 (PDF, 0,87 MB)) och är fritt att använda. Klicka på länken för att ladda ner verktyget till din dator. |