En skogsägare med femhundra hektar i Norrland kan idag ställa en fråga som för fem år sedan inte hade något svar: exakt vilka träd bör jag gallra, och var i fastigheten finns de? Svaret genereras av ett AI-system som analyserar flygbilder pixel för pixel och returnerar individdata för varje träd i beståndet. Att bygga ett sådant system — och att bygga det rätt — har visat sig vara ett av de svårare tekniska problemen i modern skogsbruksteknik. Det är inte ett problem som löses med mer data och mer beräkningskraft. Det kräver en annan ansats.
Bakom Arboairs AI bildanalys av skog arbetar inte en enda modell utan flera parallella system med var sin uppgift. Det första systemet läser färg. Det analyserar skillnaderna i pixelvärden och försöker avgöra vilka pixlar som hör ihop — om en viss pixel tillhör en gran, en tall eller ett lövträd, och om pixeln intill tillhör samma träd eller ett annat. Modellen bygger upp en sannolikhetsmatris och klustrar pixlarna i objekt baserat på vad den estimerar att de föreställer.
Det andra systemet läser form och höjd. Det arbetar med tredimensionella data och analyserar skillnader i höjdprofiler, texturer och geometriska former för att avgöra vad som är ett avgränsat objekt och vilket objekt det är. Båda systemen innehåller miljontals parametrar och noder, tränade under år av arbete med verkliga skogsdata från Skandinavien och bortom.
Det är kombinationen av de två lässätten — färg och tredimensionell form — som gör att systemet klarar att känna igen och klassificera träd i skogar med vitt skilda karaktärer och geografiska förutsättningar. Varken färgmodellen ensam eller höjdmodellen ensam räcker. Det är samspelet mellan dem som bär.
En naturlig impuls är att tänka på AI-träning som ett matematiskt problem med en ren lösning: samla tillräckligt med data, kör tillräckligt länge, och modellen hittar mönstren. Det stämmer i teorin. Verkligheten i en skog är mer komplicerad.
En av de grundläggande utmaningarna handlar om klassbalans. En vältränad modell behöver jämnbördiga mängder av varje trädsort den ska känna igen. Men skogen ger sällan den balansen. Många bestånd är grandominerade, talldominerade eller dominerade av ett enskilt lövträd. Träningsdatan speglar den verkligheten — och en modell tränad på obalanserade data tenderar att bli bättre på det vanliga och sämre på det ovanliga, precis tvärt emot vad man vill i en skog där just det ovanliga ofta är ekonomiskt avgörande.
Därtill ser träd inte likadana ut på olika platser. En norrbottnisk gran och en skånsk gran är genetiskt samma art men växer under så olika förhållanden att de kan se fundamentalt olika ut i en flygbild. Kronornas täthet varierar. Höjdskiktningen i ett bestånd varierar. Ljuset faller olika beroende på latitud och årstid. Modellen måste lära sig att känna igen granen som art, inte granens specifika utseende på en given plats — och den distinktionen är svår att lära ut.
Felen, när de uppstår, är ofta förståeliga. De händer oftast när färgerna i bilden är mycket lika, vilket gör det svårt att avgöra var ett träd slutar och ett annat börjar. Ädellövträd tillhör de svåraste kategorierna: kronan på en gammal ek kan vara så bred och oregelbunden att systemet tvekar om det rör sig om ett träd eller fyra.
För att hantera träningsdatans komplexitet har Arboair tagit ett steg som skiljt bolaget från de flesta andra aktörer på marknaden: ett eget system för syntetisk träningsdata. Det börjar med att konstruera träd i en dator — inte som förenklade 3D-modeller utan med en detaljnivå som tar tid att förstå fullt ut.
Gren för gren. Barr för barr. Tills varje syntetiskt träd är fotorealistiskt i detalj. En algoritm genererar sedan tusentals varianter av varje trädtyp — olika åldrar, olika kronformer, olika grenstruktur och täthet. De syntetiska träden placeras ut i digitala landskap och systemet tar drönarperspektivbilder av dem, precis som en verklig drönare skulle ha gjort under ett uppdrag.
Den avgörande skillnaden är vad datorn vet när den tar bilderna. Den vet exakt vilket träd den placerat var. Den vet exakt art, höjd, kronstorlek och sammansättning. Ingen människa behöver sitta och tolka och annotera. Det innebär att träningsdatan saknar den bias och de feltolkningar som är inbyggda i all manuell märkning — den typ av systematiska fel som annars är omöjliga att helt eliminera oavsett hur noggrann annotatören är. Sanningshalten i referensdatan är hundra procent.
Det har tagit år att bygga. Resultatet är ett kunskapsförsprång som Arboair bedömer motsvara ett decennium av konventionell träningsdatautveckling — ett försprång som syns tydligast när modellerna möter skogar de aldrig tränat på och ändå presterar väl.
Arboairs databas innehåller idag miljontals träd — verkliga träd från verkliga skogar, inmätta och analyserade under år. Det är den volymen som gör skillnaden. En modell som sett tillräckligt många granar i tillräckligt många sammanhang börjar urskilja granen som art snarare än som ett specifikt mönster på en specifik plats — en generalisering som är grundläggande för att systemet ska fungera utanför de platser det ursprungligen tränats på.
Den skalan hade inte funnits för fem år sedan. Den parallella utvecklingen av kraftfullare AI-arkitekturer och sjunkande beräkningskostnader har gjort det möjligt att använda mer avancerade modeller till en kostnad som faktiskt är kommersiellt försvarbar. Det är kombinationen av data i rätt volym, modeller med tillräcklig kapacitet och beräkningsinfrastruktur till rimlig kostnad som förklarat varför tekniken mognat just nu och inte tio år tidigare.
Det som en skogsägare ser är inte pixlar och sannolikhetsmatriser. Det är en karta över fastigheten med individdata för varje träd: art, höjd, kronstorlek, stamvolym, hälsostatus. Ur den datan kan man ställa frågor som aldrig tidigare haft precisa svar.
Vilka träd bör gallras, och var i fastigheten finns de? Vilka träd har störst potential att bli sågtimmer av hög kvalitet? Hur ser fastighetens exakta virkesvolym ut inför en generationsväxling eller en fastighetsaffär? Vilka delar av beståndet visar tecken på ohälsa som kräver åtgärd?
Det är underlag som förändrar beslutsprocessen i grunden. Arboairs bedömning är att skogsägare som arbetar med den här precisionen kan få ut omkring fem procent mer virkesvärde från sin fastighet över en femårsperiod, jämfört med de som använder lågupplöst data eller manuellt inventerade skogsbruksplaner. Det är ett estimat grundat i känd skillnad i datakvalitet och känd korrelation mellan beslutsprecision och ekonomiskt utfall — inte ett uppmätt genomsnitt från ett kontrollerat försök.
Tekniken har också öppnat möjligheter för hyggesfritt skogsbruk. Selektiv avverkning och naturvårdande skötsel kräver exakt kunskap om varje individ i beståndet — det är svårt att planera vilka träd som ska stå kvar utan att veta exakt var de finns, vad de är och vad de är värda. Individdata på trädnivå ger den planeringen ett underlag den tidigare saknat.
Femhundra hektar i Norrland. Med AI bildanalys av skog är det inte längre en yta att förvalta i grova drag — det är femhundra hektar träd att faktiskt känna.