Traditionellt sett har data som används för att träna AI-modeller hämtats från olika håll, vare sig det är offentligt tillgängliga källor som internet eller andra databaser. Detta kan leda till opålitliga och tvivelaktiga resultat beroende på kvaliteten på den data som matas in. I takt med att AI fortsätter att implementeras inser dock allt fler organisationer behovet av data som är korrekt, aktuell och betrodd.
Den data du använder och de AI-modeller som tränas på den är helt avgörande för resultatet enligt Milestone Systems. Om varje beslut och automatisering ska baseras på data måste du säkerställa att informationen är av hög kvalitet, pålitlig och etiskt insamlad.
AI-modellträning
Ett nyligen genomfört projekt av Milestone Systems, kallat Project Hafnia, visar vad som är möjligt när det gäller att träna maskininlärnings- och deep learning-modeller för komplexa aktiviteter och objekt. Projektet samlar noggrant in och taggar stora datamängder och levererar dem som ett färdigt paket för AI-modellträning, vilket effektiviserar processen att utveckla AI-modeller.
Data återvinns, anonymiseras och rensas för att leverera högkvalitativa och spårbara datamängder.
Ansvarsfullt inskaffande av data
Kärnan i Project Hafnia är att datan kommer från ansvarsfullt anskaffade källor. Det innebär att användarna kan vara säkra på att deras AI-träning uppfyller de regelverk och föreskrifter som krävs av både dataägare (personuppgiftsansvariga) och de tjänsteleverantörer som hanterar informationen.
– Grunden för Hafnia är ett heltäckande videodatabibliotek, anskaffat på ett ansvarsfullt sätt och i en skala som innehåller mer data än vad någon utvecklare av avancerad videoanalyslösning kan samla in på egen hand, säger Søren Rågård Jensen.
En datadriven strategi
Genua har ingått ett datalicensavtal med Milestone Hafnia och har nu tillhandahållit en stor mängd trafikvideomaterial. Denna data används för att finjustera världens största visuella språkmodell för trafik, vilket möjliggör fullständig textbaserad sammanfattning av händelser i videoklipp utan omedelbar mänsklig inblandning. Informationen är alltid skyddad och videomaterialet stannar kvar på Milestones plattform, uppger bolaget.
Beyond Security
Tillämpat på andra branscher kan detta innebära att video blir en viktig tillgång för exempelvis detaljhandeln – vid planering av butikslayout, reklambudskap, produktplacering och till och med öppettider. Videoinsikter kan hjälpa beslutsfattare att förstå kundflöden vid specifika tidpunkter, personalrörelser och beteendemönster i butiken, så att produkter med hög lönsamhet placeras där flest kunder rör sig. Anonymisering och kategorisering i VMS-plattformen säkerställer att känslig data inte delas och att datans ursprung kan spåras.
Videodata och dess metadata är enligt Milestone en ovärderlig tillgång som ger insikter om rörelsemönster, uppehållstider, beteenden, rusningstider och mycket mer – faktorer som påverkar allt från försäljning och kampanjer till underhåll och städning.
Kvalitet och aktualitet
På Milestone menar man att Project Hafnia belyser flera viktiga områden som företag måste ta hänsyn till vid användning av data. För det första är datakvalitet och aktualitet avgörande.
Beslut kan inte fattas baserat på otillförlitliga resultat, eftersom detta riskerar att undergräva det långsiktiga förtroendet för AI och datadrivna processer inom organisationen. Felaktig data kan snabbt skalas upp och få en snöbollseffekt som i slutändan hotar både beslutsfattande och verksamhet.
Bred och mångsidig data
För det andra kan dataset som skrapats från tvivelaktiga källor oavsiktligt innehålla känslig information, skadligt innehåll eller felaktigheter. Om datamängden inte är tillräckligt bred och mångsidig finns dessutom en risk för snedvridna resultat.
Milestone betonar att standard-dataset inte alltid skyddar integriteten för de individer vars data har använts, vare sig det skett med deras samtycke eller inte.
Ytterligare överväganden
Ett tredje område som Milestone lyfter är att ju fler människor som är involverade i skapandet av data, desto större blir risken för mänskliga fel som kan påverka kvaliteten negativt. Slutligen pekar man på lagstiftningen. Organisationer måste säkerställa efterlevnad av GDPR och annan regionsspecifik lagstiftning, inklusive den kommande EU-förordningen om AI, både när det gäller känslig information och datahärkomst.
– I framtiden tror jag att vi kommer att se en kontrollstämpel som säger ”etiskt tränad”. Det är en fråga som står mycket högt på vår agenda, avslutar Søren Rågård Jensen.












.jpg?w=480&action=fill&sh=c9639)












