Hovedfunn (TL;DR)
- M51 Cortex er den nye kjernearkitekturen som driver alle 17 AI-agentene i M51 AI OS, live i produksjon fra mai 2026.
- Cortex er ikke et bedre søk. Det er et lærende system som husker hva agentene har gjort, holder styr på årsak og virkning i markedsføringsdata, og bygger opp gjenbrukbar kunnskap over tid.
- Hver eneste påstand som agentene baserer seg på er sporbar tilbake til kilde, dato og modell. Ingen anonyme svar, ingen kilde-løse hallusinasjoner.
- Norsk er førsteklasses i Cortex, ikke en oversettelses-ettertanke. Tokenizer, søk, embeddings og resonnement er testet mot norsk terminologi.
- For markedsføringsteamet betyr det: kortere tid fra spørsmål til kvalifisert svar, høyere tillit til AI-genererte rapporter, og en plattform som blir bedre per uke uten at noen må re-trene noe.
- Målt mot den gamle Brain v1-RAG-arkitekturen henter Cortex relevant informasjon 8-16× oftere på samme kunde-spørringer.
Bakgrunn: hvorfor vi bygde om hjernen
I 2025 kjørte M51 AI OS på det vi internt kalte Brain v1. Det var en kompetent retrieval-arkitektur: dokumenter ble indeksert, agentene fant relevante biter, og rapportene ble skrevet på basis av det. Det fungerte for én ting: å svare på spørsmål om data som allerede var skrevet ned.
Det fungerte ikke for det vi egentlig ville: et system som blir smartere for hver kunde, hver kampanje og hver beslutning det er involvert i. Brain v1 hadde tre strukturelle begrensninger.
Den glemte konteksten mellom samtaler. Hver agent-økt startet på nytt. Lærdommen fra forrige uke var ikke tilgjengelig som lærdom, kun som dokumenter agenten kanskje fant igjen.
Den kunne ikke skille korrelasjon fra årsak. Markedsførings-data er fullt av korrelasjoner som ikke er kausale. Brain v1 fant mønstre, men kunne ikke si om de var årsaker.
Den hadde ingen mekanisme for å sammenligne hva-skjedde med hva-kunne-skjedd. Counterfactual-resonnement var utenfor rekkevidde.
Cortex er svaret på disse tre begrensningene, samlet i én arkitektur. Den ble designet over vinteren 2025/26, bygget i sprint gjennom våren, og er nå live for våre pilotkunder.
Hva Cortex faktisk er
Cortex er et flerlags intelligens-system som sitter mellom agentene og kundedataene. På utsiden ser det ut som et søk. På innsiden er det fire ting samtidig.
Et minnesystem med proveniens
Hver atomær påstand som lagres i Cortex er merket med kilde-dokument, kilde-linje, tidspunkt for ekstraksjon, og hvilken modell som hentet den ut. Når en agent siterer noe, vet du nøyaktig hvor det kommer fra. Det er ikke en feature på toppen, det er en designforutsetning gjennom hele lagdelingen.
En refleksjons-loop
Etter at en agent har levert en analyse eller rapport, kjøres et eget refleksjonssteg som destillerer ut hva som var nyttig, hva som var feil, og hva som bør huskes til neste gang. Disse refleksjonene blir til oppdaterte oppfatninger i Cortex, ikke bare logger ingen leser.
Et skill-bibliotek
Når et arbeidsmønster gjentar seg flere ganger og leverer kvalitet, pakkes det som en gjenbrukbar skill med innebygget verifiserings-logikk. Neste gang en lignende oppgave kommer inn, plukker agenten opp skillen i stedet for å starte fra null. Dette er prosedyrekunnskap som compounder.
En kausalmodell
Parallelt med vanlig semantisk og tidsbasert representasjon, modellerer Cortex hva som faktisk forårsaker hva i den enkelte kundes data. Det er forskjellen på å vite at "annonse-spend gikk opp samtidig som konverteringer steg" og å vite at "annonse-spend forårsaket et bestemt løft i konverteringer i dette segmentet, men ikke i det andre".
Vi går ikke i flere detaljer om implementasjonen i denne artikkelen. Det viktige for kunden er hva summen av disse fire valgene betyr i praksis.
De fire prinsippene Cortex er bygget på
Disse fire er de ikke-forhandlingsbare designvalgene som gjør Cortex annerledes enn et forsterket RAG-oppsett. Hvert valg har en kostnad. Vi mener kostnaden er verdt det.
1. Provenance er ikke-forhandlingsbar
Hver påstand som ender opp i en rapport, et kampanjeforslag eller et chat-svar fra Nova er sporbar. Du kan klikke deg fra "ifølge data fra forrige kvartal har churn økt med 12 prosent" til den eksakte raden i datakilden, datoen den ble registrert, og hvilken ekstraksjons-modell som tolket den. Dette er bygget for et marked der AI-genererte påstander må kunne forsvares overfor styre, kunde og ledelse, ikke bare se overbevisende ut.
2. Cortex lærer aktivt, ikke passivt
Et tradisjonelt RAG-system får informasjon ved at noen mater inn nye dokumenter. Cortex får informasjon på samme måte, men i tillegg ved at agentene selv genererer ny innsikt gjennom arbeidet sitt, og refleksjons-laget destillerer det inn i hjernen. Det betyr at en agent som har jobbet med en kunde i tre måneder, har en kvalitativt annerledes forståelse av den kunden enn en agent som er ny på dataene, selv om begge har tilgang til de samme rådokumentene.
3. Skills compounder over tid
Når en agent finner et arbeidsmønster som leverer kvalitet, for eksempel en bestemt måte å strukturere en månedsrapport på for B2B-SaaS-kunder, kan det promoteres til en gjenbrukbar skill. Skillen har sin egen verifiserings-logikk: den kjenner igjen når den passer, og den vet når den ikke gjør det. Etter hvert som plattformen kjører hos flere kunder, vokser skill-biblioteket. Det er en av få komponenter i en SaaS-plattform der hver ny kunde gjør produktet bedre for alle de andre, uten at data lekker mellom dem.
4. Kausal er parallelt med semantisk
De fleste AI-systemer for markedsføring opererer på likhet og tidsrekkefølge. "Hvilke kampanjer ligner denne?" "Hva skjedde rett før dette skjedde?" Cortex har en eksplisitt kausalmodell ved siden av disse, fordi markedsføringsbeslutninger er kausale av natur. Spørsmålet er sjelden "hva ligner dette", det er nesten alltid "hva får dette til å skje".
Hva kunden faktisk merker
Arkitektur er interessant for ingeniører. For markedsføringsteamet betyr Cortex fem konkrete ting.
Kortere tid fra spørsmål til kvalifisert svar
Når Nova eller en av spesialist-agentene blir spurt om noe, henter Cortex ferdig-syntetisert kontekst i stedet for å lete på nytt. I våre interne målinger reduseres tid fra prompt til ferdig svar på komplekse analyse-spørsmål med 40 til 60 prosent sammenlignet med Brain v1.
Sporbare rapporter
Hver KPI, hver påstand, hver anbefaling i en automatisk generert rapport peker tilbake til kildedataene. Dette har ikke bare verdi som tillit, det har verdi som compliance og som granskningsbevis hvis noe blir spurt om.
Konsistens over tid
En agent som jobber med samme kunde over uker og måneder husker hva som er relevant for akkurat denne kunden. Samme tone of voice, samme prioriteringer, samme kontekst. Dette er ikke et finetuning-problem, det er et arkitektur-problem som Cortex løser via refleksjonslaget.
Bedre anbefalinger over tid
Etter hvert som skill-biblioteket vokser, blir foreslåtte tiltak mer presise. Et godt eksempel: kampanje-strukturer som har levert dokumentert avkastning hos sammenlignbare kunder kan foreslås som utgangspunkt, ikke som idé fra blanke ark.
Ærlig usikkerhet
Cortex har confidence-scoring som førsteklasses verdi. En påstand som er svakt underbygd, blir flagget som svakt underbygd. En anbefaling som er basert på lite data, sier det selv. Dette er det motsatte av AI-systemer som gir alle svar med samme overbeviste tone uavhengig av evidens.
Hvor Cortex skiller seg fra alternativene
Det er rimelige sammenligninger og det er villedende sammenligninger. Her er de rimelige.
| System | Hva det er | Hvor Cortex er annerledes |
|---|---|---|
| Tradisjonell RAG | Henter dokument-biter basert på likhet | Cortex henter ferdig-syntetiserte påstander med proveniens, ikke rå-biter |
| Enterprise search (f.eks. Glean) | Single-tenant, designet for store selskaper | Cortex er multi-tenant by design, optimalisert for byrå- og team-modellen |
| Per-user agent memory (Mem0, Letta, Zep) | Husker hva en bestemt bruker har sagt | Cortex modellerer business-data, ikke samtalehistorikk |
| GraphRAG | Knowledge graph over statiske dokumenter | Cortex har semantisk graf, tids-graf og kausal-graf parallelt, og oppdateres kontinuerlig |
| Generisk LLM med kontekst-vindu | Husker innenfor én samtale | Cortex husker på tvers av samtaler, agenter og over tid, med proveniens |
De aller fleste AI-tjenester for markedsføring i dag faller i en av disse kategoriene. Cortex tar det beste fra flere og legger til kausalitet og refleksjon på toppen. Det er ikke et inkrementelt valg, det er en arkitektur-beslutning vi tok eksplisitt for å bygge en moat som vokser med bruken.
Hva det betyr for deg som kunde
Sammenligningstabellen over forteller hvor Cortex skiller seg arkitektonisk. Det vi måler internt, er hva som faktisk skjer når en agent leter etter informasjon i kundedataene dine. Mot den gamle Brain v1-RAG-arkitekturen henter Cortex relevant informasjon mellom 8 og 16 ganger oftere på de samme kunde-spørringene.
For deg som markedssjef eller analytiker betyr det tre konkrete ting i hverdagen:
- Langt færre svar der agenten "ikke finner noe". Hvis informasjonen finnes i mastermappen din, plukker Cortex den opp på første forsøk.
- Rapporter og anbefalinger bygges på flere relevante datapunkter samtidig, ikke det første beste treffet. Det gir mer presise konklusjoner og færre overflatiske observasjoner.
- Tiden du bruker på å verifisere AI-output går ned. Når retrieval treffer riktig, blir det mindre å lukte på og dobbeltsjekke før du sender rapporten videre.
Forklaringen ligger i arkitekturen: provenance-laget gjør at retrieval kan jobbe på ferdig-syntetiserte påstander med kilde-merking i stedet for rå tekst-chunks. Kausal- og tids-grafen filtrerer bort treff som ser leksikalsk relevante ut, men som er feil i tid eller kontekst. Det er forskjellen mellom "ligner på spørsmålet" og "er det riktige svaret".
Norsk er førsteklasses
Et detalj som ofte forsvinner i AI-markedsføring: hvilket språk systemet er optimalisert for. Mange engelsk-først plattformer behandler norsk som en oversettelses-overflate. Resultatet er agenter som forstår norske spørsmål omtrentlig, men som tenker på engelsk og oversetter tilbake.
I Cortex er norsk en førsteklasses borger. Det betyr konkret:
- Tokenizer-valgene er testet mot norsk tekst, ikke optimalisert for engelsk og forhåpningsfullt brukt på norsk.
- Embeddings-modellen er valgt fordi den scorer godt på norske benchmarks, ikke fordi den er populær i Silicon Valley.
- Søke-laget håndterer norsk morfologi (sammensatte ord, bøyninger, casing-varianter) korrekt.
- Refleksjons-loopen genererer interne notater på samme språk som rapportene den skal støtte.
Engelsk er også fullt støttet. Men det er ikke standarden ned igjen i Cortex.
Les også: Hvor godt kjenner AI det norske markedet? (GEO-serien, del 1)
Hva er live nå, og hva kommer
Cortex v2.0 er live i produksjon fra mai 2026 for våre eksisterende kunder. Det betyr at:
- Hele provenance-laget er aktivt. Alle påstander og rapporter generert fra og med lanseringen er sporbare.
- Refleksjons-loopen kjører på alle agentøkter og bygger opp lærdom per kunde.
- Skill-biblioteket har et begrenset sett med verifiserte skills ved lansering, og vokser kontinuerlig basert på reelle kunde-arbeidsstrømmer.
- Kausalmodellen er aktiv for de mest brukte data-kildene (Google Ads, Meta Ads, GA4, Search Console). Flere kilder kommer gjennom sommeren.
Det vi jobber med å fullføre senere i år:
- Cross-tenant federated learning, som lar plattformen svare på spørsmål av typen "hvilke kampanje-mønstre fungerer for B2B SaaS-kunder under 50 ansatte" uten at kundedata krysser tenant-grenser.
- Counterfactual rehearsal i fullt omfang, der agentene simulerer alternative utfall før de gir en anbefaling.
- Utvidet skill-økosystem med kunde-spesifikke skills som kan låses til en enkelt kunde for konfidensielle arbeidsmønstre.
Hvorfor vi snakker åpent om dette
To grunner.
For det første eksisterer m51 Lab for å gjøre teknologi-valgene våre etterprøvbare. Vi publiserer hva vi bygger og hvorfor. Det gir kundene våre noe konkret å vurdere oss på, ikke bare salgs-presentasjoner.
For det andre tror vi det er mulig å snakke om arkitektur uten å gi bort hvordan den er bygd. Cortex har tekniske valg som er forsvars-relevante for oss som selskap. Implementasjons-detaljer som hvilke modeller som ekstraherer claims, hvordan promotion-gates for skills er kalibrert, og hvilke confidence-formler vi bruker er ikke en del av denne artikkelen. Det er heller ikke en del av neste artikkel. Det er en del av produktet du kjøper.
Det vi viser her er nok til at en teknisk vurderer kan sammenligne Cortex med alternativene. Det er nok til at en markedssjef forstår hva forskjellen er for arbeidsdagen. Det er ikke en oppskrift for å bygge det selv, og det skal det ikke være.
Tre prinsipper vi tar med oss
Sporbarhet er en feature, ikke en kostnad
Hver gang vi har gjort proveniens lettere, har det ført til at brukerne stoler mer på AI-resultatene og bruker dem mer aktivt. Det rettferdiggjør den ekstra implementasjonskompleksiteten ti ganger over.
Læring som ikke compounder, er ikke læring
Et system som glemmer mellom hver økt, lærer ikke. Refleksjons-laget i Cortex var det dyreste designvalget vi tok, og det med størst effekt på kvalitet over tid.
Kausalitet er ikke en akademisk øvelse
Markedsføring er kausalt arbeid. Et AI-system som ikke modellerer årsak og virkning, kan ikke gi anbefalinger med integritet. Det kan beskrive, ikke anbefale.
Se også: annen m51 Lab-forskning
Vi pruned MiniMax-M2.7: første offentlige REAP-variant
SeoGemma4 v2 vs Claude Sonnet: kan open source skrive norske SEO-auditer?
NorGEO-Bench: blir din bedrift nevnt av AI?
Om M51 AI OS
M51 AI OS er en norsk SaaS-plattform som gir markedsføringsteam og byråer et komplett AI-drevet operativsystem. 17 spesialiserte AI-agenter jobber med kundedata og merkevarekontekst for å automatisere analyse, rapportering, annonseproduksjon, SEO og kampanjeoptimalisering. Plattformen kjører på en kurert miks av Claude Sonnet og Opus, GPT, og våre egne finetunede modeller, koordinert gjennom Nova-agenten og drevet av M51 Cortex som intelligens-kjerne.
m51 Lab er forsknings- og utviklingsavdelingen bak plattformen. Vi publiserer åpne forskningsmodeller på HuggingFace, dokumenterer arkitektur-valgene våre transparent, og lar læringene fra Lab-arbeid flyte direkte inn i produkt-beslutninger.
Vil du se hvordan Cortex jobber for ditt team? Book en demo.
Book en demo