Forskere afslører: AI lærer som os – uden spildenergi

I stedet for at stable flere GPU’er ovenpå hinanden og sluge endnu mere strøm, siger forskere i New York, at de har fundet en måde for kunstig intelligens at lære mere som en menneskelig hjerne – ved at opdatere sig løbende med langt mindre computerspild.

En ny løsning på AI’s energiproblem

Træning af moderne AI-modeller æder elektricitet. Datacentre fyldt med specialiserede chips kører i ugevis blot for at forbedre ydeevnen med et par procentpoint. Nogle brancheledere, herunder Elon Musk, er gået så langt som til at advare om, at strømbehovet fra AI kan kollidere med kapaciteten i nationale elnet inden for et år.

Med den baggrund har et team fra Cold Spring Harbor Laboratory (CSHL) foreslået en helt anden vej fremad: skift måden, neurale netværk lærer på i deres kerne, i stedet for blot at kaste mere hardware efter dem.

I stedet for at presse data gennem et massivt netværk og først justere det til sidst, lader den nye metode hver kunstig neuron opdatere sig selv i realtid, mens information strømmer igennem.

Arbejdet, ledet af forsker Kyle Daruwalla og publiceret i tidsskriftet Frontiers in Computational Neuroscience, er teknisk, men kerneidéen er overraskende intuitiv. Det låner et koncept fra neurovidenskab kaldet “arbejdshukommelse” og bygger det direkte ind i læringsreglen for kunstige netværk.

Hvorfor nuværende AI spilder så meget energi

De fleste af nutidens kraftfulde AI-systemer bygger på dybe neurale netværk. De er løst inspireret af hjernen, men i praksis fungerer de på en meget anderledes, stærkt opdelt måde.

I et konventionelt netværk:

  • data kommer ind i input-laget, såsom pixels eller teksttokens
  • det passerer gennem snesevis eller hundredvis af skjulte lag
  • først til sidst beregner systemet et fejlsignal og sender det baglæns
  • synapser – forbindelserne mellem kunstige neuroner – opdateres derefter ved hjælp af den globale fejl

Denne bagudgående passage, gentaget milliarder af gange under træning, brænder igennem regnekraft og elektricitet. Hver opdatering kræver, at data krydser hele kredsløbet, selvom kun en lille del af netværket virkelig havde brug for at ændre sig.

Flaskehalsen er ikke bare matematikken; det er den konstante transport af information frem og tilbage på tværs af gigantiske netværk.

Daruwalla og kollegaer argumenterer for, at denne globale opdateringsstil er en væsentlig årsag til, at nutidens AI-systemer har brug for enorme datasæt og ekstreme mængder træning for at præstere godt, på trods af deres tilsyneladende brillans ved opgaver som at skrive essays eller løse ligninger.

Arbejdshukommelse integreres i netværket

CSHL-teamets forslag tilføjer et lag af arbejdshukommelse, der kører sideløbende med hovednetværket, ikke kun i toppen. Denne hjælpehukommelse sporer relevant information, mens data passerer gennem hvert lag og sender lokal feedback direkte til individuelle neuroner.

Sådan fungerer den nye læringsregel

I stedet for at vente på et enkelt globalt fejlsignal kan hver kunstig synapse modtage et målrettet opdateringssignal, der kommer fra denne arbejdshukommelsessti. Det betyder:

  • en neuron ser en del af inputtet
  • arbejdshukommelsen gemmer og behandler nøglefunktioner ved den aktivitet
  • en lokal læringsregel bruger denne gemte kontekst til at justere synapsen på stedet

Den tekniske artikel beskriver dette som en “informationsflaskehals-baseret Hebbiansk læringsregel”. Sagt mere enkelt forsøger reglen kun at beholde de dele af informationen, der virkelig betyder noget for opgaven, og at styrke forbindelser, der konsekvent bærer dette nyttige indhold.

Ved at knytte arbejdshukommelse direkte til synaptiske opdateringer kan systemet lære af hvert eksempel øjeblikkeligt, i stedet for at vente på, at en batch data siver gennem hele modellen.

For neurovidenskabsfolk er dette mere end et smart ingeniørtrick. Det understøtter også en langvarig, men stadig ubevist, hypotese: at menneskelig arbejdshukommelse er tæt forbundet med vores evne til at lære nye begreber og lykkes med akademiske opgaver.

Læring mere som en menneskelig hjerne

Mennesker behøver ikke at se milliarder af eksempler for at tilegne sig et begreb. Et barn kan forstå et nyt ord efter at have hørt det få gange i kontekst. En del af den smidighed kommer fra arbejdshukommelsen: den kortvarige buffer, der lader os holde et telefonnummer, følge en samtale eller holde styr på en udregning i hovedet.

CSHL-tilgangen efterligner dette ved at tillade AI’en at “huske” mellemliggende stykker information, mens den lærer, i stedet for at behandle hver fremadgående passage som en envejstur. I stedet for en rigid to-trins proces – frem, så tilbage – justerer netværket konstant undervejs.

Funktion Standard dybt netværk Arbejdshukommelse-baseret netværk
Hvor læring sker Hovedsageligt i output-laget via backpropagation I hvert lag via lokal feedback
Databevægelse Fuld fremad + fuld bagud passage Enkelt passage med løbende opdateringer
Energiforbrugsmønster Højt, med mange overflødige operationer Lavere, mere fokuseret beregning
Biologisk troværdighed Langt fra hvordan hjerner lærer Tættere på hjerneinspirerede læringsteorier

Fra teori til praktisk indvirkning på AI’s energiforbrug

Den mest umiddelbare appel ved denne tilgang ligger i dens potentiale til at skære strømregningen for AI-træning ned. Hvis hver neuron kan justere ved hjælp af lokal information, kan netværket undgå mange af de gentagne, globale opdateringstrin, der dominerer beregningsomkostninger i dag.

Forskerne foreslår, at deres metode kraftigt kunne reducere antallet af nødvendige operationer, hvilket oversættes direkte til mindre elektricitet og færre chips.

Dette skift har økonomiske og miljømæssige konsekvenser. Datacentre udgør allerede en voksende del af det globale energiforbrug. Hvis AI fortsætter med at skalere på en rå styrke-måde, peger kurven stejlt opad. En læringsregel, der bruger færre operationer til samme ydeevne, tilbyder en sjælden måde at bøje den kurve nedad uden at stoppe fremskridtet.

Der er også en strategisk vinkel. Lande og virksomheder, der kan træne konkurrencedygtige AI-modeller ved hjælp af mindre energi, får en fordel, når hardware eller elektricitet bliver begrænset. I en verden, hvor GPU’er er knappe, og elnet er presset, bliver effektivitet en form for magt.

Hvad dette kan ændre for hverdags-AI-systemer

Hvis metoden viser sig robust uden for simuleringer, kunne den omforme, hvordan AI bruges i enheder, der ikke kan stole på massive clouds: robotter, wearables, hjemme-gadgets, endda biler.

Forestil dig en hjemmeassistent, der tilpasser sig dine talemåder i realtid uden at sende konstante data til en fjernserver, eller en husholdsrobot, der forfiner sine bevægelser, mens den lærer dit køkkenlayout, alt sammen mens den kører på beskedent hardware.

  • Læring på enheden bliver mere realistisk, fordi energiomkostningerne pr. opdatering er lavere.
  • Personalisering kan ske kontinuerligt, ikke kun under sjældne genoptræningscyklusser.
  • Latenstiden falder, da færre ture til datacentre er nødvendige.

Den samme logik gælder for industrirobotter, droner eller medicinske enheder, der har brug for at tilpasse sig hurtigt, men opererer under stramme strøm- og sikkerhedsbegrænsninger.

Kernebegreber bag forskningen

Arbejdshukommelse, i klart sprog

Arbejdshukommelse er det kortvarige lagerrum i dit sind, der lader dig holde et par elementer “online” i et par sekunder. Når du mentalt omarrangerer en indkøbsliste eller sporer flere trin i en opskrift, stoler du på arbejdshukommelse.

I denne forskning holder en kunstig version af arbejdshukommelse styr på de mest relevante informationsstykker, mens data strømmer gennem netværket. Den fungerer som enkladdeblok, der styrer, hvilke synapser der skal justeres, baseret på hvad der synes nyttigt for den aktuelle opgave.

Hebbiansk læring og informationsflaskehalse

Hebbiansk læring opsummeres ofte som “celler, der fyrer sammen, kobler sammen”. Når to neuroner i hjernen er aktive samtidig, har deres forbindelse tendens til at styrkes. CSHL-metoden bygger på denne ånd, men tilføjer et moderne twist fra informationsteori: “informationsflaskehalsen”.

En informationsflaskehals forsøger kun at beholde den del af signalet, der hjælper med at forudsige resultatet, og kassere resten. I praksis betyder det, at læringsreglen belønner synapser, der bærer forudsigelig information, og svækker dem, der skubber støj.

Denne hybridregel sigter mod en mellemvej: biologisk inspireret, men matematisk funderet i, hvad der gør information genuint nyttig.

Scenarier, risici og åbne spørgsmål

Flere scenarier kunne udfolde sig i de kommende år:

  • Store AI-laboratorier begynder at eksperimentere med arbejdshukommelse-baseret læring på mindre modeller brugt i mobile apps.
  • Chipdesignere skaber hardware skræddersyet til lokale læringsregler, hvilket reducerer energiforbruget endnu mere.
  • Hybridsystemer dukker op og blander traditionel backpropagation med lokale opdateringer for at få det bedste fra begge verdener.

Der er også reelle risici og ubekendte. Metoden skal stadig bevise sig på skalaen af kommercielle modeller med milliarder af parametre. Træningsstabilitet, robusthed over for støjende data og modstand mod modstanderangreb skal alle testes. Der er også spørgsmålet om fortolkelighed: lokal læring kan gøre det sværere at spore, hvorfor visse forbindelser ændrede sig i komplekse systemer.

For beslutningstagere og regulatorer rejser et skift mod mere hjernelignende, effektiv læring nye spørgsmål. Hvis mindre, billigere systemer kan nå høj ydeevne, kan adgang til kraftfuld AI sprede sig hurtigere, end nuværende kontrolrammer forventer. Samtidig kunne lavere energibehov lette offentlige bekymringer om AI’s klimaaftryk.

Cold Spring Harbor-arbejdet løser ikke alle disse problemer, men det peger på en anden tankegang: i stedet for at bygge endeløst større modeller, spørg hvordan de lærer, og om den læring kan bringes tættere på den måde, menneskelige hjerner balancerer kraft, hukommelse og tilpasning.

Scroll to Top