Vi brukar tro att komplexa AI-agenter lyckas tack vare sina intrikata orkestreringslager, men ny forskning tyder på att den verkliga magin sker inne i modellen själv. En ny synvinkel visar att förmågan att tänka djupt inte bara är en process som agenten följer, utan en färdighet den har internaliserat. Detta förändrar fundamentalt hur vi förstår prestandan hos artificiell intelligens.

Forskarna har identifierat en mekanism som kallas HeavySkill, som behandlar tungt tänkande som en inre förmåga snarare än ett steg i en arbetsflödeskedja. Denna färdighet fungerar som en tvåstegspipeline: först engagerar sig modellen i parallellt resonemang för att utforska flera vinklar samtidigt, och sedan syntetiserar den dessa tankar till en sammanhängande sammanfattning. Avgörande nog sker denna process under ytan av varje agentic ramverk, vilket innebär att det är en kärnkompetens hos modellen snarare än en funktion i mjukvaran som omger den.

Konsekvenserna är överraskande. I systematiska tester över olika områden presterade detta internaliserade tunga tänkande konsekvent bättre än traditionella Best-of-N-strategier (BoN). Ännu mer anmärkningsvärt är att starkare modeller som använder detta tillvägagångssätt kan närma sig prestandan hos Pass@N-metoder. Detta tyder på att tänkets djup och bredd är lärbara färdigheter som kan skalas upp via förstärkningsinlärning, vilket erbjuder en väg mot självutvecklande stora språkmodeller (LLM) som internaliserar komplex resonemang utan att lita på sköra orkestreringslager.

Slutsatsen är tydlig: framtiden för robust AI ligger inte i att bygga mer komplexa orkestrerare, utan i att träna modeller att internalisera konsten av djupt, parallellt tänkande. Genom att fokusera på denna inre färdighet kan vi skapa agenter som inte bara är samordnade, utan som verkligen kan utveckla sina egna förmågor att resonera.