Enkel data bygger elit-Sök-AI
Baserad på forskning av Yuwen Du, Rui Ye, Shuo Tang, Keduan Huang, Xinyu Zhu
Frontier-AI-agenter har traditionellt varit exklusivt för techjättarna med deras oändliga budgetar. Men en ny öppen modell visar att man inte behöver miljarder i beräkningskraft för att bygga sökfunktioner i världsklass. Det räcker med rätt data.
Forskare har utvecklat OpenSeeker-v2, en sökagent som utmanar branschstandarden. Att bygga sådana kraftfulla verktyg kräver normalt en massiv och resurskrävande pipeline med förträning, kontinuerlig förträning, övervakad finjustering och förstärkningsinlärning. Den nya metoden kringgår denna komplexitet. Genom att fokusera på svåra träningsbanor och strikt datafiltrering nådde teamet toppresultat med endast övervakad finjustering på ett modest dataset om 10 600 exempel.
Resultaten är slående. OpenSeeker-v2 slår Tongyi DeepResearch, en modell som tränats med betydligt mer resurser, på fyra stora benchmark-test. Den fick 46,0 procent på BrowseComp, 58,1 procent på BrowseComp-ZH, 34,6 procent på Humanity's Last Exam och 78,0 procent på xbench. Nyckeln var inte mer beräkningskraft, utan smartare datasyntes. Teamet skalade kunskapsgrafer för rikare utforskning, utökade verktygsuppsättningar för bredare funktionalitet och tillämpade strikt filtrering av steg med låg komplexitet för att säkerställa effektivitet.
Genombrottet demokratiserar tillgången till frontier-sökningsteknik. För första gången har ett akademiskt team skapat en sökagent i toppklass inom sin skala och paradigm med endast övervakad finjustering. Genom att öppna modellvikterna och forskningsresultaten bevisar forskarna att enkel, välvald data kan mäta sig med industriell tyngd, och gör avancerad AI-forskning tillgänglig för alla.