Något som överstiger en trilljon paramtrar släpptes för öppna källkoder
Baserad på forskning av Yicheng Zou, Dongsheng Zhu, Lin Zhu, Tong Zhu, Yunhua Zhou
Svagheten hos de flesta storskaliga AI-modeller har visat sig vara bristande djup i vetenskapliga områden jämfört med deras generella förmåga. Nu vänder trenden på huvudet när nya modell lanserar en brytpunkt för vad som är möjligt inom öppen kod.
Nyheten intern-S1-Pro är världens första vetenskapliga multimodala grundmodell med en trilljon parametrar, vilket ger den exceptionella beräkningskraft. Istället för att bara känna till allmän fakta kan modellen nu utföra avancerade agenter och hantera mer än hundra specialiserade uppgifter inom kemi, materialvetenskap, livsvetenskap och jordvetenskap. Detta gör modellen till en så kallad specialiserad generalist som klarar sig i vardagen men också excellerar när det krävs djup specialistkunskap, där den hamnar över egna proprietära modeller.
Utmaningen med att träna så stora system har lösts genom infrastruktur som säkerställer precision och effektivitet under lärande och användning. Resultatet är en modell som inte bara kan förstå text och bilder utan även hantera komplexa vetenskapliga problem, vilket etablerar en ny höjdstavla för vad öppen källkod kan leverera just nu.
Artikeln publicerades av Yicheng Zou och team på arxiv