U utrci umjetne inteligencije pojavio se novi igrač, jer je Švicarska predstavila Apertus, svoj nacionalni veliki jezički model (LLM) otvorenog koda za koji se nada da će biti alternativa modelima koje nude kompanije poput OpenAI-a.
Apertus je latinska riječ koja znači “otvoren”, a razvili su ga Švicarski federalni tehnološki institut u Lausanneu (EPFL), ETH Zurich i Švicarski nacionalni superkompjuterski centar (CSCS), koji su javne institucije.
“Trenutno je Apertus vodeći javni model umjetne inteligencije, koji su razvile javne institucije za javni interes. To je naš najbolji dokaz dosad da umjetna inteligencija može biti oblik javne infrastrukture poput autoputeva, vode ili struje”, rekao je Joshua Tan, vodeći zagovornik pretvaranja umjetne inteligencije u javnu infrastrukturu.
Švicarske institucije su dizajnirale Apertus da bude potpuno otvoren, omogućavajući korisnicima da pregledaju bilo koji dio njegovog procesa obuke. Pored samog modela, objavili su sveobuhvatnu dokumentaciju i izvorni kod njegovog procesa obuke, kao i skupove podataka koje su koristili. Apertus su razvili u skladu sa švicarskim zakonima o zaštiti podataka i autorskim pravima, što ga čini možda jednim od boljih izbora za kompanije koje žele da se pridržavaju evropskih propisa. Švicarsko udruženje bankara ranije je izjavilo da bi domaći LLM imao “veliki dugoročni potencijal”, jer bi se mogao bolje pridržavati strogih lokalnih pravila o zaštiti podataka i bankarskoj tajni u Švicarskoj. Trenutno švicarske banke već koriste druge AI modele za svoje potrebe, tako da ostaje da se vidi hoće li preći na Apertus.
Svako može koristiti novi model. Istraživači, hobisti pa čak i kompanije, dobrodošli su da ga koriste i prilagode svojim potrebama. Mogu ga koristiti za kreiranje chatbotova, prevodilaca pa čak i obrazovnih ili alata za obuku.
Apertus je obučen na 15 triliona tokena na više od 1.000 jezika, od čega je 40 posto podataka na jezicima koji nisu engleski, uključujući švicarski njemački i retoromanski. U saopćenju Švicarske se navodi da je model obučen samo na javno dostupnim podacima, a njegovi pretraživači su poštovali zahtjeve za isključivanje iz sistema koji se mogu čitati mašinski kada su naišli na njih na web stranicama. Treba napomenuti da su kompanije koje se bave umjetnom inteligencijom poput Perplexityja, ranije optužene za skidanje sadržaja s web stranica i zaobilaženje protokola namijenjenih blokiranju njihovih pretraživača. Neke kompanije koje se bave umjetnom inteligencijom tužile su i novinske organizacije i kreativce zbog korištenja njihovog sadržaja za obuku svojih modela bez dozvole.
Apertus je trenutno dostupan u dvije veličine, s 8 milijardi i 70 milijardi parametara. Trenutno je dostupan putem Swisscoma, švicarske kompanije za informacijsku i komunikacijsku tehnologiju ili putem Hugging Facea.