Pričalo se da Microsoft godinama radi na prilagođenom procesoru za potrebe svog podatkovnog centra. Kako se ispostavilo, glasine su bile istinite i ovaj tjedan kompanija je predstavila ne jedan već dva procesora temeljena na Armu. Novi čipovi bit će integrirani u Azure farme servera početkom 2024., kako bi se koristili za AI usluge kao što je Microsoft Copilot.
Ovog tjedna Microsoft je objavio da je napravio dva vlastita čipa koji će se nositi s AI i općim računalnim radnim opterećenjima u Azure oblaku. Najava je objavljena na konferenciji Ignite 2023 i potvrđuje prethodne glasine o postojanju ” Projekta Athena ” – posebno dizajniranog čipa temeljenog na Armu koji bi smanjio Microsoftovo oslanjanje na standardni hardver dobavljača poput Nvidije, posebno u području učenja i zaključivanja umjetne inteligencije.
Prvi čip se zove Microsoft Azure Maia 100 AI Accelerator i izravan je rezultat projekta Athena. Kao što njegovo dugačko ime sugerira, div iz Redmonda dizajnirao je čip posebno za pokretanje velikih jezičnih modela kao što su GPT-3.5 Turbo i GPT-4 . Izgrađen na TSMC-ovom 5nm procesu i s ne manje od 105 milijardi tranzistora, novi čip podržava različite MX tipove podataka , uključujući sub-8-bitne formate za bržu obuku modela i vrijeme zaključivanja.
Za referencu, Nvidijin H100 AI Superchip ima 80 milijardi tranzistora, a AMD-ov Instinct MI300X ima 153 milijarde tranzistora. Ipak, tek trebamo vidjeti bilo kakve izravne usporedbe performansi između Maia 100 AI Accelerator i postojećih čipova koje koristi većina tvrtki koje izrađuju AI usluge. Ono što znamo jest da svaka računalna jedinica Maia 100 ima ukupnu propusnost od 4,8 terabita zahvaljujući prilagođenom mrežnom protokolu temeljenom na Ethernetu koji omogućuje bolje skaliranje i performanse.
Također je vrijedno napomenuti da je Microsoft razvio čip Maia 100 koristeći opsežne povratne informacije OpenAI-ja. Dvije su tvrtke zajedno radile na poboljšanju arhitekture i testiranju GPT modela. Microsoftu će to pomoći u optimizaciji učinkovitosti Azureove end-to-end AI arhitekture, dok će OpenAI moći trenirati nove AI modele koji su bolji i jeftiniji od onoga što je danas dostupno.
Drugi čip koji je Microsoft predstavio na Igniteu zove se Cobalt 100 CPU. Ovo je 64-bitni, 128-jezgreni Arm procesor temeljen na Arm Neoverse Compute Subsystems i donosi poboljšanja performansi do 40 posto za općenitija radna opterećenja Azure računala u usporedbi s hardverom trenutne generacije koji se nalazi u komercijalnim Arm serverima . Poslužitelji temeljeni na Cobaltu 100 koristit će se za napajanje usluga poput Microsoft Teams i Windows 365 , između ostalog.
Rani Borkar, koja je voditeljica Azure infrastrukturnih sustava u Microsoftu, kaže da se nastojanja tvrtke oko vlastitih čipova nadograđuju na dva desetljeća iskustva u zajedničkom razvoju silicija za Xbox i Surface. Novi Cobalt 100 CPU omogućuje tvrtki kontrolu performansi i potrošnje energije po jezgri i omogućuje izgradnju isplativijeg hardverskog skupa u oblaku.
Čini se da je Microsoft odlučan napraviti Copilot “za svakoga i sve što radite”, a to se odražava u izdanju Copilota za Windows, GitHub, Dynamics 365, Microsoft Security i Microsoft 365. Tvrtka je upravo rebrandirala Bing Chat u “Microsoft Copilot ,” stoga je jasno da želi ugraditi sve naprednije AI modele u svaku uslugu koju nudi.