Skip to main content

A Google DeepMind április 1-jén bemutatta a legújabb Gemini API MCP eszközöket kódolási ágensekhez. A Gemini API Docs MCP és az Agent Skills együttesen oldják meg azt a problémát, hogy az AI-ágensek elavult kódot generálnak. A tanítási adatok lezárási dátuma miatt a kódolási ágensek gyakran régi API-verziókat használnak. Ez a két eszköz friss kontextust és bevált mintákat ad az ágensnek.

Gemini API MCP eszközök: mit oldanak meg?

Az AI-alapú kódolási ágensek egyik legnagyobb gyengesége a frissesség. A modellek tanítási adatai egy adott időpontban lezárulnak. Emiatt az ágens elavult API-hívásokat, megszűnt SDK-metódusokat és régi konfigurációs mintákat használhat. Ez különösen problémás gyorsan fejlődő API-knál, mint amilyen a Gemini API is. Új modellek, új paraméterek és új végpontok jelennek meg rendszeresen.

A Google válasza erre a kihívásra két egymást kiegészítő eszköz. Az első a Gemini API Docs MCP. Ez a Model Context Protocol szabványon keresztül valós időben csatlakoztatja a kódolási ágenst az aktuális dokumentációhoz. Az ágens így mindig a legfrissebb API-verziókat, SDK-kat és modellinformációkat éri el. Az MCP szerver helyi folyamatként fut a fejlesztő gépén.

A második eszköz a Gemini API Developer Skills. Ez bevált gyakorlatokat, erőforrás-linkeket és kódmintákat ad az ágensnek. A skill-ek iránymutatást adnak arról, hogyan használja az ágens az aktuális SDK-mintákat. Ez nem pusztán dokumentáció: konkrét utasítások és minták gyűjteménye, amelyeket az ágens közvetlenül alkalmaz.

A különbség a két eszköz között lényeges. Az MCP szerver adatot szolgáltat: API-referenciákat, modelllistákat és konfigurációs paramétereket. A Skills viszont viselkedést irányít: megmondja az ágensnek, milyen sorrendben hívja az API-t és milyen hibakezelést alkalmazzon. Az MCP a mit kérdésre ad választ, a Skills pedig a hogyan kérdésre. Együtt teljes képet adnak az ágensnek az API helyes használatáról.

A két eszköz egymástól függetlenül is működik. Az MCP szerver önmagában is friss adatokat biztosít. A Skills pedig önállóan is javítja a kódminőséget. Együtt azonban sokkal erősebb hatást fejtenek ki, mint külön-külön.

Mért eredmények: 96%-os pontosság és kevesebb token

A Google saját tesztjei szerint a két eszköz együttes használata kiemelkedő eredményeket hoz. Az értékelési készleten 96,3%-os sikerességi arányt mértek. Ez azt jelenti, hogy szinte minden generált kódrészlet helyes és naprakész API-hívásokat tartalmaz. A korábbi módszerekkel szemben ez jelentős előrelépés.

Emellett az ágensek 63%-kal kevesebb tokent használtak helyes válaszonként. Ez a hagyományos promptoláshoz képest drámai javulás. A tokencsökkenés közvetlen költségmegtakarítást jelent a fejlesztők számára. Kevesebb token kevesebb API-költséget és gyorsabb válaszidőt eredményez. Egy intenzív fejlesztési napon ez akár több ezer forint megtakarítást is hozhat.

A pontosság növekedése kevesebb manuális javítást igényel. A fejlesztőnek nem kell minden generált kódot ellenőriznie. Az ágens a helyes verziókat és metódusokat használja, mert valós idejű hozzáférése van a dokumentációhoz. Ez különösen értékes olyan projekteknél, ahol a Gemini API-t intenzíven használják. Az elavult API-hívások nehezen felderíthető hibákat okozhatnak a kódban.

Az eszközök beállítása egyszerű. A Google fejlesztői dokumentációja lépésről lépésre végigvezet a konfiguráción. A teljes folyamat néhány percet vesz igénybe, az eredmény viszont azonnal mérhető.

Mit jelent ez a fejlesztői gyakorlatban?

Az Agent Skills nyílt szabványyá vált. Az OpenAI, a Google DeepMind és más szereplők is adoptálták. A fejlesztők egyszer megírt skill-definíciókat több platformon is használhatnak. Ez csökkenti a vendor lock-in kockázatát és rugalmasabbá teszi a munkafolyamatot.

Az MCP-alapú megközelítés nem korlátozódik a Gemini API-ra. Más API-szolgáltatók is készíthetnek saját MCP szervert. Sőt, több cég már dolgozik saját implementáción. Ez azt jelenti, hogy a kódolási ágensek bármely API friss dokumentációjához hozzáférhetnek. A webfejlesztők számára ez az ágensalapú kódolás megbízhatóságának új szintjét hozza el.

A nyílt szabványok terjedése egy másik fontos következmény. Ha minden nagy AI-szolgáltató azonos protokollt használ, a fejlesztőknek nem kell platformonként külön eszközöket tanulniuk. Az MCP szabvány helyi futtatást tesz lehetővé. Az adatok nem hagyják el a fejlesztő gépét, ami adatvédelmi szempontból előnyös.

A gyakorlatban érdemes azonnal beállítani mindkét eszközt, ha Gemini API-val dolgozol. Az MCP szerver helyi folyamatként fut a gépen. Az Agent Skills pedig a kódolási ágens konfigurációjába épül be. A kettő együtt biztosítja, hogy az ágens naprakész és helyes kódot írjon.

A Google lépése megerősíti azt a trendet, hogy az AI-ágensek jövője a jobb kontextus. Nem a modell mérete számít elsősorban, hanem az, hogy milyen adatokhoz fér hozzá valós időben. Friss dokumentáció és bevált minták nélkül a legerősebb modell is elavult kódot ír. A Gemini API MCP és az Agent Skills ezt a programozási problémát oldja meg a gyakorlatban.

Humli Miklós

Több mint 15 éve dolgozom a digitális termékfejlesztés világában, elsősorban webdesign, frontend, backend és WordPress fejlesztés területén. Tapasztalataimat kis- és nagyvállalati projekteken, valamint szabadúszóként és csapatvezetőként szereztem.

Humli Miklós | Blog
Adatvédelmi áttekintés

Ez a weboldal sütiket használ, hogy a lehető legjobb felhasználói élményt nyújthassuk. A cookie-k információit tárolja a böngészőjében, és olyan funkciókat lát el, mint a felismerés, amikor visszatér a weboldalunkra, és segítjük a csapatunkat abban, hogy megértsék, hogy a weboldal mely részei érdekesek és hasznosak.