A LangChain csapata részletesen bemutatta, hogyan építette fel a LangSmith Agent Builder memóriarendszerét – egy olyan megoldást, amely alapjaiban változtathatja meg, hogyan gondolkodunk az AI ügynökök hosszú távú tanulásáról.
Miért fontos a memória egy AI ügynöknek?
A legtöbb AI termék – legyen szó ChatGPT-ről, Claude-ról vagy Cursorról – általános célú, és a sessionök között alig tanul. A LangSmith Agent Builder más: kifejezetten ismétlődő, célspecifikus feladatokra tervezték (email asszisztens, dokumentáció-segítő, toborzó). Ha egy ügynök mindig ugyanazt a feladattípust végzi, az egyik session tanulsága közvetlenül alkalmazható a következőben.
A csapat a COALA kutatási keretrendszer három memóriatípusát vette alapul:
- Procedurális memória – az ügynök viselkedését vezérlő szabályok (AGENTS.md, tools.json)
- Szemantikus memória – tények a világról, specializált tudás (skill fájlok, tudásfájlok)
- Epizodikus memória – korábbi viselkedések sorozata (egyelőre tervezés alatt)
Fájlrendszer mint memória
A LangChain egyik legérdekesebb döntése: a memóriát fájlokként ábrázolják. Az ügynök egy virtuális fájlrendszert lát (amely valójában Postgres-ben él), és markdown illetve JSON fájlokat olvas és ír – pont úgy, ahogy egy fejlesztő dolgozna. Ez azért működik, mert a nyelvi modellek kiválóan kezelik a fájlrendszereket.
A rendszer az iparági sztenderdeket követi: AGENTS.md a fő utasításokhoz, skill fájlok a specializált tudáshoz, és egy tools.json az MCP szerverek konfigurálásához. Az egész a Deep Agents harnessre épül, amely elvonatkoztatja a komplex kontextuskezelést (összegzés, eszközhívás-kihelyezés, tervezés).
Hogyan tanul az ügynök? Egy konkrét példa
Egy meeting-összegző ügynök esetében a folyamat így néz ki: az első héten bekezdéseket ír, a felhasználó javítja („használj felsorolást”), és az ügynök frissíti az AGENTS.md-t. A második héten már automatikusan felsorolást használ. Három hónap után az ügynök memóriája tartalmazza a formázási preferenciákat, a résztvevők neveit és szerepeit, a különböző meetingtípusok kezelését, és tucatnyi iteráció során felgyűlt finomhangolást – mindezt anélkül, hogy a felhasználó valaha kézzel szerkesztette volna a konfigurációt.
Tanulságok a fejlesztésből
- A prompting a legnehezebb rész – szinte minden teljesítményprobléma megoldása jobb prompt volt. Egy ember teljes munkaidőben a memória promptolásán dolgozott.
- Fájlformátum-validáció elengedhetetlen – az ügynök néha érvénytelen sémájú fájlokat generált, ezért explicit validációs lépést adtak hozzá.
- Az ügynökök nem tömörítenek maguktól – jól adnak hozzá dolgokat a memóriához, de nem általánosítanak (pl. egyenként listázták a spam küldőket ahelyett, hogy „ignoráld az összes hideg megkeresést” szabályt írnának).
- Human-in-the-loop alapértelmezett – minden memóriaírás emberi jóváhagyást igényel, a prompt injection kockázat csökkentésére. Opcionálisan kikapcsolható („yolo mode”).
Forrás: LangChain Blog
