MEMTRACK: Evaluating Long-Term Memory and State Tracking in Multi-Platform Dynamic Agent Environments
MEMTRACK๋ ๋์ ๋ฉํฐํ๋ซํผ ํ๊ฒฝ์์ LLM์ ์ฅ๊ธฐ ๊ธฐ์ต ๋ฐ ์ํ ์ถ์ ๋ฅ๋ ฅ์ ํ๊ฐํ๊ธฐ ์ํ ์๋ก์ด ๋ฒค์น๋งํฌ๋ก, Slack, Linear, Git ๋ฑ์ ์ค์ ์กฐ์ง ์ํฌํ๋ก์ฐ๋ฅผ ํตํฉํ์ฌ ๋น๋๊ธฐ ์ด๋ฒคํธ์ ๊ต์ฐจ ์ฐธ์กฐ๋ฅผ ํฌํจํฉ๋๋ค. ์ฐ๊ตฌ ๊ฒฐ๊ณผ, ์ต์ LLM์ธ GPT-5์ Gemini 2.5 Pro๋ ๋ฎ์ ์ ํ์ฑ์ ๋ณด์์ผ๋ฉฐ, ๋ฉ๋ชจ๋ฆฌ ๊ตฌ์ฑ ์์์ ์ฌ์ฉ์ด ์ฑ๋ฅ ํฅ์์ ๊ธฐ์ฌํ์ง ๋ชปํ๊ณ ์คํ๋ ค ์ค๋ณต์ฑ์ ์ฆ๊ฐ์ํค๋ ๊ฒฝํฅ์ด ์์์ ๋ณด์ฌ์ค๋๋ค. ์ด ์ฐ๊ตฌ๋ LLM์ ๋ฉ๋ชจ๋ฆฌ ํ์ฉ๊ณผ ๊ต์ฐจ ํ๋ซํผ ์ถ๋ก ์ ํ๊ณ๋ฅผ ๋๋ฌ๋ด๋ฉฐ, ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.






























