대부분의 AI 에이전트는 세션이 끝나면 모든 것을 잊는다.
Hermes Agent는 경험에서 스킬을 생성하고, 세션 간 기억을 유지하며, 사용할수록 개선된다.
목차
- 1. 문제: 매번 리셋되는 AI 에이전트
- 2. Hermes Agent 개요
- 3. Closed Learning Loop — 핵심 메커니즘
- 4. 아키텍처
- 5. 설치 및 시작
- 6. 주요 기능
- 7. 기존 에이전트와의 비교
- 8. 트레이드오프 및 한계
- 9. 결론
1. 문제: 매번 리셋되는 AI 에이전트
Claude Code로 프로젝트 구조를 설명하고 코딩 규칙을 알려준 뒤, 다음 세션을 열면 다시 처음부터 설명해야 한다. ChatGPT에게 "매주 월요일에 서버 상태를 체크하라"고 지시해도 실제로 월요일에 알아서 실행하지는 않는다.
근본 원인: 대부분의 AI 에이전트는 "상태 없는(stateless)" 구조이다. 세션이 끝나면 컨텍스트가 사라지고, 다음 대화에서 이전 경험을 활용하지 못한다. 반복 작업을 자동화하려면 별도의 스크립트를 작성해야 하며, 에이전트가 "스스로 나아지는" 메커니즘은 존재하지 않는다.
Hermes Agent는 Nous Research가 개발한 자기 개선형(self-improving) AI 에이전트로, 이 문제를 "Closed Learning Loop"라는 구조로 해결한다. MIT 라이선스 오픈소스이며, $5 VPS부터 GPU 클러스터까지 어디서든 실행 가능하다.
2. Hermes Agent 개요
- 개발사 — Nous Research (Hermes 모델 시리즈로 유명한 AI 연구팀)
- 핵심 특징 — 자기 개선형 에이전트. 경험에서 스킬 자동 생성, 세션 간 기억 유지, 사용자 프로필 학습
- 모델 지원 — 200+ 모델 (OpenRouter, OpenAI, Anthropic, NVIDIA NIM, Hugging Face 등). 벤더 종속 없음
- 인터페이스 — CLI (TUI), Telegram, Discord, Slack, WhatsApp, Signal
- 배포 — Local, Docker, SSH, Modal(서버리스), Daytona(서버리스). $5 VPS에서 실행 가능
- 라이선스 — MIT
Nous Research의 맥락: Nous Research는 Hermes, Capybara 등 오픈소스 LLM fine-tune으로 유명한 연구팀이다. Hermes Agent는 "모델"이 아닌 "에이전트 프레임워크"로서, 어떤 LLM이든 연결하여 자기 개선형 에이전트로 동작시키는 인프라이다.
3. Closed Learning Loop — 핵심 메커니즘
Hermes Agent의 차별점은 단일 기능이 아니라, 기능들이 연결된 "학습 루프"에 있다. 매 10턴마다 에이전트가 내부적으로 리뷰를 수행하고, 저장할 것(메모리)과 자동화할 것(스킬)을 스스로 제안한다.
Hermes Agent — Closed Learning Loop
"이 작업 해줘"
도구 호출, 파일 편집, 웹 검색
재사용 가능한 절차 저장
사용자 선호, 컨텍스트
이전에 만든 절차 자동 적용
FTS5 검색 + LLM 요약
Honcho 기반 프로필
자동 프루닝 스케줄
구체적 동작
- 스킬 자동 생성 — 5회 이상 도구를 호출한 복잡한 작업 완료 후, 에이전트가 해당 절차를 재사용 가능한 스킬로 저장
- Memory Nudge — 10턴마다 내부 리뷰를 수행하여 "이 정보를 영구 메모리에 저장할까?" 제안
- 세션 간 검색 — FTS5(SQLite 전문 검색) + LLM 요약으로 과거 대화를 검색하여 현재 작업에 활용
- 사용자 모델링 — Honcho 기반으로 사용자의 선호, 작업 패턴, 커뮤니케이션 스타일을 점진적으로 학습
- 스킬 자기 개선 — 저장된 스킬이 사용될 때마다 품질을 평가하고, 낮은 평가를 받으면 수정하거나 제거
4. 아키텍처
컴포넌트역할기술
| CLI / TUI | 터미널 인터페이스, 멀티라인 편집, 스트리밍 출력 | Python + Rich |
| Agent Loop | LLM 호출 → 도구 실행 → 결과 반환 루프 | Python, async |
| Gateway | Telegram/Discord/Slack/WhatsApp 연동 | 단일 프로세스, 멀티 플랫폼 |
| Memory | 영구 메모리, 사용자 프로필, 세션 검색 | SQLite FTS5 + LLM 요약 |
| Skills | 재사용 절차 저장, 자기 개선, agentskills.io 호환 | Markdown + 메타데이터 |
| Terminal Backends | Local, Docker, SSH, Singularity, Modal, Daytona | 플러거블 실행 환경 |
| Cron Scheduler | 자연어로 스케줄 등록, 플랫폼별 결과 전달 | 내장 스케줄러 |
| Subagents | 병렬 작업 위임, 격리된 컨텍스트 | Python RPC |
터미널 백엔드 옵션
에이전트가 셸 명령을 실행하는 환경을 선택할 수 있다. 로컬 실행이 기본이지만, Docker 컨테이너나 원격 SSH 서버에서 실행하면 보안 격리가 가능하다. Modal과 Daytona는 서버리스 방식으로, 에이전트가 유휴 상태일 때 비용이 거의 발생하지 않는다.
5. 설치 및 시작
# Linux/macOS/WSL2 — 원라인 설치
curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash
# Windows (PowerShell)
iex (irm https://hermes-agent.nousresearch.com/install.ps1)
# 설치 후 시작
source ~/.bashrc
hermes # 대화 시작
hermes model # 모델 선택 (OpenRouter, OpenAI, Anthropic 등)
hermes tools # 도구 활성화 설정
hermes gateway # 메시징 게이트웨이 (Telegram/Discord 등)
Nous Portal 통합 (API Key 하나로 전체 연동)
# Portal OAuth로 원스텝 설정
# 모델 300+, 웹 검색, 이미지 생성, TTS, 클라우드 브라우저 모두 포함
hermes setup --portal
하드웨어 요구: Hermes 자체는 Python 프로세스이므로 1 vCPU / 512MB RAM이면 충분하다. LLM 추론은 외부 API에 위임하는 구조. $5/월 VPS (예: DigitalOcean Basic Droplet)에서 24시간 운영 가능. 로컬 LLM을 사용하려면 Ollama + GPU 서버를 별도 구성한다.
6. 주요 기능
6.1 멀티 플랫폼 메시징
hermes gateway를 실행하면 Telegram, Discord, Slack, WhatsApp, Signal에서 동시에 동일한 에이전트와 대화할 수 있다. 플랫폼 간 대화 연속성이 유지되며, 음성 메모 트랜스크립션도 지원한다. 노트북을 닫아도 클라우드 VM에서 에이전트가 계속 동작한다.
6.2 스케줄 자동화 (Cron)
"매일 오전 9시에 서버 상태를 체크하고 Telegram으로 보고해줘"라고 자연어로 지시하면 내장 cron 스케줄러가 등록한다. 실행 결과는 지정된 플랫폼으로 전달된다.
6.3 서브에이전트 위임
복잡한 작업을 병렬로 처리하기 위해 격리된 서브에이전트를 생성할 수 있다. 각 서브에이전트는 독립 컨텍스트에서 실행되며, 메인 에이전트의 컨텍스트 윈도우를 소모하지 않는다.
6.4 40+ 내장 도구
파일 읽기/쓰기, 셸 명령 실행, 웹 검색, 이미지 생성, TTS, 클라우드 브라우저(Browser Use), MCP 서버 연동 등 40개 이상의 도구를 내장한다.
7. 기존 에이전트와의 비교
항목Hermes AgentClaude CodeCursor/WindsurfAutoGPT
| 자기 개선 | 스킬 자동 생성 + 자기 평가 | 없음 | 없음 | 제한적 |
| 세션 간 기억 | 영구 메모리 + FTS5 검색 | 제한적 (프로젝트 컨텍스트) | 없음 | 파일 기반 |
| 스케줄 자동화 | 내장 cron | 없음 | 없음 | 없음 |
| 메시징 연동 | Telegram/Discord/Slack/WhatsApp/Signal | 없음 | 없음 | 없음 |
| 모델 종속 | 없음 (200+ 모델) | Claude 전용 | 멀티 (제한적) | 주로 OpenAI |
| 배포 방식 | VPS/Docker/서버리스 | 로컬 CLI | IDE 플러그인 | Docker |
| 비용 (에이전트 자체) | $0 (MIT 오픈소스) | Pro $20/월 | $20/월 | $0 |
| 용도 | 범용 개인 에이전트 | 코딩 전문 | 코딩 전문 | 자율 작업 |
포지셔닝: Hermes Agent는 "개인 비서"에 가깝다. 코딩뿐 아니라 리서치, 스케줄 관리, 메시징 봇 운영 등 범용 작업을 수행하며, 사용할수록 맞춤화된다. Claude Code나 Cursor는 "코딩 도구"에 집중하는 반면, Hermes는 "24시간 돌아가는 자율 에이전트"를 지향한다.
8. 트레이드오프 및 한계
8.1 표면적(Surface Area)이 넓다
메모리, 스킬, 게이트웨이, 서브에이전트, cron, 터미널 백엔드 — 기능이 많다. 초기 설정과 학습 곡선이 존재한다. "단순히 코딩 도우미가 필요하다"면 Claude Code가 더 직관적이다.
8.2 LLM 비용은 별도
Hermes 자체는 무료이지만, LLM API 호출 비용은 사용자가 부담한다. 자기 개선 루프(매 10턴 리뷰, 스킬 생성/평가)가 추가 토큰을 소모한다. 저비용 모델(GPT-4o-mini, Hermes 3 via Nous Portal)을 사용하면 월 $5~10 수준으로 운영 가능하다.
8.3 스킬 품질 보장의 어려움
에이전트가 자동 생성한 스킬이 항상 올바른 것은 아니다. 잘못된 절차가 스킬로 저장되면 이후 작업에서 반복적으로 오류를 만들 수 있다. 자기 평가/프루닝 메커니즘이 있지만, 완벽하지 않다. 주기적인 수동 리뷰가 필요하다.
8.4 보안 고려
에이전트가 셸 명령을 실행하고 파일을 읽고 쓴다. Command Approval 시스템이 있지만, 자율 모드에서는 위험할 수 있다. 프로덕션 배포 시 Docker 또는 Modal 백엔드로 격리하는 것을 권장한다.
9. 결론
Hermes Agent는 "사용할수록 나아지는 AI"라는 개념을 실제 동작하는 형태로 구현한 프로젝트이다. Closed Learning Loop — 경험에서 스킬 생성, 세션 간 기억, 사용자 프로필 학습 — 는 기존 "상태 없는" 에이전트 대비 명확한 구조적 차별점이다.
도입을 검토할 시나리오:
- 24시간 동작하는 개인 에이전트가 필요한 경우 (Telegram 봇으로 대화, 스케줄 실행)
- 반복 작업을 에이전트가 학습하여 자동화하기를 원하는 경우
- 특정 LLM에 종속되지 않으면서 에이전트를 운영하고 싶은 경우
- $5 VPS에서 최소 비용으로 에이전트를 셀프 호스팅하고 싶은 경우
부적합한 경우:
- IDE에서 코딩만 도와주는 도구가 필요하다면 → Claude Code, Cursor
- 기능 범위를 제한하고 단순한 설정을 원한다면 → ChatGPT, Claude Desktop
- 보안 격리 없이 프로덕션 서버에서 자율 실행하는 것은 위험하다
설치는 curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash 한 줄이다. 모델 선택 후 hermes 명령으로 바로 대화를 시작할 수 있다.
참고 자료
- • Hermes Agent GitHub Repository (MIT License)
- • Hermes Agent 공식 문서
- • Nous Research 공식 사이트
- • Nous Portal (모델 + 도구 통합)
- • BetterStack: Hermes Agent 가이드
- • TuringPost: Hermes Agent vs OpenClaw 비교
- • Is Self-Improving AI a Real Category? (분석)
- • AgentSkills.io — 스킬 오픈 표준
- • Honcho — 사용자 모델링 프레임워크
이 글은 Hermes Agent GitHub README, 공식 문서, BetterStack, TuringPost를 기반으로 작성되었다.
'AI 뉴스' 카테고리의 다른 글
| 셀프호스팅 앱, Docker Compose 예제 찾느라 헤맬 때: awesome-selfhost-docker 사용 후기 (0) | 2026.06.15 |
|---|---|
| yfinance API 완벽 리퍼런스: 파이썬으로 야후 파이낸스 데이터 수집하기 (0) | 2026.06.11 |
| 왜 지금 Wayland인가: 2025년 로컬 AI 에이전트 분석 (0) | 2026.06.07 |
| 2025년 AI 에이전트 인프라 - OpenSandbox가 지금 주목받는 이유 (0) | 2026.06.04 |
| Vibe-Trading vs FinGPT vs FinRobot vs Qlib: AI 퀀트 리서치 도구 비교와 선택 가이드 (0) | 2026.06.02 |





