Mirage는 AI 에이전트가 S3, Google Drive, Slack, Gmail, Redis, GitHub 같은 여러 서비스와 데이터 소스를 하나의 가상 파일시스템처럼 다룰 수 있게 해주는 오픈소스 프로젝트입니다. 복잡한 API나 서비스별 SDK를 각각 익히는 대신, 익숙한 Unix 스타일 명령어와 파일 경로 개념으로 다양한 백엔드에 접근할 수 있도록 설계된 점이 특징입니다.

Mirage의 핵심은 여러 리소스를 하나의 트리 구조 아래에 마운트하는 방식입니다. 예를 들어 /s3, /slack, /github, /data 같은 경로를 만들고, AI 에이전트는 cat, grep, cp 같은 명령으로 각 서비스의 데이터를 읽고 처리할 수 있습니다. 이는 LLM이 이미 잘 이해하는 bash와 파일시스템 문법을 활용한다는 점에서 실용적입니다.

활용 장면도 꽤 분명합니다. 예를 들어 S3에 저장된 로그 파일에서 특정 이벤트를 찾고, Slack 메시지에서 관련 알림을 검색한 뒤, GitHub 저장소의 문서를 참고해 요약 보고서를 만드는 흐름을 하나의 작업 공간 안에서 구성할 수 있습니다. Mirage는 Python, TypeScript SDK와 CLI를 제공해 애플리케이션 내부나 개발 환경에 직접 통합할 수 있습니다.

비슷한 도구들이 서비스별 커넥터나 개별 API 호출에 초점을 맞춘다면, Mirage는 “모든 백엔드를 파일시스템처럼 다룬다”는 추상화가 돋보입니다. 또한 작업 공간을 스냅샷으로 저장하거나 복원할 수 있고, 원격 백엔드 접근을 줄이기 위한 캐시 구조도 제공해 반복 작업에 유리합니다.

추천 대상은 AI 에이전트에게 여러 데이터 소스 접근 권한을 주고 싶은 개발자, LLM 기반 자동화 워크플로를 만드는 팀, Slack·S3·GitHub·Google Drive 같은 도구를 함께 쓰는 조직입니다. 특히 에이전트가 여러 서비스 사이를 오가며 읽기, 검색, 복사, 요약 같은 작업을 수행해야 한다면 Mirage의 접근 방식이 도움이 될 수 있습니다.

정리하면 Mirage는 AI 에이전트가 다양한 외부 서비스를 더 단순하고 일관된 방식으로 사용할 수 있게 해주는 가상 파일시스템 레이어입니다. 아직 초기 공개 버전이지만, AI 에이전트 개발에서 반복적으로 등장하는 “도구 연결의 복잡함”을 파일시스템이라는 익숙한 개념으로 풀어내려는 점에서 주목할 만한 프로젝트입니다.

 

https://github.com/strukto-ai/mirage

 

GitHub - strukto-ai/mirage: A Unified Virtual Filesystem For AI Agents

A Unified Virtual Filesystem For AI Agents. Contribute to strukto-ai/mirage development by creating an account on GitHub.

github.com

 

반응형

 

 

AI 이미지에는 우리가 눈으로 보지 못하는 다양한 흔적이 남습니다.
remove-ai-watermarks는 이런 AI 워터마크와 메타데이터를 제거할 수 있도록 만든 오픈소스 프로젝트입니다. 단순한 로고 제거를 넘어, SynthID·C2PA·EXIF 같은 보이지 않는 정보까지 다룬다는 점이 흥미로운 도구입니다.

이 프로젝트는 GitHub에서 공개된 Python 기반 CLI 도구로, Google Gemini(Nano Banana), ChatGPT/DALL·E, Stable Diffusion, Adobe Firefly, Midjourney 등 여러 생성형 AI 서비스에서 만들어진 이미지의 흔적을 제거하는 기능을 제공합니다. 특히 Gemini 이미지에 들어가는 반짝이 형태의 시각적 워터마크를 reverse alpha blending 방식으로 제거하는 부분이 핵심 특징 중 하나입니다.

짧게 정리하면, 단순한 “워터마크 제거기”라기보다 AI 생성 이미지의 출처 흔적을 정리하는 연구 성격의 도구에 가깝습니다.
눈에 보이는 로고뿐 아니라 C2PA provenance, EXIF/XMP 정보, “Made with AI” 라벨을 유발하는 메타데이터까지 제거할 수 있도록 설계되어 있습니다.

기능 구성도 꽤 다양합니다.
대표적으로는 다음과 같은 기능이 포함됩니다.

Gemini/Nano Banana 시각 워터마크 제거
SynthID·StableSignature·TreeRing 같은 invisible watermark 제거
EXIF/XMP/C2PA 메타데이터 삭제
이미지 배치 처리(batch processing)
얼굴 영역 보호(Smart Face Protection)
필름 그레인·색수차 기반 “Analog Humanizer”

특히 Smart Face Protection 기능은 AI 재생성 과정에서 얼굴이 깨지거나 변형되는 문제를 줄이기 위해 얼굴 영역을 자동 추출·보존하는 방식으로 동작합니다. 일반적인 단순 워터마크 제거 툴과 비교하면 상당히 기술 지향적인 접근이라고 볼 수 있습니다.

활용 시나리오도 다양합니다.
예를 들어 AI로 생성한 이미지를 SNS에 업로드할 때 불필요한 메타데이터를 정리하거나, 연구 목적에서 AI 워터마킹 기술의 한계를 테스트하는 용도로 사용할 수 있습니다. 또한 이미지 포렌식이나 생성형 AI 탐지 기술에 관심 있는 개발자·연구자 입장에서는 워터마크 제거 방식 자체를 분석하는 학습 자료로도 의미가 있습니다.

비슷한 이미지 편집 도구들과 비교했을 때 눈에 띄는 점은 “단순 인페인팅” 수준을 넘어 invisible watermark까지 다룬다는 점입니다. 실제로 프로젝트 설명에서도 diffusion-based regeneration 기법을 이용해 주파수 영역의 워터마크를 제거한다고 소개하고 있으며, 관련 연구 논문들과 연결되는 기술 흐름도 확인할 수 있습니다.

다만 이 프로젝트는 일반 사용자용 GUI 서비스라기보다는 개발자·리서처 중심의 CLI 도구에 가깝습니다. Python 환경 설정과 모델 실행에 대한 이해가 필요할 수 있기 때문에, 터미널 기반 작업에 익숙한 사용자에게 더 적합합니다. macOS Apple Silicon(MPS), Linux CUDA, CPU 환경 등을 지원한다는 점도 개발자 친화적인 부분입니다.

정리하면 remove-ai-watermarks는 단순한 워터마크 제거 앱이 아니라, 생성형 AI 이미지의 “출처 흔적”을 어떻게 남기고 또 어떻게 제거할 수 있는지를 보여주는 흥미로운 오픈소스 프로젝트입니다. AI 워터마킹·콘텐츠 인증·이미지 포렌식 같은 주제에 관심 있다면 한 번쯤 살펴볼 만한 저장소입니다.

 

https://github.com/wiltodelta/remove-ai-watermarks

 

GitHub - wiltodelta/remove-ai-watermarks: CLI and library for removing visible (Gemini) and invisible (SynthID, C2PA, EXIF) AI w

CLI and library for removing visible (Gemini) and invisible (SynthID, C2PA, EXIF) AI watermarks from images - wiltodelta/remove-ai-watermarks

github.com

 

반응형

 

 

Open CoDesign은 프롬프트를 입력해 프로토타입, 슬라이드, 마케팅 자료 등을 생성할 수 있는 오픈소스 데스크톱 AI 디자인 도구입니다. Claude, GPT, Gemini, Ollama 등 다양한 모델을 연결할 수 있고, 로컬 우선 방식과 BYOK 구조를 내세운 점이 특징입니다.

Open CoDesign은 “프롬프트를 완성도 있는 결과물로 바꾸는” 데 초점을 둔 AI 디자인 도구입니다. 단순히 아이디어를 텍스트로 정리하는 수준을 넘어, HTML·React 기반 프로토타입, 슬라이드, PDF, 마크다운 등 실제로 활용 가능한 산출물로 이어질 수 있도록 설계되어 있습니다.

이 서비스의 가장 큰 특징은 특정 AI 모델이나 클라우드 환경에 묶이지 않는다는 점입니다. 사용자는 Claude, GPT, Gemini, DeepSeek, OpenRouter, Ollama 등 다양한 모델 제공자를 연결할 수 있으며, 기존 Claude Code나 Codex 설정도 가져올 수 있습니다. 또한 MIT 라이선스의 오픈소스 데스크톱 앱으로 제공되어, 폐쇄형 디자인 생성 도구와는 다른 유연성을 제공합니다.

활용 방식도 비교적 분명합니다. 예를 들어 랜딩페이지 초안, 대시보드 화면, 가격표 섹션, 모바일 앱 UI, 채팅 화면, 포트폴리오 페이지 같은 디자인을 빠르게 만들고 싶을 때 프롬프트로 시작할 수 있습니다. 생성된 결과는 미리보기로 확인하고, 특정 요소에 코멘트를 남겨 해당 부분만 다시 수정하는 식의 반복 작업도 가능합니다.

비슷한 AI 디자인 도구들이 웹 기반 구독형 서비스로 제공되는 경우가 많다면, Open CoDesign은 로컬 실행, 모델 선택권, 파일 내보내기 측면에서 차별점이 있습니다. HTML, PDF, PPTX, ZIP, Markdown 등으로 결과물을 내보낼 수 있고, 작업 과정에서 에이전트의 진행 상황과 도구 호출을 확인할 수 있다는 점도 개발자나 실무자에게 유용합니다.

추천 대상은 AI로 빠르게 UI 시안을 만들고 싶은 개발자, 제품 기획자, 디자이너, 스타트업 팀입니다. 특히 이미 여러 AI 모델 API 키를 사용하고 있거나, 클라우드 기반 도구에 모든 워크플로를 맡기기보다 로컬 중심의 작업 환경을 선호하는 사람에게 잘 맞습니다.

정리하면 Open CoDesign은 “AI 디자인 생성 도구를 더 개방적이고 유연하게 쓰고 싶은 사람”을 위한 프로젝트입니다. 아직 코드 서명이나 일부 배포 채널처럼 로드맵에 남아 있는 부분도 있지만, 오픈소스·멀티모델·로컬 우선이라는 방향성만으로도 충분히 살펴볼 가치가 있는 도구입니다.

 

https://github.com/OpenCoworkAI/open-codesign

 

GitHub - OpenCoworkAI/open-codesign: Open-source Claude Design alternative. One-click import your Claude Code / Codex API key. P

Open-source Claude Design alternative. One-click import your Claude Code / Codex API key. Prompt → prototype / slides / PDF. Multi-model (Claude, GPT, Gemini, Kimi, GLM, Ollama). BYOK, local-first,...

github.com

 

반응형

 

 

Open Design은 AI를 활용해 웹 프로토타입, 모바일 화면, 대시보드, 발표 자료 같은 디자인 산출물을 생성할 수 있도록 만든 오픈소스 프로젝트입니다.
특히 클라우드 서비스에만 의존하지 않고, 사용자가 보유한 코딩 에이전트 CLI나 API 키를 활용해 로컬 중심의 디자인 워크플로를 구성할 수 있다는 점이 특징입니다.

 

Open Design을 한 줄로 소개하면, AI 에이전트를 디자인 작업에 연결해 실제 결과물까지 만들어주는 로컬 우선 디자인 제작 도구라고 할 수 있습니다. 저장소 설명에 따르면 Claude Code, Codex CLI, Cursor Agent, Gemini CLI, GitHub Copilot CLI 등 다양한 코딩 에이전트 CLI를 감지해 디자인 엔진처럼 사용할 수 있으며, CLI가 없는 경우에도 OpenAI 호환 BYOK 방식의 프록시를 통해 비슷한 흐름을 사용할 수 있도록 설계되어 있습니다.

 

이 서비스의 핵심은 단순히 “프롬프트를 입력하면 화면을 그려준다”에 머물지 않는다는 점입니다. Open Design은 사용자가 만들고 싶은 결과물의 목적, 대상, 톤, 브랜드 맥락 등을 먼저 정리하도록 돕고, 이후 선택한 스킬과 디자인 시스템을 바탕으로 산출물을 생성하는 구조를 갖고 있습니다. 내장 스킬에는 웹 프로토타입, SaaS 랜딩 페이지, 대시보드, 모바일 앱, 소셜 캐러셀, 매거진 포스터, 와이어프레임, 피치덱, 주간 업데이트 덱 등 다양한 유형이 포함되어 있어 디자인·마케팅·제품·운영 업무에 폭넓게 활용할 수 있습니다.

 

실제 활용 장면을 떠올려보면 Open Design의 장점이 더 분명해집니다. 예를 들어 스타트업 팀이 투자자용 피치덱을 빠르게 만들고 싶을 때, “시드 라운드를 위한 매거진 스타일 피치덱”처럼 요청하면 Open Design은 먼저 필요한 정보를 묻고, 시각적 방향을 정한 뒤, 산출물을 샌드박스 iframe에서 미리보기 형태로 보여주는 흐름을 제공합니다. 생성된 결과물은 HTML, PDF, ZIP 등으로 내려받을 수 있어 초안 제작과 검토, 수정 작업에 바로 연결하기 좋습니다.

 

비슷한 AI 디자인 도구와 비교했을 때 Open Design이 눈에 띄는 부분은 “열린 구조”입니다. 저장소는 Apache-2.0 라이선스를 사용하며, 로컬 실행, Vercel 웹 레이어 배포, 선택적 Electron 데스크톱 앱 등 여러 형태의 사용 방식을 제시합니다. 또한 Linear, Stripe, Vercel, Airbnb, Notion, Apple, Figma 등 여러 제품 스타일을 참고할 수 있는 디자인 시스템 라이브러리를 제공해, 빈 화면에서 시작하는 부담을 줄여줍니다.

 

Open Design은 디자이너뿐 아니라 제품 기획자, 개발자, 마케터, 창업팀에게도 유용합니다. 빠르게 랜딩 페이지의 방향을 잡고 싶은 팀, 모바일 앱 화면의 초안을 보고 싶은 기획자, 발표 자료나 소셜 콘텐츠의 시각적 콘셉트를 실험하고 싶은 마케터, AI 에이전트를 기존 개발 환경과 연결해보고 싶은 개발자라면 특히 관심을 가져볼 만합니다. 완성형 디자인 툴이라기보다는, 아이디어를 구조화하고 시각적 산출물로 빠르게 바꿔보는 제작 환경에 가깝습니다.

 

정리하면 Open Design은 AI 디자인 생성의 가능성을 오픈소스와 로컬 워크플로 안으로 가져오려는 프로젝트입니다. 확인 가능한 저장소 내용만 보더라도, 다양한 스킬·디자인 시스템·샌드박스 미리보기·내보내기 기능을 중심으로 실험적인 디자인 제작 흐름을 잘 갖추고 있습니다. AI를 활용한 프로토타이핑이나 디자인 초안 제작에 관심이 있다면, Open Design은 한 번 살펴볼 가치가 있는 프로젝트입니다.

 

https://github.com/nexu-io/open-design

 

GitHub - nexu-io/open-design: 🎨 Local-first, open-source alternative to Anthropic's Claude Design. ⚡ 19 Skills · ✨ 71 br

🎨 Local-first, open-source alternative to Anthropic's Claude Design. ⚡ 19 Skills · ✨ 71 brand-grade Design Systems 🖼 Generate web · desktop · mobile prototypes · slides · images · videos · Hype...

github.com

 

반응형

 

 

Quarkdown은 일반적인 Markdown 문법을 확장해 책, 논문, 발표자료, 지식 베이스, 웹사이트까지 만들 수 있도록 설계된 문서 제작 도구입니다.
간결한 작성 방식은 유지하면서도 함수, 변수, 레이아웃, 스크립팅 기능을 더해 복잡한 문서 작업까지 대응할 수 있다는 점이 특징입니다.

Quarkdown은 “Markdown with superpowers”라는 설명처럼, 단순한 마크다운 편집기를 넘어선 현대적인 Markdown 기반 조판 시스템입니다. 하나의 프로젝트를 바탕으로 인쇄용 책, 학술 논문, 지식 베이스, 인터랙티브 프레젠테이션 등 다양한 형태의 결과물로 컴파일할 수 있도록 만들어졌습니다. 문서를 여러 포맷으로 관리해야 하는 개발자, 연구자, 기술 문서 작성자에게 특히 유용한 도구라고 볼 수 있습니다.

 

가장 눈에 띄는 부분은 Markdown의 읽기 쉬운 구조를 유지하면서도 훨씬 더 강력한 표현력을 제공한다는 점입니다. Quarkdown은 CommonMark와 GitHub Flavored Markdown을 기반으로 하며, 여기에 함수 호출과 여러 문법 확장을 더했습니다. 또한 표준 라이브러리를 통해 레이아웃 빌더, 입출력, 수식, 조건문, 반복문 같은 기능을 제공하고, 사용자가 직접 함수와 변수를 정의할 수도 있습니다.

활용 방식도 꽤 넓습니다. 예를 들어 연구자는 논문 초안을 작성하면서 목차, 수식, 레이아웃을 관리하고 PDF로 출력할 수 있고, 개발팀은 기술 문서를 docs 형태로 구성해 위키나 지식 베이스처럼 활용할 수 있습니다. 강의자나 발표자는 같은 Markdown 기반 문서에서 슬라이드 형식의 프레젠테이션을 만들 수도 있습니다. Quarkdown은 HTML의 plain, paged, slides, docs 형태를 지원하고, PDF와 plain text 출력도 제공한다고 설명되어 있습니다.

 

일반적인 Markdown 도구와 비교했을 때 Quarkdown이 돋보이는 지점은 “작성의 단순함”과 “출력물 제어” 사이의 균형입니다. README의 비교표에서는 LaTeX, Typst, AsciiDoc, MDX와 함께 Quarkdown을 비교하며, 간결한 문법, 문서 제어, 스크립팅, 책·기사·프레젠테이션·정적 사이트·문서/위키 출력 같은 항목을 강조하고 있습니다. 물론 이 비교는 프로젝트 자체의 기준이지만, Quarkdown이 단순 노트 작성보다는 완성도 있는 문서 제작 워크플로를 지향한다는 점은 분명해 보입니다.

 

실제 작업 흐름에서도 편의성을 고려한 기능들이 보입니다. CLI로 프로젝트를 생성할 수 있고, .qd 소스 파일을 컴파일해 결과물을 만들 수 있으며, --preview와 --watch 옵션을 함께 사용하면 소스 변경에 따라 자동으로 다시 컴파일되는 라이브 프리뷰 환경을 구성할 수 있습니다. VS Code 확장도 제공되어, Markdown 기반으로 글을 쓰는 사람들에게 비교적 익숙한 편집 환경을 이어갈 수 있습니다.

 

Quarkdown은 문서를 단순히 “쓰는 것”에서 그치지 않고, 하나의 원천 문서를 다양한 목적의 결과물로 발전시키고 싶은 사람에게 잘 맞는 도구입니다. 논문이나 책처럼 형식이 중요한 문서를 작성하는 사람, 개발 문서를 체계적으로 관리하려는 팀, 발표자료와 웹 문서를 같은 방식으로 다루고 싶은 사용자라면 살펴볼 만합니다. 다만 기능이 강력한 만큼 기본 Markdown만 쓰던 사용자에게는 함수와 문서 타입 설정 같은 개념을 익히는 시간이 필요할 수 있습니다.

 

정리하자면 Quarkdown은 Markdown의 간결함을 유지하면서도 LaTeX나 문서 생성 도구에서 기대하는 구조화·자동화·출력 제어 기능을 더한 프로젝트입니다. 단순 메모 앱보다는 전문 문서 제작 도구에 가깝고, 특히 여러 형식의 결과물을 하나의 작성 흐름으로 관리하고 싶은 사용자에게 매력적인 선택지가 될 수 있습니다.

https://github.com/iamgio/quarkdown

 

GitHub - iamgio/quarkdown: 🪐 Markdown with superpowers: from ideas to papers, presentations, websites, books, and knowledge b

🪐 Markdown with superpowers: from ideas to papers, presentations, websites, books, and knowledge bases. - iamgio/quarkdown

github.com

 

반응형

 

 

OpenAI·Gemini·Claude·Codex 계열 인터페이스를 하나의 프록시 서버로 묶어 주는 오픈소스 프로젝트입니다.
여러 AI CLI와 계정을 함께 다루는 흐름에 초점을 맞추고 있어, 개발 환경을 조금 더 유연하게 정리하고 싶은 사람에게 특히 눈에 들어오는 도구입니다.

 

CLIProxyAPI는 한 줄로 말하면, 다양한 AI 코딩용 CLI를 공통된 API 형태로 연결해 주는 프록시 서버입니다.

README에서는 OpenAI·Gemini·Claude·Codex 호환 API 인터페이스를 제공한다고 소개하고 있고, OpenAI Codex와 Claude Code는 OAuth 로그인도 지원합니다. 덕분에 특정 서비스 하나에 맞춰 사용 방식을 바꾸기보다, 익숙한 클라이언트나 SDK를 유지한 채 여러 백엔드를 연결하는 방향에 더 가깝습니다.

 

기능 구성을 보면 이 프로젝트의 성격이 더 선명해집니다. 스트리밍과 비스트리밍 응답을 모두 지원하고, 함수 호출과 도구 사용, 텍스트와 이미지 입력 같은 멀티모달 처리까지 포함합니다. 여기에 Gemini·OpenAI·Claude 계정을 여러 개 연결해 라운드로빈 방식으로 부하를 분산하는 기능도 제공하며, OpenAI 호환 업스트림 제공자를 설정으로 붙일 수 있게 설계되어 있습니다. 단순히 “요청을 전달하는 프록시”라기보다, 여러 모델과 계정을 실제 운영 환경에서 다루기 위한 중간 레이어에 가깝다는 인상을 줍니다.

 

활용 장면도 비교적 분명합니다. 예를 들어 한 개발자가 Claude Code, Gemini CLI, Codex 계열 도구를 프로젝트나 상황에 따라 번갈아 쓰고 있다면, CLIProxyAPI를 통해 인증과 라우팅을 한곳에서 관리하는 흐름을 생각해볼 수 있습니다. README에는 Amp CLI와 IDE 확장 지원도 별도로 정리되어 있고, 모델 매핑, 자동 라우팅, 보안 중심의 localhost 전용 관리 엔드포인트 같은 설명도 포함돼 있어, 개인 실험용을 넘어 실제 개발 워크플로에 맞춘 설계 의도가 읽힙니다.

 

비슷한 성격의 프록시나 릴레이 도구와 비교했을 때 눈에 띄는 점은 “호환성의 폭”과 “운영 편의성”입니다. 하나의 모델 제공사만 다루는 도구가 아니라 OpenAI·Gemini·Claude·Codex 계열을 함께 묶고, OAuth 로그인, 다중 계정 로드밸런싱, SDK 문서, Management API, Amp 연동까지 함께 제시합니다. 또 README에는 이 프로젝트를 바탕으로 만든 메뉴바 앱, 대시보드, VSCode 확장, 쿼터 모니터링 도구 등 여러 파생 프로젝트도 소개되어 있어서, 단일 스크립트 수준을 넘어 하나의 생태계처럼 확장되고 있다는 점도 흥미롭습니다.

 

그래서 이 프로젝트는 여러 AI 코딩 도구를 함께 쓰는 개발자, 계정 운영이나 인증 방식을 일관되게 묶고 싶은 사용자, 혹은 OpenAI 호환 인터페이스를 기준으로 다양한 백엔드를 연결하고 싶은 팀에게 특히 잘 맞아 보입니다. 반대로 아주 단순하게 한 서비스만 호출하면 되는 경우라면 다소 큰 구성처럼 느껴질 수 있지만, 여러 공급자와 모델을 유연하게 연결해야 하는 순간에는 장점이 분명해집니다. 

 

정리하면 CLIProxyAPI는 “여러 AI CLI를 하나의 공통 API 계층으로 정리해 주는 오픈소스 프록시”라는 점에서 가치가 분명한 프로젝트입니다. 지원 범위가 넓고, 다중 계정과 OAuth, 라우팅과 호환성까지 함께 다루기 때문에, AI 코딩 도구를 본격적으로 쓰는 사람일수록 활용도가 커질 만한 레포지토리입니다. 

 

https://github.com/router-for-me/CLIProxyAPI

 

GitHub - router-for-me/CLIProxyAPI: Wrap Gemini CLI, Antigravity, ChatGPT Codex, Claude Code as an OpenAI/Gemini/Claude/Codex co

Wrap Gemini CLI, Antigravity, ChatGPT Codex, Claude Code as an OpenAI/Gemini/Claude/Codex compatible API service, allowing you to enjoy the free Gemini 2.5 Pro, GPT 5, Claude model through API - ro...

github.com

 

 
반응형

 

 

Hermes Agent는 한 번 쓰고 끝나는 챗봇보다, 오래 운영할수록 기억과 스킬이 쌓이는 “운영형 AI 에이전트”에 더 가깝습니다.


CLI와 텔레그램·슬랙 같은 메시징 채널을 함께 쓰면서, 원하는 모델을 붙여 자동화와 도구 실행을 이어갈 수 있다는 점이 핵심입니다.

 

공식 문서 기준으로 멀티 플랫폼 게이트웨이, 지속 메모리, 스킬 시스템, MCP 연동, 예약 실행까지 폭넓게 갖춘 오픈소스 프로젝트입니다.

 

Hermes Agent는 Nous Research가 공개한 오픈소스 AI 에이전트 프로젝트입니다. 공식 소개에서 가장 앞에 내세우는 개념은 “self-improving”, 즉 사용하면서 더 나아지는 구조입니다. 단순히 질문에 답하는 챗봇이 아니라, 경험에서 스킬을 만들고, 이전 대화를 다시 찾아 활용하며, 세션이 바뀌어도 사용자를 점점 더 깊이 이해하는 방향을 지향한다는 점이 인상적입니다.

 

핵심 기능을 보면 이 서비스의 성격이 더 분명해집니다. 원하는 LLM 제공자를 붙이고 모델을 바꿀 수 있어 특정 API에 묶이지 않는 구조를 지향하고, 터미널 인터페이스에서는 멀티라인 입력, 슬래시 명령어 자동완성, 대화 기록, 작업 중단과 재지시 같은 사용성을 제공합니다. 여기에 지속 메모리, 사용자 프로필, 스킬 시스템, 컨텍스트 파일, MCP 연동, 수십 개의 내장 도구까지 문서화되어 있어 “답변을 잘하는 모델”보다 “계속 일하게 만드는 실행 환경”에 더 가까운 느낌을 줍니다.

 

실제 활용 장면도 꽤 선명합니다. CLI에서 바로 대화를 시작할 수도 있고, gateway를 실행하면 텔레그램·디스코드·슬랙·왓츠앱·시그널 같은 채널에서 같은 에이전트와 이어서 대화할 수 있습니다. 여기에 내장 크론 스케줄러를 붙이면 일일 리포트, 야간 백업, 주간 점검 같은 작업을 자연어 기반 자동화로 돌릴 수 있고, 필요할 때는 보조 에이전트를 따로 띄워 복잡한 일을 병렬로 나누는 방식도 가능합니다. 공식 설명에 나온 “클라우드 VM에서 일시키고 메신저로 결과를 받는” 시나리오가 Hermes Agent의 성격을 잘 보여줍니다.

 

비슷한 AI 서비스와 비교했을 때 Hermes Agent가 눈에 띄는 이유는, 스스로를 IDE에 묶인 코딩 보조 도구나 단일 API 래퍼처럼 소개하지 않는다는 점입니다. 공식 문서는 오히려 6가지 터미널 백엔드, 15개 이상 플랫폼 지원, 47개 내장 도구, 오픈 표준 스킬 호환, MCP 서버 연결, 보안 관련 문서까지 함께 제시하며 “장기 실행형 에이전트 런타임”에 가까운 그림을 보여줍니다. 그래서 이 프로젝트는 채팅창 하나를 똑똑하게 만드는 도구라기보다, 여러 환경에서 오래 굴릴 수 있는 AI 작업 기반을 만들고 싶은 사람에게 더 매력적으로 보입니다.

 

추천 대상도 비교적 분명합니다. 개인 개발자나 AI 파워유저, 반복 업무를 자동화하려는 1인 운영자, 메신저와 CLI를 오가며 같은 에이전트를 계속 키우고 싶은 팀에게 특히 잘 맞아 보입니다. 반대로 가볍게 몇 번 질문하고 끝내는 용도라면 다소 크고 복합적으로 느껴질 수 있습니다. 설치 안내는 Linux, macOS, WSL2, Android(Termux)를 중심으로 제공되고, Windows는 네이티브 대신 WSL2 사용이 안내되어 있다는 점도 함께 참고하면 좋겠습니다.

 

정리하면 Hermes Agent는 “AI와 대화한다”보다 “AI를 운영한다”는 표현이 더 잘 어울리는 프로젝트입니다. 메모리, 스킬, 멀티 채널, 자동화, 모델 선택 자유도까지 한데 묶어두었고, 공식 문서 범위도 넓습니다. GitHub 저장소 페이지에는 MIT 라이선스, 2026년 4월 16일의 최신 릴리스, 10.5만 스타와 535명의 기여자가 표시되어 있어, 실험적인 데모보다 빠르게 성장하는 오픈소스 생태계로 보는 편이 더 자연스럽습니다. 오래 함께 일할 AI 에이전트를 찾고 있다면 한 번쯤 자세히 살펴볼 만한 프로젝트입니다.

 

 

반응형

Graphify는 Claude Code, Codex, Cursor, Gemini CLI, GitHub Copilot CLI 등에서 사용할 수 있는 오픈소스 AI 스킬로, 프로젝트 폴더 안의 코드·문서·PDF·스크린샷·이미지·오디오·비디오를 읽어 하나의 지식 그래프로 정리해줍니다. 이를 통해 복잡한 코드베이스의 구조와 아키텍처 의도를 더 빠르게 파악할 수 있습니다.

 

또한 AST 기반 구조 분석과 멀티모달 정보 추출을 결합해 인터랙티브 HTML 그래프, JSON 파일, 분석 리포트를 생성하며, 관계를 EXTRACTED, INFERRED, AMBIGUOUS로 구분해 “직접 확인된 정보”와 “추론된 정보”를 명확히 보여주는 점이 인상적입니다.

 

설치는 Python 3.10+ 환경에서 가능하며, 공식 PyPI 패키지명은 graphifyy이고 실행 명령은 graphify입니다.

 

https://github.com/safishamsi/graphify

 

GitHub - safishamsi/graphify: AI coding assistant skill (Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, O

AI coding assistant skill (Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, OpenClaw, Factory Droid, Trae, Google Antigravity). Turn any folder of code, docs, papers, images, o...

github.com

 

 
반응형

+ Recent posts