OfficeCLI는 AI 에이전트와 개발자가 Word, Excel, PowerPoint 문서를 명령어 기반으로 생성·읽기·수정할 수 있도록 만든 오픈소스 도구입니다.
단일 바이너리로 제공되며, Office 설치 없이도 문서 렌더링과 자동화 작업을 수행할 수 있다는 점이 특징입니다.

OfficeCLI는 이름 그대로 오피스 문서를 CLI 환경에서 다루기 위한 도구입니다. 특히 일반적인 문서 편집 프로그램이라기보다, AI 에이전트가 문서를 이해하고 수정하며 자동화할 수 있도록 설계된 점이 눈에 띕니다. GitHub README에서는 Word, Excel, PowerPoint 파일을 한 줄의 명령어로 생성하거나 편집할 수 있고, .docx, .xlsx, .pptx를 HTML 또는 PNG로 렌더링할 수 있다고 소개하고 있습니다.

핵심 기능은 단순한 파일 생성에 그치지 않습니다. OfficeCLI는 문서의 텍스트, 구조, 스타일, 수식 등을 읽고, 텍스트·글꼴·색상·레이아웃·수식·차트·이미지 같은 요소를 수정할 수 있습니다. 또한 Word, Excel, PowerPoint 세 형식 모두에서 읽기, 수정, 생성을 지원한다고 정리되어 있어, 여러 라이브러리를 따로 조합하지 않고 하나의 명령 체계로 오피스 문서를 다루려는 사용자에게 적합합니다.

활용 장면을 떠올려보면 더 이해하기 쉽습니다. 예를 들어 개발자는 데이터베이스나 API에서 가져온 데이터를 바탕으로 정기 보고서나 프레젠테이션을 자동 생성할 수 있습니다. 팀에서는 기존 문서 템플릿을 복제한 뒤 필요한 값만 채워 넣거나, 납품 전 문서의 구조와 품질을 검증하는 흐름을 만들 수 있습니다. README에서도 보고서 자동 생성, 대량 문서 처리, CI/CD 환경의 문서 파이프라인, 문서 품질 검증 등을 주요 사용 사례로 제시하고 있습니다.

OfficeCLI가 특히 흥미로운 지점은 “AI가 문서를 만들고 다시 확인하는 과정”을 염두에 두었다는 점입니다. view html, view screenshot, watch 같은 기능을 통해 문서를 HTML이나 PNG로 확인하거나 브라우저에서 실시간 미리보기를 볼 수 있습니다. AI 에이전트 입장에서는 단순히 파일 구조만 수정하는 것이 아니라, 결과물을 렌더링해 레이아웃 문제를 파악하고 다시 고치는 흐름을 만들 수 있습니다.

Excel 작업에서도 자동화에 유용한 기능들이 포함되어 있습니다. README에 따르면 150개 이상의 Excel 함수 자동 평가, 피벗 테이블 생성, 템플릿 병합, 기존 문서를 batch JSON으로 직렬화하는 dump 기능 등을 제공합니다. 특히 {{key}} 형태의 자리표시자를 JSON 데이터로 교체하는 템플릿 병합은 반복 보고서, 견적서, 발표자료를 일정한 형식으로 대량 생성해야 하는 상황에서 실용적으로 보입니다.

비슷한 도구와 비교했을 때 OfficeCLI의 차별점은 AI 친화적인 CLI와 JSON 출력, 경로 기반 요소 접근, 내장 렌더링 엔진, 헤드리스 환경 지원에 있습니다. README의 비교 표에서도 Microsoft Office, LibreOffice, python-docx/openpyxl과 비교해 단일 바이너리, AI 네이티브 CLI, Word·Excel·PowerPoint 통합 지원, 라이브 미리보기 등을 강조하고 있습니다. 다만 실제 업무에 도입할 때는 필요한 문서 형식과 세부 기능이 현재 프로젝트 요구사항을 충분히 충족하는지 직접 테스트해보는 것이 좋습니다.

OfficeCLI는 문서 자동화가 필요한 개발자, AI 에이전트를 업무 흐름에 연결하려는 사용자, 반복적인 보고서·스프레드시트·프레젠테이션 생성을 줄이고 싶은 팀에게 잘 맞는 도구입니다. 일반 사용자는 AionUi 같은 GUI 방식도 선택할 수 있고, 개발자나 자동화 환경에서는 CLI와 MCP 서버를 통해 AI 도구와 직접 연결할 수 있습니다. 문서 작업이 점점 자동화되고 AI와 연결되는 흐름 속에서, OfficeCLI는 “오피스 파일을 사람이 직접 여는 작업”과 “AI가 구조적으로 문서를 다루는 작업” 사이를 이어주는 흥미로운 오픈소스 프로젝트라고 볼 수 있습니다.

 

https://github.com/lidge-jun/cli-jaw

 

GitHub - lidge-jun/cli-jaw: 🦈 2-line install personal AI assistant. 11 AI runtime surfaces (Claude, Codex, Cursor, Gemini, Gr

🦈 2-line install personal AI assistant. 11 AI runtime surfaces (Claude, Codex, Cursor, Gemini, Grok, Antigravity, OpenCode, Copilot), 200+ skills, zero ban risk. - lidge-jun/cli-jaw

github.com

 

반응형

 

 

Mirage는 AI 에이전트가 S3, Google Drive, Slack, Gmail, Redis, GitHub 같은 여러 서비스와 데이터 소스를 하나의 가상 파일시스템처럼 다룰 수 있게 해주는 오픈소스 프로젝트입니다. 복잡한 API나 서비스별 SDK를 각각 익히는 대신, 익숙한 Unix 스타일 명령어와 파일 경로 개념으로 다양한 백엔드에 접근할 수 있도록 설계된 점이 특징입니다.

Mirage의 핵심은 여러 리소스를 하나의 트리 구조 아래에 마운트하는 방식입니다. 예를 들어 /s3, /slack, /github, /data 같은 경로를 만들고, AI 에이전트는 cat, grep, cp 같은 명령으로 각 서비스의 데이터를 읽고 처리할 수 있습니다. 이는 LLM이 이미 잘 이해하는 bash와 파일시스템 문법을 활용한다는 점에서 실용적입니다.

활용 장면도 꽤 분명합니다. 예를 들어 S3에 저장된 로그 파일에서 특정 이벤트를 찾고, Slack 메시지에서 관련 알림을 검색한 뒤, GitHub 저장소의 문서를 참고해 요약 보고서를 만드는 흐름을 하나의 작업 공간 안에서 구성할 수 있습니다. Mirage는 Python, TypeScript SDK와 CLI를 제공해 애플리케이션 내부나 개발 환경에 직접 통합할 수 있습니다.

비슷한 도구들이 서비스별 커넥터나 개별 API 호출에 초점을 맞춘다면, Mirage는 “모든 백엔드를 파일시스템처럼 다룬다”는 추상화가 돋보입니다. 또한 작업 공간을 스냅샷으로 저장하거나 복원할 수 있고, 원격 백엔드 접근을 줄이기 위한 캐시 구조도 제공해 반복 작업에 유리합니다.

추천 대상은 AI 에이전트에게 여러 데이터 소스 접근 권한을 주고 싶은 개발자, LLM 기반 자동화 워크플로를 만드는 팀, Slack·S3·GitHub·Google Drive 같은 도구를 함께 쓰는 조직입니다. 특히 에이전트가 여러 서비스 사이를 오가며 읽기, 검색, 복사, 요약 같은 작업을 수행해야 한다면 Mirage의 접근 방식이 도움이 될 수 있습니다.

정리하면 Mirage는 AI 에이전트가 다양한 외부 서비스를 더 단순하고 일관된 방식으로 사용할 수 있게 해주는 가상 파일시스템 레이어입니다. 아직 초기 공개 버전이지만, AI 에이전트 개발에서 반복적으로 등장하는 “도구 연결의 복잡함”을 파일시스템이라는 익숙한 개념으로 풀어내려는 점에서 주목할 만한 프로젝트입니다.

 

https://github.com/strukto-ai/mirage

 

GitHub - strukto-ai/mirage: A Unified Virtual Filesystem For AI Agents

A Unified Virtual Filesystem For AI Agents. Contribute to strukto-ai/mirage development by creating an account on GitHub.

github.com

 

반응형

 

 

AI 이미지에는 우리가 눈으로 보지 못하는 다양한 흔적이 남습니다.
remove-ai-watermarks는 이런 AI 워터마크와 메타데이터를 제거할 수 있도록 만든 오픈소스 프로젝트입니다. 단순한 로고 제거를 넘어, SynthID·C2PA·EXIF 같은 보이지 않는 정보까지 다룬다는 점이 흥미로운 도구입니다.

이 프로젝트는 GitHub에서 공개된 Python 기반 CLI 도구로, Google Gemini(Nano Banana), ChatGPT/DALL·E, Stable Diffusion, Adobe Firefly, Midjourney 등 여러 생성형 AI 서비스에서 만들어진 이미지의 흔적을 제거하는 기능을 제공합니다. 특히 Gemini 이미지에 들어가는 반짝이 형태의 시각적 워터마크를 reverse alpha blending 방식으로 제거하는 부분이 핵심 특징 중 하나입니다.

짧게 정리하면, 단순한 “워터마크 제거기”라기보다 AI 생성 이미지의 출처 흔적을 정리하는 연구 성격의 도구에 가깝습니다.
눈에 보이는 로고뿐 아니라 C2PA provenance, EXIF/XMP 정보, “Made with AI” 라벨을 유발하는 메타데이터까지 제거할 수 있도록 설계되어 있습니다.

기능 구성도 꽤 다양합니다.
대표적으로는 다음과 같은 기능이 포함됩니다.

Gemini/Nano Banana 시각 워터마크 제거
SynthID·StableSignature·TreeRing 같은 invisible watermark 제거
EXIF/XMP/C2PA 메타데이터 삭제
이미지 배치 처리(batch processing)
얼굴 영역 보호(Smart Face Protection)
필름 그레인·색수차 기반 “Analog Humanizer”

특히 Smart Face Protection 기능은 AI 재생성 과정에서 얼굴이 깨지거나 변형되는 문제를 줄이기 위해 얼굴 영역을 자동 추출·보존하는 방식으로 동작합니다. 일반적인 단순 워터마크 제거 툴과 비교하면 상당히 기술 지향적인 접근이라고 볼 수 있습니다.

활용 시나리오도 다양합니다.
예를 들어 AI로 생성한 이미지를 SNS에 업로드할 때 불필요한 메타데이터를 정리하거나, 연구 목적에서 AI 워터마킹 기술의 한계를 테스트하는 용도로 사용할 수 있습니다. 또한 이미지 포렌식이나 생성형 AI 탐지 기술에 관심 있는 개발자·연구자 입장에서는 워터마크 제거 방식 자체를 분석하는 학습 자료로도 의미가 있습니다.

비슷한 이미지 편집 도구들과 비교했을 때 눈에 띄는 점은 “단순 인페인팅” 수준을 넘어 invisible watermark까지 다룬다는 점입니다. 실제로 프로젝트 설명에서도 diffusion-based regeneration 기법을 이용해 주파수 영역의 워터마크를 제거한다고 소개하고 있으며, 관련 연구 논문들과 연결되는 기술 흐름도 확인할 수 있습니다.

다만 이 프로젝트는 일반 사용자용 GUI 서비스라기보다는 개발자·리서처 중심의 CLI 도구에 가깝습니다. Python 환경 설정과 모델 실행에 대한 이해가 필요할 수 있기 때문에, 터미널 기반 작업에 익숙한 사용자에게 더 적합합니다. macOS Apple Silicon(MPS), Linux CUDA, CPU 환경 등을 지원한다는 점도 개발자 친화적인 부분입니다.

정리하면 remove-ai-watermarks는 단순한 워터마크 제거 앱이 아니라, 생성형 AI 이미지의 “출처 흔적”을 어떻게 남기고 또 어떻게 제거할 수 있는지를 보여주는 흥미로운 오픈소스 프로젝트입니다. AI 워터마킹·콘텐츠 인증·이미지 포렌식 같은 주제에 관심 있다면 한 번쯤 살펴볼 만한 저장소입니다.

 

https://github.com/wiltodelta/remove-ai-watermarks

 

GitHub - wiltodelta/remove-ai-watermarks: CLI and library for removing visible (Gemini) and invisible (SynthID, C2PA, EXIF) AI w

CLI and library for removing visible (Gemini) and invisible (SynthID, C2PA, EXIF) AI watermarks from images - wiltodelta/remove-ai-watermarks

github.com

 

반응형

+ Recent posts