Docling은 다양한 문서 형식을 쉽게 처리하고, 생성형 AI와 연동할 수 있도록 돕는 오픈소스 프로젝트입니다. PDF, DOCX, PPTX, XLSX, HTML뿐만 아니라 이미지와 오디오 파일까지 지원하며, 고급 PDF 분석 기능을 통해 표, 코드, 수식, 레이아웃까지 이해할 수 있습니다.
또한 문서를 Markdown, HTML, JSON 등 여러 형식으로 변환할 수 있으며, LangChain, LlamaIndex, Haystack 같은 AI 프레임워크와도 손쉽게 통합할 수 있습니다. 로컬 실행도 가능해 보안이 중요한 환경에서도 활용할 수 있다는 점이 특징입니다.
https://github.com/docling-project/docling
GitHub - docling-project/docling: Get your documents ready for gen AI
Get your documents ready for gen AI. Contribute to docling-project/docling development by creating an account on GitHub.
github.com
반응형
'IT 소식 > AI' 카테고리의 다른 글
ApeRAG: 지식 그래프 기반 RAG 플랫폼으로 차세대 AI 애플리케이션 구축하기 (0) | 2025.09.16 |
---|---|
ScreenCoder: UI 스크린샷을 HTML/CSS 코드로 자동 변환하는 모듈형 AI 시스템 (0) | 2025.08.06 |
스마트폰에서 직접 AI 구동하기: ‘Cactus’ 프레임워크 소개 (0) | 2025.07.11 |