MarkItDown은 Microsoft에서 제공하는 Python 기반 도구로, 다양한 문서를 Markdown 형식으로 변환할 수 있습니다.
지원되는 파일 형식에는 PDF, Word(.docx), Excel(.xlsx), PowerPoint(.pptx), HTML, 이미지(EXIF 메타데이터 및 OCR 포함), 오디오 파일(음성 인식 포함) 등이 포함됩니다.
이 도구는 간단한 API를 통해 손쉽게 사용할 수 있으며, 텍스트 분석 및 데이터 정리를 위한 강력한 도구입니다.
자세한 내용은 GitHub 페이지에서 확인하세요.
'IT 소식 > 오픈소스' 카테고리의 다른 글
REST API를 쉽게 리버스 엔지니어링: mitmproxy2swagger (0) | 2025.01.02 |
---|---|
SeekStorm : 초고속 텍스트 검색 라이브러리 (0) | 2024.12.03 |
React Scan: 리액트 성능 최적화를 위한 강력한 도구 (1) | 2024.12.02 |