OCR4all은 무료 오픈소스 OCR(광학 문자 인식) 소프트웨어로, 복잡한 필사본부터 대량의 인쇄물까지 고품질 문자 인식을 제공합니다.

 

사용자가 코드 없이 UI를 통해 OCR 워크플로우를 생성할 수 있으며, 강력한 LAREX 편집기를 활용해 텍스트와 레이아웃을 수동으로 조정할 수 있습니다.

 

또한 OCR-D 생태계와 완벽하게 호환되며, Docker를 이용한 간편한 크로스플랫폼 배포가 가능합니다.

 

https://www.ocr4all.org/

반응형

ScrapeServ는 특정 URL을 입력하면 해당 웹사이트의 데이터를 파일로 저장하고 스크린샷을 제공하는 자체 호스팅 API입니다.

 

이 도구는 Playwright를 사용해 브라우저 컨텍스트를 실행하며, 자바스크립트가 포함된 사이트도 문제없이 처리할 수 있습니다.

 

주요 기능:

페이지 스크롤 및 다양한 섹션의 스크린샷 저장

Docker 컨테이너에서 실행 가능

HTTP 상태 코드 및 헤더 반환

302 리디렉션 자동 처리

API 키 인증 지원

작업 대기열 처리 및 메모리 할당 조정 가능

 

설치 및 사용 방법:

1. Docker 및 docker compose를 설치

2. 저장소 클론 후 docker compose up 실행

3. http://localhost:5006에서 서비스 실행 확인

4. API 요청을 통해 스크린샷 및 웹 데이터 수집 가능

 

ScrapeServ는 고품질 웹 스크래핑이 필요한 개발자들에게 유용한 도구입니다. GitHub에서 프로젝트를 확인해 보세요!

 

https://github.com/US-Artificial-Intelligence/ScrapeServ

반응형

Open WebUI는 로컬 및 원격 LLM(대형 언어 모델)과 상호작용할 수 있는 오픈소스 웹 UI입니다.

OpenAI API, Ollama, OpenRouter, LocalAI 등의 다양한 백엔드를 지원하며, 자체 호스팅이 가능해 보안성과 확장성이 뛰어납니다.

 

주요 기능:

쉬운 설치 및 설정

여러 모델 지원(OpenAI, Ollama 등)

사용자 친화적인 대시보드

플러그인 및 커스터마이징 가능

 

https://github.com/open-webui/open-webui

 

반응형

+ Recent posts