RLAMA는 로컬 Ollama 모델을 활용한 강력한 문서 기반 질의응답(Q&A) 도구입니다. PDF, DOCX, 코드 파일 등 다양한 문서 형식을 지원하며, 모든 처리가 로컬에서 이루어져 데이터 유출 걱정 없이 사용할 수 있습니다.

주요 기능

문서 폴더를 색인화하여 RAG 시스템 생성

인터랙티브 질의응답 세션 지원

간편한 RAG 시스템 관리 (생성, 목록 조회, 삭제)

macOS, Linux, Windows 지원

 

개발자를 위한 CLI 기반 인터페이스를 제공하며, 연구, 학습, 내부 문서 관리 등 다양한 활용이 가능합니다. RLAMA로 개인 또는 기업의 문서 활용을 최적화해 보세요!

 

https://rlama.dev/

반응형

SGLang은 대형 언어 모델(LLM)과 비전 언어 모델(VLM)을 빠르게 서빙할 수 있는 프레임워크입니다. 백엔드 런타임과 프론트엔드 언어를 함께 설계하여 모델과의 상호작용을 더욱 빠르고 효율적으로 만듭니다.

 

핵심 기능

RadixAttention을 활용한 프리픽스 캐싱

오버헤드 없는 CPU 스케줄러

연속 배칭 및 토큰 주의(Paged Attention)

DeepSeek V3/R1 모델 지원 (NVIDIA & AMD GPU 최적화)

JSON 디코딩 속도 3배 향상

 

SGLang은 LLaMA, DeepSeek 등 다양한 최신 모델을 빠르게 서빙할 수 있도록 지원하며, 지속적인 업데이트를 통해 성능을 개선하고 있습니다.

 

https://github.com/sgl-project/sglang

반응형

Merlion은 Salesforce에서 개발한 시계열 분석을 위한 오픈소스 라이브러리입니다.

 

예측(Forecasting), 이상 탐지(Anomaly Detection), 데이터 전처리 등 다양한 기능을 제공하며, 통합된 평가 프레임워크를 통해 모델 성능을 쉽게 비교할 수 있습니다.

 

이 라이브러리는 딥러닝 및 전통적인 기법을 모두 지원하며, PyTorch 및 TensorFlow와 호환됩니다.

데이터 과학자와 엔지니어가 실무에서 활용하기 쉽게 설계되어 있어 금융, IoT, IT 모니터링 등 다양한 분야에서 사용할 수 있습니다.

 

https://github.com/salesforce/Merlion

 

GitHub - salesforce/Merlion: Merlion: A Machine Learning Framework for Time Series Intelligence

Merlion: A Machine Learning Framework for Time Series Intelligence - salesforce/Merlion

github.com

 

반응형

+ Recent posts