법률서비스 AI 서버 클라우드 전환 및 검색 고도화

온프레미스 AI 서버를 EC2·RDS 구조로 전환하고, Gemini 2.5 Flash·text-embedding-004 기반 검색 스택으로 재구성 Flask WAS, IVF_SQ8 인덱스 최적화, PM2 배포 흐름까지 운영 기준 정리

2025년 9월 - 2025년 9월상태: completed카테고리: ai

문제

기존 구조의 병목 해소가 필요 · 온프레미스 자원 한계로 초기 임베딩 적재 시 메모리 부족 · HNSW 기준 메모리 요구량 약 12GB로 8GB 서버 환경 운영 곤란 · 생성형, 요약, 임베딩 모델 스택 분산 · 데이터베이스 운영 구조 이원화 · 인덱스 버전 관리와 재배포 절차 부재

내 역할

핵심 역할: 인프라 전환과 AI 검색 스택 재구성 · 온프레미스 서버에서 EC2·RDS 구조로 이전 · EBS 기반 swap 10GB 구성으로 초기 임베딩 적재 안정화 · Flask WAS 디렉터리 구조와 계층 분리 기준 정리 · Gemini 2.5 Flash, text-embedding-004 전환 · IVF_SQ8 파라미터 튜닝과 PM2 기반 운영·배포 절차 정리

접근

인프라, 모델, 검색 인덱스를 함께 재설계 · EC2 t3.medium + EBS gp3 50GB 구성으로 이전 · swap 10GB 확보로 메모리 한계 대응 · 기존 lawsdaq 백엔드 RDS에 schema(data) 추가로 DB 운영 단순화 · 1000자 청킹 / 200자 오버랩 / 배치 128 기준 임베딩 파이프라인 정립 · IVF_SQ8 인덱스에 nlist=256, nprobe=16 튜닝 적용 · 정확도와 메모리 사용량 균형을 맞춘 운영 구성으로 고정 · GitHub Push → Pull → PM2 Restart 배포 흐름 고정

성과

클라우드에서 운영 가능한 법률 AI 검색 서버 기준 확립 · 온프레미스 AI 서버를 EC2/RDS 구조로 전환 · Gemini 2.5 Flash로 생성형·요약 모델 통합 · IVF_SQ8 기반 벡터 검색 스택 정착 · 검색 정확도 80%에서 97% 수준으로 개선 · 인덱스 메모리 요구량을 12GB에서 4~6GB 수준으로 축소 · 8GB 서버 환경에서 운영 가능한 검색 구조 확보

성과 지표

검색 정확도 80%에서 97%로 개선

인덱스 메모리 요구량 12GB에서 4~6GB로 축소

8GB 서버 환경에서 운영 가능한 벡터 검색 구조 확보

IVF_SQ8 튜닝(nlist=256, nprobe=16)으로 정확도·자원 균형 확보

연결된 경험

이 프로젝트가 속한 경력 또는 활동 경험입니다.

경력

2025.09 - 2025.12

인턴/연구원(컨설턴트, 백엔드 개발)

더이노베이터스/TA팀

홈 타임라인에서 보기

한눈에 보기

공개 경로:

/projects/lawsdaq-ai-서버-클라우드-전환-및-검색-고도화

대표 프로젝트:

예, 순서 1

사용 기술:

Flask, EC2, EBS, RDS, MySQL, embedding, milvus