벡터 데이터베이스 (Vector Database)

별칭: vector database · 벡터DB · 벡터 DB

임베딩 벡터를 저장하고 의미가 가까운 항목을 빠르게 찾도록 만든 데이터베이스.

벡터 데이터베이스는 RAG 시스템에서 자주 쓰인다. 문서를 임베딩으로 바꿔 저장해두고, 사용자의 질문과 의미가 가까운 문서를 찾아 LLM에게 함께 넘긴다. 정확한 답변보다 “관련 근거를 잘 찾는 것”이 중요한 업무에서 핵심 인프라가 된다.

정의

벡터 데이터베이스임베딩 벡터를 저장하고, 새 벡터와 가까운 항목을 빠르게 검색하도록 설계된 데이터베이스다. 일반 데이터베이스가 정확한 값이나 조건으로 찾는 데 강하다면, 벡터 데이터베이스는 의미적 유사도를 기준으로 찾는 데 강하다.

왜 중요한가

RAG를 만들 때는 LLM이 답하기 전에 관련 문서를 찾아야 한다. 이때 사용자의 질문을 임베딩으로 바꾸고, 저장된 문서 임베딩 중 가까운 것을 찾는다. 벡터 데이터베이스는 이 검색을 빠르고 확장 가능하게 해준다.

Semicolon에서의 의미

SEMO KB, 강의 자료, 운영 문서가 많아질수록 단순 키워드 검색만으로는 부족하다. 벡터 검색을 붙이면 “환불 규정”, “다음 수업 안내”, “봇 역할”처럼 표현이 달라도 의미가 비슷한 문서를 찾아 챗봇이나 에이전트가 더 정확히 답할 수 있다.

주의할 점

벡터 데이터베이스는 권한 관리와 함께 설계해야 한다. 비공개 문서가 공개 사용자 질문에 검색되면 안 된다. 또한 검색된 문서가 항상 정답은 아니므로 출처 표시와 사람 검토가 중요하다.

출처