리서치 범위

항목 포함 대상 비고
임베딩 모델 API OpenAI (Embeddings), Azure OpenAI, Anthropic (Claude Embedding), Google Gemini Embedding, Cohere, Mistral, AWS Bedrock Embeddings 필요 시 다른 국내·오픈소스 API 추가
벡터 DB Pinecone, Weaviate Cloud, Qdrant Cloud, Milvus (Zilliz Cloud 포함), Chroma Cloud, Elastic Search Vector Search (Serverless) 등 “온-프레미스 OSS + 클라우드 SaaS” 모두 확인
Elasticsearch Elastic Cloud (SaaS), Self-Managed License (ESS/ECE), Serverless 버전 벡터 검색 옵션 포함

비교 항목

  1. 가격 단위
  2. 배포 옵션
  3. 임베딩 – 벡터 DB 통합
  4. 무료 티어/최소 과금 및 계측 주기

임베딩

임베딩 모델 API 과금 체계

벤더 모델 요금 단위 (1M 토큰) 입력 단가 무료 티어 공식 벡터 DB 통합 별도 서버 운용 가정 비고
OpenAI text-embedding-3-small $0.02 $0.02 신규 사용자 $5 크레딧 Pinecone 공식 가이드 불필요 (API 호출만)
text-embedding-3-large $0.13 $0.13 신규 사용자 $5 크레딧 Pinecone 공식 가이드 불필요 (API 호출만)
text-embedding-ada-002 $0.10 $0.10 신규 사용자 $5 크레딧 Pinecone 공식 가이드 불필요 (API 호출만)
Azure OpenAI text-embedding-3-small $0.02 $0.02 신규 계정 $200 크레딧 (30일) Azure AI Search 연동 VM 자체 호스팅 가능
text-embedding-3-large $0.13 $0.13 신규 계정 $200 크레딧 (30일) Azure AI Search 연동 VM 자체 호스팅 가능
text-embedding-ada-002 $0.10 $0.10 신규 계정 $200 크레딧 (30일) Azure AI Search 연동 VM 자체 호스팅 가능
Voyage AI voyage-3-large $0.18 $0.18 첫 200M 토큰 무료 Pinecone, Milvus, Qdrant 등 연동 불필요 (API 호출만) Anthropic 공식 권장, 고성능
voyage-3.5 $0.06 $0.06 첫 200M 토큰 무료 Pinecone, Milvus, Qdrant 등 연동 불필요 (API 호출만)
voyage-3.5-lite $0.02 $0.02 첫 200M 토큰 무료 Pinecone, Milvus, Qdrant 등 연동 불필요 (API 호출만)
voyage-code-3 $0.18 $0.18 첫 200M 토큰 무료 Pinecone, Milvus, Qdrant 등 연동 불필요 (API 호출만) 코드 검색 특화
voyage-code-2 $0.12 $0.12 첫 50M 토큰 무료 Pinecone, Milvus, Qdrant 등 연동 불필요 (API 호출만) 도메인 특화 모델
Google Gemini gemini-embedding-exp-03-07 무료 (실험적) $0 분당 10회·일 1,000회 Vertex AI Search 연동 불가 Experimental preview
Cohere embed-v4.0 $0.12 $0.12 Trial API Key (rate-limited) Weaviate 등 연동 지원 자체 호스팅 가능 이전 v3: $0.10/1M
Mistral mistral-embed $0.01 $0.01 정보 없음 (문의 필요) Milvus·Qdrant 연동 API 호출만 최저가 embed 모델
AWS Bedrock Titan Text Embeddings V2 $0.02 $0.02 없음 OpenSearch Service 연동 API 호출만 1K 토큰당 $0.00002 과금

이미지 임베딩 API 과금 체계

벤더 모델 지원 모달리티 과금 체계 무료 티어 배포 옵션 통합 지원 비고
Voyage AI voyage-multimodal-3 이미지 $0.12/1M 토큰 + $0.60/1B 픽셀 200M 토큰 + 150B 픽셀 무료 SaaS (api.voyageai.com) Pinecone, Milvus, Qdrant, Weaviate, LanceDB 텍스트+이미지 동시 처리
AWS Bedrock Titan Multimodal Embeddings G1 이미지 On-Demand: $0.00006/이미지, Batch: $0.00003/이미지 없음 SaaS (AWS Fully Managed) LangChain, SageMaker, boto3(BedrockRuntime) 배치 모드 비용 절감 가능
Google Vertex AI multimodalembedding@001 이미지 별도 공지 없음 문의 필요 SaaS (Vertex AI 플랫폼) :contentReference[oaicite:8]{index=8} BigQuery, Firestore Vector Search, LangChain, Weaviate Preview 단계
Hugging Face feature-extraction (CLIP 기반) 이미지 CPU: $0.032/코어·시간, GPU: $0.50/GPU·시간 Unregistered: 1req/hr; Registered: 300req/hr; Pro: 1000req/hr SaaS (HF Inference API) HF Hub 모델, Replicate 등 지원 모델별 비용 동일, 컴퓨팅 시간 기준

멀티모달 임베딩을 지원하는 임베딩 API

벤더 모델 지원 모달리티 과금 체계 무료 티어 배포 옵션 통합 지원 비고
Voyage AI voyage-multimodal-3 텍스트 + 이미지 $0.12/1M 토큰 + $0.60/1B 픽셀 200M 토큰 + 150B 픽셀 무료 SaaS (api.voyageai.com) Pinecone, Milvus, Qdrant, Weaviate, LanceDB 단일 백본으로 텍스트·이미지 동시 처리
AWS Bedrock Titan Multimodal Embeddings G1 텍스트 + 이미지 On-Demand: $0.0008/1K 토큰, $0.00006/이미지<br>Batch: $0.0004/1K 토큰, $0.00003/이미지 없음 SaaS (AWS Fully Managed) LangChain, SageMaker, boto3(BedrockRuntime) 배치 모드로 비용 절감 가능
Google Vertex AI multimodalembedding@001 텍스트 + 이미지 + 비디오 별도 공지 없음 문의 필요 SaaS (Vertex AI 플랫폼) BigQuery, Firestore Vector Search, LangChain, Weaviate 1408차원 벡터 생성; Preview 단계 제한적 사용 가능

벡터 DB

독립형(SaaS, OSS)

벤더 (출처) SaaS OSS AWS GCP Azure 플랜·인스턴스(고정비) 스토리지 쓰기/인제스트 읽기/쿼리 비고
Pinecone (pinecone.io, docs.pinecone.io) × Standard $25 / mo (15$ 크레딧) $0.33 / GB·mo $4 / 1M upserts $16 / 1M queries Starter 플랜(2 GB) 무료
Weaviate Cloud (weaviate.io) Standard $25 / mo $0.095 / 1M dims·mo Pro $135/mo, Biz $450/mo
Qdrant Cloud (qdrant.tech) Hybrid $0.014 / node·hr 포함 포함 포함 Managed 1 GB 무료
Zilliz Cloud (Milvus) (zilliz.com) Serverless $4 / 1M vCUs Free 5 GB 포함 포함 Dedicated 플랜 문의
Chroma Cloud (trychroma.com) × × × Starter $0 / moTeam $250 / mo $0.33 / GiB·mo $2.50 / GiB ingest $0.0075 / TiB scan+$0.09 / GiB return $5 크레딧 무료

클라우드