「RAG 構築のためにベクトル DB を選びたいが、Pinecone と pgvector でどちらがいい?」 — エンジニア・PM からよく頂く実装系の質問です。本記事では主要 4 種(Pinecone / Weaviate / pgvector / Qdrant)を 費用・性能・運用負荷・移行コストの 4 軸で比較し、中小企業 RAG での選択指針を整理します。

結論を先に:中小企業の RAG 構築なら、まず pgvector(PostgreSQL 拡張)から始めるのが最強の選択です。理由は ① 追加コスト 0 円 ② 既存 DB と統合管理 ③ 10-100 万件規模なら専用 DB と同等の検索速度 ④ オープンソースでロックインなし、の 4 点。

ベクトル DB とは何か(30 秒で)

ベクトル DB は「テキストや画像を数値ベクトル(埋め込み)として保存し、類似検索を高速化する DB」。RAG では「ユーザーの質問」と「社内ドキュメント」を共通空間のベクトルに変換し、距離が近いドキュメントを返します。

詳しくは 「RAG とは何か?仕組みと『使い物になる』判断基準」 をご参照ください。

比較軸:費用・性能・運用負荷・移行コスト

  • 費用:初期費用 + 月額(マネージドは月固定 / 従量、OSS はサーバー代のみ)
  • 性能:10 万件 / 100 万件 / 1,000 万件規模での検索速度(QPS)
  • 運用負荷:セットアップ、バックアップ、スケール、監視の手間
  • 移行コスト:別 DB への移行時のコード書き換え + データエクスポート工数

Pinecone — マネージドの王道

強み

  • セットアップ 5 分、すぐ使える
  • 自動スケール、運用ゼロ
  • Serverless プランで小規模も対応
  • 10 億ベクトル規模まで安定

弱み

  • 従量課金で月 $50-500+ の幅
  • クラウドロックイン(独自 API)
  • データを別環境にエクスポートしづらい
  • ハイブリッド検索(ベクトル + キーワード)に弱い

向く案件

短期立ち上げ重視、運用工数を払いたくない、規模スケールが読めない PoC。逆に長期運用 + コスト重視なら不向き。

Weaviate — フルスタック型 OSS

強み

  • オープンソース(自社設置可)
  • 埋め込み生成・ハイブリッド検索・GraphQL API などフルスタック
  • マネージド版(Weaviate Cloud)あり

弱み

  • 機能が多すぎて学習コスト高
  • セルフホストの運用負荷大(Kubernetes 推奨)
  • マネージドは Pinecone と同等の価格

向く案件

複雑な検索要件(ベクトル + フィルタ + キーワード)、エンジニア体制が整った企業、研究開発寄り。中小企業向きではない。

pgvector — PostgreSQL 拡張(中小企業の本命)

強み

  • 既存 PostgreSQL に拡張インストールするだけ(CREATE EXTENSION vector)
  • 追加サーバー不要、追加コスト 0 円
  • HNSW インデックスで 100 万ベクトル × 数十 ms 検索
  • ベクトル + メタデータ(カテゴリ、日付、権限)を SQL で同時クエリ
  • 既存業務 DB のバックアップ・運用にそのまま乗る

弱み

  • 10M ベクトル超では専用 DB に劣る
  • 大規模並列クエリ(QPS 1,000+)には不向き

向く案件

中小企業の社内 RAG(社内文書 1 万-100 万ファイル)の 95%。既存 PostgreSQL 上で稼働、運用工数最小。スグレルの RAG 案件もデフォルトで pgvector を選定するケースが多い。

Qdrant — 軽量高性能 OSS

強み

  • Rust 実装で軽量・高速
  • Docker で 1 行起動、運用シンプル
  • マネージド版(Qdrant Cloud)月 $25 から
  • フィルタリング機能が強い

弱み

  • PostgreSQL のような既存連携はない
  • 専用サーバー or マネージド契約が必要

向く案件

pgvector では性能が足りなくなった次のステップ。10M+ ベクトル規模、複雑なフィルタが必要な案件。

4 種の比較マトリクス

PineconeWeaviatepgvectorQdrant
初期費用00 (OSS)00 (OSS)
月額(中小規模)$50-200サーバー代 $20+0 円$25-100
セットアップ5 分1-2 日30 分1 時間
運用負荷ゼロ既存 DB と同じ
100 万ベクトル検索10-50 ms20-80 ms30-100 ms10-40 ms
10M ベクトル対応
移行容易性×○ (OSS)
中小企業適合度

中小企業向けの判断フローチャート

  1. 社内ドキュメントが 100 万件未満 → pgvector(既存 PostgreSQL に拡張)
  2. 100 万-1,000 万件 + 運用工数を抑えたい → Qdrant セルフホスト(Docker 1 行)
  3. すぐ立ち上げたい + 短期 PoC + 工数最小 → Pinecone Serverless
  4. 複雑な検索 + エンジニア体制あり → Weaviate(少数派)

ほとんどの中小企業案件は ① pgvector 一択です。「いずれ規模が大きくなったら」のような仮定で Pinecone を選ぶと、運用コストが累積します。

よくあるご質問

中小企業の RAG 構築でおすすめは?

ドキュメント数 10 万件未満なら pgvector(PostgreSQL 拡張)が最強。既存 DB と統合管理でき、追加コスト 0 円。10-100 万件で運用負荷を抑えたいなら Qdrant のセルフホスト、ベンダーロックインを許容して即立ち上げなら Pinecone Serverless が選択肢。

Pinecone は月額いくらかかりますか?

Pinecone Serverless は『ストレージ + クエリ + 書き込み』の従量課金。中小企業向け規模(数万-数十万ベクトル、月 100 万クエリ未満)で月 $50-200 程度。Pod 型は月最低 $70 から。pgvector なら同じ規模を月数千円で運用可能。

pgvector のパフォーマンスは大丈夫?

100 万ベクトル以下なら HNSW インデックスで Pinecone と同等の検索速度(数十 ms)。10M ベクトル超え or 同時クエリ 1,000 件以上の規模では専用ベクトル DB が有利。中小企業の RAG 用途では 99% pgvector で十分。

ベンダーロックインのリスクは?

Pinecone はクラウド固有のため、移行時にコード書き換え + データエクスポート + 再インデックスが必要(数日工数)。pgvector / Qdrant はオープンソースで、別環境への移行コストが低い。長期運用を視野に入れるなら OSS ベースを推奨。