「RAG 構築のためにベクトル DB を選びたいが、Pinecone と pgvector でどちらがいい?」 — エンジニア・PM からよく頂く実装系の質問です。本記事では主要 4 種(Pinecone / Weaviate / pgvector / Qdrant)を 費用・性能・運用負荷・移行コストの 4 軸で比較し、中小企業 RAG での選択指針を整理します。
結論を先に:中小企業の RAG 構築なら、まず pgvector(PostgreSQL 拡張)から始めるのが最強の選択です。理由は ① 追加コスト 0 円 ② 既存 DB と統合管理 ③ 10-100 万件規模なら専用 DB と同等の検索速度 ④ オープンソースでロックインなし、の 4 点。
ベクトル DB とは何か(30 秒で)
ベクトル DB は「テキストや画像を数値ベクトル(埋め込み)として保存し、類似検索を高速化する DB」。RAG では「ユーザーの質問」と「社内ドキュメント」を共通空間のベクトルに変換し、距離が近いドキュメントを返します。
詳しくは 「RAG とは何か?仕組みと『使い物になる』判断基準」 をご参照ください。
比較軸:費用・性能・運用負荷・移行コスト
- 費用:初期費用 + 月額(マネージドは月固定 / 従量、OSS はサーバー代のみ)
- 性能:10 万件 / 100 万件 / 1,000 万件規模での検索速度(QPS)
- 運用負荷:セットアップ、バックアップ、スケール、監視の手間
- 移行コスト:別 DB への移行時のコード書き換え + データエクスポート工数
Pinecone — マネージドの王道
強み
- セットアップ 5 分、すぐ使える
- 自動スケール、運用ゼロ
- Serverless プランで小規模も対応
- 10 億ベクトル規模まで安定
弱み
- 従量課金で月 $50-500+ の幅
- クラウドロックイン(独自 API)
- データを別環境にエクスポートしづらい
- ハイブリッド検索(ベクトル + キーワード)に弱い
向く案件
短期立ち上げ重視、運用工数を払いたくない、規模スケールが読めない PoC。逆に長期運用 + コスト重視なら不向き。
Weaviate — フルスタック型 OSS
強み
- オープンソース(自社設置可)
- 埋め込み生成・ハイブリッド検索・GraphQL API などフルスタック
- マネージド版(Weaviate Cloud)あり
弱み
- 機能が多すぎて学習コスト高
- セルフホストの運用負荷大(Kubernetes 推奨)
- マネージドは Pinecone と同等の価格
向く案件
複雑な検索要件(ベクトル + フィルタ + キーワード)、エンジニア体制が整った企業、研究開発寄り。中小企業向きではない。
pgvector — PostgreSQL 拡張(中小企業の本命)
強み
- 既存 PostgreSQL に拡張インストールするだけ(CREATE EXTENSION vector)
- 追加サーバー不要、追加コスト 0 円
- HNSW インデックスで 100 万ベクトル × 数十 ms 検索
- ベクトル + メタデータ(カテゴリ、日付、権限)を SQL で同時クエリ
- 既存業務 DB のバックアップ・運用にそのまま乗る
弱み
- 10M ベクトル超では専用 DB に劣る
- 大規模並列クエリ(QPS 1,000+)には不向き
向く案件
中小企業の社内 RAG(社内文書 1 万-100 万ファイル)の 95%。既存 PostgreSQL 上で稼働、運用工数最小。スグレルの RAG 案件もデフォルトで pgvector を選定するケースが多い。
Qdrant — 軽量高性能 OSS
強み
- Rust 実装で軽量・高速
- Docker で 1 行起動、運用シンプル
- マネージド版(Qdrant Cloud)月 $25 から
- フィルタリング機能が強い
弱み
- PostgreSQL のような既存連携はない
- 専用サーバー or マネージド契約が必要
向く案件
pgvector では性能が足りなくなった次のステップ。10M+ ベクトル規模、複雑なフィルタが必要な案件。
4 種の比較マトリクス
| Pinecone | Weaviate | pgvector | Qdrant | |
|---|---|---|---|---|
| 初期費用 | 0 | 0 (OSS) | 0 | 0 (OSS) |
| 月額(中小規模) | $50-200 | サーバー代 $20+ | 0 円 | $25-100 |
| セットアップ | 5 分 | 1-2 日 | 30 分 | 1 時間 |
| 運用負荷 | ゼロ | 大 | 既存 DB と同じ | 小 |
| 100 万ベクトル検索 | 10-50 ms | 20-80 ms | 30-100 ms | 10-40 ms |
| 10M ベクトル対応 | ◎ | ◎ | △ | ○ |
| 移行容易性 | × | ○ (OSS) | ◎ | ◎ |
| 中小企業適合度 | ○ | △ | ◎ | ○ |
中小企業向けの判断フローチャート
- 社内ドキュメントが 100 万件未満 → pgvector(既存 PostgreSQL に拡張)
- 100 万-1,000 万件 + 運用工数を抑えたい → Qdrant セルフホスト(Docker 1 行)
- すぐ立ち上げたい + 短期 PoC + 工数最小 → Pinecone Serverless
- 複雑な検索 + エンジニア体制あり → Weaviate(少数派)
ほとんどの中小企業案件は ① pgvector 一択です。「いずれ規模が大きくなったら」のような仮定で Pinecone を選ぶと、運用コストが累積します。
よくあるご質問
中小企業の RAG 構築でおすすめは?
ドキュメント数 10 万件未満なら pgvector(PostgreSQL 拡張)が最強。既存 DB と統合管理でき、追加コスト 0 円。10-100 万件で運用負荷を抑えたいなら Qdrant のセルフホスト、ベンダーロックインを許容して即立ち上げなら Pinecone Serverless が選択肢。
Pinecone は月額いくらかかりますか?
Pinecone Serverless は『ストレージ + クエリ + 書き込み』の従量課金。中小企業向け規模(数万-数十万ベクトル、月 100 万クエリ未満)で月 $50-200 程度。Pod 型は月最低 $70 から。pgvector なら同じ規模を月数千円で運用可能。
pgvector のパフォーマンスは大丈夫?
100 万ベクトル以下なら HNSW インデックスで Pinecone と同等の検索速度(数十 ms)。10M ベクトル超え or 同時クエリ 1,000 件以上の規模では専用ベクトル DB が有利。中小企業の RAG 用途では 99% pgvector で十分。
ベンダーロックインのリスクは?
Pinecone はクラウド固有のため、移行時にコード書き換え + データエクスポート + 再インデックスが必要(数日工数)。pgvector / Qdrant はオープンソースで、別環境への移行コストが低い。長期運用を視野に入れるなら OSS ベースを推奨。