自社専用AIを構築するために必要な3つのアプローチ

自社専用AIの構築には、プロンプトを高度に運用するだけでは達成できず、目的に応じた3つのアプローチの役割分担が必要です。
これらはいずれもプロンプト操作とは根本的に異なる、パラメータレベルの介入です。

●LoRA――暗黙知・判断基準をパラメータに入れる
熟練営業担当者の数千件の商談記録、ベテラン担当者の判断基準、自社固有の文体――こうした暗黙知はテキストとして完全に明示できず、コンテキストに収めることもできません。
LoRAはこれらを差分パラメータとしてモデルに追加学習させます。
汎用モデルのパラメータは固定したまま、自社データから学習した補正値を重ねることで、プロンプトで指示しなくても文脈から自律的に自社流の判断が反映された出力が得られます。Azure AI StudioやAmazon Bedrockといったクラウドサービスでも一部モデルでLoRAベースのファインチューニングが利用可能になっており、外部パートナーとの連携すれば導入可能です。

●Embedding調整――社内文書・事例の意味検索を自社最適化する
汎用モデルのベクトル空間では、自社業務に固有の意味関係が正しく表現されていません。例えば「支払条件変更の覚書」と「支払超過の督促状」は与信リスクの文脈では意味的に近いはずですが、汎用モデルはこの関係を捉えられません。Embedding調整により自社のドメイン知識に最適化されたベクトル空間を構築することで、社内文書・過去事例の検索精度が自社業務の文脈で大幅に向上します。

　事例
　# 「支払条件変更」と「支払超過」はリスク文脈で近い
　　examples.append(InputExample(
　texts=[
　 “覚書支払条件変更サイト90日延長与信見直し要請”,
　”請求書支払期日超過30日督促状送付済み担当営業確認中”
　],
　label=0.85 # 類似度高
　　))

●予測モデル（GPR・XGBoost等）――数値パターンを統計的に学習する
需要予測・在庫予測・発注計画には予測専用モデルが必要です。GPRは確率分布に基づく予測値と信頼区間を直接提示できます。
XGBoost・LightGBMは自社の販売実績・季節変動・外部環境データから複合条件の非線形な相関を高精度で捉えます。これらは「もっともらしい文章を生成する」ためではなく、「数値として信頼できる予測を出す」ために設計されたモデルです。

※重要：パラメータは自社資産として保持する
外部ベンダーにLoRAやEmbeddingの構築を依頼する場合、調整済みパラメータが自社資産として保持される契約形態であることが重要です。パラメータがベンダーの資産になる契約では、ホワイトボックスの意味が失われ、ベンダー依存から抜け出せなくなります。

●なぜ汎用AIでは自社専用化できないのか
ChatGPTやClaudeはパラメータがクローズドに管理されており、外部からアクセスする手段が提供されていません。LoRAによる暗黙知の学習も、Embeddingの自社調整も構造的にできません。どれだけプロンプトを工夫しても、パラメータは世界の平均のままです。また仕様変更・価格改定・サービス終了のリスクを常に抱えることになり、自社固有の判断基準がパラメータに焼き込まれていない限り、AIは自社の資産ではなくベンダーのサービスに過ぎません。

参考資料：AIの答えが「教科書的」になる理由と汎用AIが自社専用にならない理由
 参考資料：AIでリスクを予見・内部統制を強化
 参考資料：少数データでAI分析
 自然言語処理AI技術・生成AI技術を使ったAIメール解析システム　　Mail Beacon-1を開発

おすすめ情報AIで経営課題を解決する