LLM を、プロンプトインジェクションと 情報漏えいから守る。 Protect your LLM from prompt injection and data leaks.
API 一本で、LLM に渡す前の入力を検査。プロンプトインジェクション・個人情報や秘密情報・Web 攻撃・有害コンテンツを検知して、許可かブロックかを返します。日本語にも対応。 One API call inspects every input before it reaches your LLM — catching prompt injection, leaked PII and secrets, web attacks, and harmful content, and returning an allow/block verdict. Japanese included.
課題The problem
LLM アプリの、新しい攻撃面LLM apps have a new attack surface
プロンプトインジェクション / 脱獄Prompt injection & jailbreaks
「これまでの指示を無視して」などの入力で、システムプロンプトの抽出や安全制約の回避を狙われ、LLM が意図しない動作をする。Inputs like "ignore previous instructions" try to extract the system prompt or bypass safety rules — making the LLM behave in ways you never intended.
個人情報・秘密情報の流出PII & secrets leaking in
プロンプトに紛れ込んだ個人情報・API キー・認証情報が、そのまま LLM や外部 API に渡ってしまう。Personal data, API keys, and credentials buried in a prompt flow straight through to the LLM — and any downstream API.
既存の対策では守れないTraditional tooling can't see it
従来の WAF は HTTP 層向けで、自然言語の攻撃を見られない。英語前提のツールは日本語を取りこぼし、誤検知も多い。Classic WAFs work at the HTTP layer and miss natural-language attacks; English-first tools both miss and over-flag Japanese.
仕組みHow it works
LLM に渡す前に、一度だけ検査One check, before the prompt reaches your LLM
アプリと LLM の間に挟むだけ。1 リクエストで多面的に検査し、構造化した判定を返します。Sit it between your app and the LLM. A single request runs every detector and returns a structured verdict.
-
01受け取るReceive
入力テキストを API で受信The input text, via API
-
02多面検査Inspect
各検知器で並列に解析Every detector, in parallel
-
03判定Verdict
深刻度・検知内容を返すSeverity & findings
-
04制御Enforce
ポリシーで許可/ブロックAllow / block by policy
-
05記録Audit
検知を記録・通知Logged & notified
機能Features
入力を、あらゆる角度から検査Inspect every input from every angle
プロンプトインジェクション検知Prompt-injection detection
機械学習の分類器で、指示の上書き・脱獄・システムプロンプト抽出を検知。高精度パターンで補強し、取りこぼしを減らします。An ML classifier flags instruction-override, jailbreaks, and system-prompt extraction — augmented with high-precision patterns to catch what the model alone misses.
個人情報・秘密情報の検知PII & secret detection
マイナンバー・クレジットカード・API キー・認証情報など 80 以上のルールで、プロンプトに混入した PII や秘密を検出します。80+ rules — My Number, credit cards, API keys, credentials and more — detect PII and secrets buried in a prompt.
Web 攻撃(WAF)検知Web-attack (WAF) detection
SQLi・XSS・コマンドインジェクション・SSRF など 12 カテゴリを検知。多段デコードで難読化されたペイロードも看破します。Catches SQLi, XSS, command injection, SSRF and 12 categories in all — with multi-stage decoding to see through obfuscated payloads.
有害コンテンツ検知Harmful-content detection
武器・薬物・詐欺・ハッキングなど、危険な指示や有害な要求を検知します。Flags dangerous instructions and harmful requests — weapons, drugs, fraud, hacking, and more.
難読化の解除De-obfuscation
Base64・ゼロ幅文字・Unicode 難読化などをデコードしてから評価。エンコードで検知を逃れる攻撃に対応します。Decodes Base64, zero-width characters, and Unicode tricks before scoring — so encoded evasions don't slip past.
日本語ファーストJapanese-first
日本語の入力を高品質な翻訳で正規化してから解析。英語専用モデルにありがちな取りこぼしと誤検知を抑えます。Japanese input is normalized via high-quality translation before analysis — reducing the misses and false positives typical of English-only models.
プロジェクト / API キー単位のポリシーPer-project / per-key policy
検知器ごと・PII ルールごと・WAF カテゴリごとに ON/OFF。プロジェクト既定を API キー単位で上書きできます。Toggle each detector, PII rule, and WAF category on or off — with project defaults you can override per API key.
構造化された判定結果A structured verdict
is_malicious・深刻度・発火した検知器・検知内容を JSON で返却。アプリ側で柔軟に制御できます。Returns is_malicious, severity, which detectors fired, and the findings as JSON — so your app decides what to do.
監査ログと通知Audit logs & notifications
いつ・何を検知/ブロックしたかを記録し、通知先を集約。インシデント対応や運用の見直しに使えます。Record what was detected or blocked and when, with consolidated notifications — ready for incident response and review.
仕組みをもっと詳しく知りたい方へWant the technical details?
各検知器のアーキテクチャや API、ポリシーの仕組みを、エンジニア向けに解説しています。We explain each detector, the API, and the policy model for engineers.
導入Integration
API 一本で、すぐにOne API call — that's it
-
1
API キーを発行Issue an API key
管理画面でプロジェクトと API キーを作成します。Create a project and an API key in the console. -
2
LLM 呼び出しの前に 1 リクエストOne request before the LLM
入力テキストをエンドポイントに送り、返ってきた判定で許可/ブロックを決めるだけ。Send the input to the endpoint and let the returned verdict decide allow or block. -
3
ポリシーで制御Tune with policy
検知器・PII ルール・WAF カテゴリを、プロジェクト/キー単位で設定します。Set detectors, PII rules, and WAF categories per project or key.
POST /v1/secure-llm-firewall
X-API-Key: sllmf_********
{ "text": "<ユーザー入力>" }
{
"is_malicious": true,
"overall_severity": "high",
"prompt_injection": { "is_injection": true },
"pii_detection": { "total_findings": 0 }
}
安全性Trust by design
安心して任せられる設計Built to be trusted with your data
独自データで学習しないYour prompts aren't training data
お客様のプロンプトを、当社モデルの学習には使用しません。We don't use your prompts to train our models.
ポリシーが最優先Policy is authoritative
何を検知し、何をブロックするかは、完全にお客様の制御下にあります。What gets detected and blocked is entirely under your control.
日本語を取りこぼさないDoesn't miss Japanese
多言語対応で、英語専用ツールの死角になりがちな日本語の攻撃も検知します。Multilingual coverage catches Japanese attacks that English-only tools miss.
低レイテンシLow latency
検知器は並列実行。LLM 呼び出しの前段に挟んでも、体感を損ないません。Detectors run in parallel, so sitting in front of your LLM stays snappy.
LLM アプリを、安全に。Ship LLM apps, safely.
導入のご相談・デモは、下記フォームよりお気軽にお問い合わせください。Request a demo or onboarding consultation below.