Kimi CLI 技術深掘

この記事は、Moonshot AIのオープンソースプロジェクト Kimi CLI のアーキテクチャ設計、コア実装、革新的な機能を総合的に分析し、開発者がこの強力なAIコマンドラインツールの内部構造を深く理解するのに役立ちます。

導入 - Kimi CLIとは？
アーキテクチャ概要 - 4つのコアシステム
エージェントシステム - 柔軟な設定とロード
KimiSoulエンジン - スマート実行の中枢
ツールシステム - 拡張可能な機能ハブ
ACPプロトコル - IDE統合の架け橋
コア設計原則

導入 - Kimi CLIとは？

Kimi CLIは、Moonshot AIが開発したAI駆動型のコマンドラインインテリジェントアシスタントです。これは単なるコマンドラインのラッパーツールではなく、完全な AIネイティブ開発ツールエコシステム です。開発者を支援します：

ターミナルからファイル操作、コード解析、Web検索などの複雑なタスクを実行
自然言語での対話でソフトウェア開発ワークフローを完了
複数のLLMプロバイダーをサポート（Moonshot AI、OpenAI、Claude、Gemini）
主流のIDE（Zedなど）と深く統合

従来のコマンドラインツールとは異なり、Kimi CLIの最も大きな特徴はその エージェンティックAIアーキテクチャ です。これはAIモデル、ツールシステム、実行エンジンを有機的に結合し、自律的に計画、実行、検証できる完全なインテリジェントエージェントを形成します。

バージョン：0.58 Technical Preview 技術スタック：Python 3.13+、非同期アーキテクチャ、モジュラーデザイン

アーキテクチャ概要 - 4つのコアシステム

詳細に入る前に、まずマクロレベルでKimi CLIの全体アーキテクチャを理解しましょう。

高レベルアーキテクチャ

コアデータフロー

このアーキテクチャのコア思想は レイヤー化と分離 です：

エージェントシステム が設定と初期化を担当
KimiSoul は純粋な実行エンジン
ツールシステム がプラガブルな機能を提供
UI層 はビジネスロジックから完全に分離

この設計により、Kimi CLIは単純なコマンドライン対話から複雑なIDE統合まで、複数の使用シナリオをサポートしながらコードの明確さと保守性を維持できます。

エージェントシステム - 柔軟な設定とロード

エージェントシステムとは？

Kimi CLIでは、エージェント は完全なインテリジェントエージェント設定を意味します：

システムプロンプト
利用可能なツールリスト
サブエージェント定義
ランタイムパラメーター

エージェントを設定可能にすることで、Kimi CLIは柔軟に異なる「AIパーソナリティ」を切り替えることができます：

Coderエージェント：コード作成とリファクタリングに特化
Debugエージェント：バグトリアージと修正に特化
カスタムエージェント：ユーザー定義エージェント

設定ファイル構造

yaml

# agents/default/agent.yaml
version: 1
agent:
  name: "Kimi CLI"                    # エージェント名
  system_prompt_path: ./system.md     # システムプロンプトファイル
  system_prompt_args:                 # プロンプト引数
    ROLE_ADDITIONAL: ""
  tools:                              # 利用可能なツール
    - "kimi_cli.tools.multiagent:Task"
    - "kimi_cli.tools.todo:SetTodoList"
    - "kimi_cli.tools.shell:Shell"
    - "kimi_cli.tools.file:ReadFile"
    - "kimi_cli.tools.file:WriteFile"
    - "kimi_cli.tools.web:SearchWeb"
    - "kimi_cli.tools.web:FetchURL"
  subagents:                          # サブエージェント
    coder:
      path: ./sub.yaml
      description: "一般的なソフトウェアエンジニアリングタスクに特化"

エージェントロードフロー（シーケンスダイアグラム）

依存性注入機構

Kimi CLIのツールシステムは 自動依存性注入 を採用しており、これはエージェントシステムの最もエレガントな側面の1つです：

python

def _load_tool(tool_path: str, dependencies: dict) -> ToolType | None:
    """ツールをロードし、依存性を自動注入"""
    module_name, class_name = tool_path.rsplit(":", 1)
    module = importlib.import_module(module_name)
    cls = getattr(module, class_name)

    args = []
    for param in inspect.signature(cls).parameters.values():
        # 全ポジションパラメータを依存性として扱う
        if param.annotation in dependencies:
            args.append(dependencies[param.annotation])

    return cls(*args)  # 自動依存性注入

依存性コンテナが含むもの：

Runtime: ランタイムコンテキスト
Config: 設定情報
Approval: 承認システム
Session: セッションデータ
DenwaRenji: Dメールシステム
LaborMarket: サブエージェント管理

ツール定義例：

python

class Shell(CallableTool2[Params]):
    def __init__(self, approval: Approval, **kwargs):
        # approvalパラメータはRuntimeから自動注入される
        self._approval = approval

    async def __call__(self, params: Params) -> ToolReturnType:
        # 承認を使用してユーザー確認を要求
        if not await self._approval.request(...):
            return ToolRejectedError()

LaborMarket: サブエージェント「労働市場」

LaborMarket は、利用可能な全サブエージェントを管理する革新的な設計です：

なぜサブエージェントが必要か？

タスク分解: 複雑なタスクを専門エージェントに委任できる
コンテキスト分離: サブエージェントは独立した履歴を持ち、メインコンテキストの中断を避ける
単一責任: 各エージェントは特定のドメインに集中

KimiSoulエンジン - スマート実行の中枢

KimiSoulはシステム全体で最も重要なコンポーネントです。これはAIエージェントの「心臓部」であり、すべての推論、ツール呼び出し、コンテキスト管理を担当します。

コア責任

python

class KimiSoul(Soul):
    """The soul of Kimi CLI."""

    # 1. 実行ループを管理
    async def run(self, user_input: str):
        await self._checkpoint()
        await self._context.append_message(user_message)
        await self._agent_loop()  # メインループ

    # 2. 各推論ステップを処理
    async def _step(self) -> bool:
        result = await kosong.step(
            self._runtime.llm.chat_provider,
            self._agent.system_prompt,
            self._agent.toolset,
            self._context.history
        )
        # ツール呼び出し、結果、コンテキスト更新を処理

    # 3. コンテキストライフサイクルを管理
    async def _grow_context(self, result, tool_results):
        await self._context.append_message(result.message)
        await self._context.append_message(tool_messages)

    # 4. コンテキストを圧縮
    async def compact_context(self):
        # コンテキストが長すぎる場合に圧縮

実行ループ詳細（シーケンスダイアグラム）

チェックポイントと「タイムトラベル」機構

KimiSoulの最も革新的な設計の1つは チェックポイント機構 であり、システムが「過去に戻る」ことを可能にします。

仕組み：

python

# 1. チェックポイント作成
async def checkpoint(self, add_user_message: bool):
    """各ステップ前にチェックポイントを作成"""
    checkpoint_id = self._next_checkpoint_id
    self._next_checkpoint_id += 1

    # ディスクに書き込み
    await f.write(json.dumps({"role": "_checkpoint", "id": checkpoint_id}) + "\n")

    if add_user_message:
        await self.append_message(
            Message(role="user", content=[system(f"CHECKPOINT {checkpoint_id}")])
        )

ユースケース：Dメール

想像シナリオ：

ユーザーが尋ねる：「この関数をリファクタリングして」
AIが実行開始、ステップ3で気づく：「待てよ、まずファイルをバックアップしないと」
AIがチェックポイント1にDメールを送信
システムがチェックポイント1に戻り、今度はリファクタリングの前にバックアップ

これはSFアニメ「Steins;Gate」のDメールのように、AIが過去の自分にメッセージを送れるんです！

エラーハンドリングとリトライ

KimiSoulは堅牢なエラーハンドリングを備えています：

python

@tenacity.retry(
    retry=retry_if_exception(_is_retryable_error),
    wait=wait_exponential_jitter(initial=0.3, max=5, jitter=0.5),
    stop=stop_after_attempt(max_retries),
    reraise=True
)
async def _kosong_step_with_retry() -> StepResult:
    """LLM呼び出しを自動リトライ"""
    return await kosong.step(...)

リトライ可能なエラー：

API接続エラー
タイムアウトエラー
503サービス不可
レート制限（429）

リトライ不可能なエラー：

無効なAPIキー
サポートされていないモデル
コンテキストオーバーフロー

ツールシステム - 拡張可能な機能ハブ

ツールシステムアーキテクチャ

ツールシステムの理念は： 全てがツール、そして全てのツールはプラガブル です。

ツールカテゴリ

1. ファイル操作

python

# ファイル読み取り
ReadFile(path="/absolute/path/to/file.py", line_offset=1, n_lines=100)

# ファイル書き込み
WriteFile(path="/absolute/path", file_text="content", line_count_hint=1)

# ファイル検索
Glob(pattern="src/**/*.py")

# 内容検索
Grep(pattern="TODO|FIXME", path="/workspace", -n=true)

# 文字列置換
StrReplaceFile(path="/absolute/path", old_str="", new_str="")

セキュリティ機能：

絶対パスを指定する必要あり（パストラバーサル防止）
ファイルサイズ制限（100KB）
行数制限（1000行）
行の長さ制限（2000文字）

2. シェルコマンド

python

Shell(command="git status", timeout=60)

セキュリティ機能：

ユーザー承認が必要（yoloモードを除く）
タイムアウト制御（1-300秒）
ストリーミング出力（リアルタイムstdout/stderr）
最大タイムアウト：5分

3. Webツール

python

# Web検索
SearchWeb(query="Python 3.13 の新機能")

# URLコンテンツ取得
FetchURL(url="https://github.com/MoonshotAI/kimi-cli")

4. タスク管理

python

# ToDoリスト設定
SetTodoList(todos=[
    {"content": "コード構造の分析", "status": "completed"},
    {"content": "ユニットテストの作成", "status": "in_progress"}
])

5. サブエージェントツール

python

# タスクをサブエージェントに委任
Task(
    description="コードベース構造を分析",  # 簡潔な説明
    subagent_name="coder",                    # サブエージェント名
    prompt="src/ディレクトリ構造を詳細に分析し、各モジュールの責務を要約"
)

ツール呼び出しフロー（Shell例）

MCP (Model Context Protocol) 統合

MCPはAnthropicのオープンプロトコルで、AIモデルとツールの接続を標準化します。

python

# MCPサーバー設定
{
  "mcpServers": {
    "context7": {
      "url": "https://mcp.context7.com/mcp",
      "headers": {
        "CONTEXT7_API_KEY": "YOUR_API_KEY"
      }
    },
    "chrome-devtools": {
      "command": "npx",
      "args": ["-y", "chrome-devtools-mcp@latest"]
    }
  }
}

# 起動時にロード
kimi --mcp-config-file /path/to/mcp.json

MCP統合フロー：

MCP統合により、Kimi CLIの能力は無限に拡張可能になります。MCPプロトコルに準拠する任意のツールをシームレスに統合できます。含まれるもの：

データベースクエリツール
API呼び出しツール
ブラウザ自動化ツール
ドキュメント検索ツール

ACPプロトコル - IDE統合の架け橋

Agent Client Protocol (ACP) は、Kimi CLIの最重要な革新の1つです。LSP (Language Server Protocol) がエディタと言語サーバーの通信を標準化するように、ACPはエディタとAIエージェントの通信を標準化します。

ACPの位置づけ: エディタ ↔ エージェントのLSP

ACPコア機能：

JSON-RPC 2.0: JSON-RPC 2.0プロトコルに基づく
StdIO転送: 標準入出力経由での通信
ストリーミングイベント: リアルタイムストリーミング応答をサポート
ツール統合: 標準化されたツール呼び出し表示
承認制御: ユーザー確認メカニズム
セッション管理: ステートフルな対話

ACPプロトコルスタック

Zed統合例

設定：

json

// ~/.config/zed/settings.json
{
  "agent_servers": {
    "Kimi CLI": {
      "command": "kimi",
      "args": ["--acp"],
      "env": {}
    }
  }
}

ワークフロー：

ACPイベント変換詳細

ACPの最も複雑な部分は、Kimi CLIの内部イベントをACP標準イベントに変換することです。

内部Wireイベント → ACPプロトコルイベント：

内部イベント	ACPイベント	説明
`TextPart`	`AgentMessageChunk`	AI出力テキスト
`ThinkPart`	`AgentThoughtChunk`	AI思考プロセス
`ToolCall`	`ToolCallStart`	ツール呼び出し開始
`ToolCallPart`	`ToolCallProgress`	パラメータストリーミング更新
`ToolResult`	`ToolCallUpdate`	ツール呼び出し完了
`ApprovalRequest`	`RequestPermissionRequest`	ユーザー承認が必要

python

# 主要な変換ロジック例
async def _send_tool_call(self, tool_call: ToolCall):
    # ツール呼び出し状態を作成
    state = _ToolCallState(tool_call)
    self.run_state.tool_calls[tool_call.id] = state

    # ACPクライアントに送信
    await self.connection.sessionUpdate(
        acp.SessionNotification(
            sessionId=self.session_id,
            update=acp.schema.ToolCallStart(
                toolCallId=state.acp_tool_call_id,  # UUID
                title=state.get_title(),  # "Shell: ls -la"
                status="in_progress",
                content=[...]
            )
        )
    )

_ToolCallState: インテリジェントな状態管理

python

class _ToolCallState:
    def __init__(self, tool_call: ToolCall):
        # 一意のACPツール呼び出しIDを生成
        self.acp_tool_call_id = str(uuid.uuid4())

        # ツール呼び出し引数を解析
        self.tool_call = tool_call
        self.args = tool_call.function.arguments or ""
        self.lexer = streamingjson.Lexer()

    def get_title(self) -> str:
        """タイトルを動的に生成"""
        tool_name = self.tool_call.function.name
        subtitle = extract_key_argument(self.lexer, tool_name)
        # 例: "Shell: git status" または "ReadFile: src/main.py"
        return f"{tool_name}: {subtitle}"

ACP承認フロー

この承認メカニズムは細粒度の制御を提供し、AIがユーザー認可のない危険な操作を実行しないことを保証します。

コア設計原則

Kimi CLIのソースコードを徹底的に分析した結果、以下のコア設計原則をまとめました：

1. レイヤー化と分離

レイヤー化の利点：

テスタビリティ: 各層を個別にテスト可能
拡張性: UIモードの追加/削除がコアロジックに影響しない
保守性: 明確な責任範囲

2. 依存性注入と自動配線

python

# ツールはタイプアノテーションで依存性を宣言
class ReadFile(CallableTool2[Params]):
    def __init__(self, builtin_args: BuiltinSystemPromptArgs):
        self._work_dir = builtin_args.KIMI_WORK_DIR

# エージェントシステムが依存性を自動的に発見・注入
def _load_tool(tool_path: str, dependencies: dict):
    for param in inspect.signature(cls).parameters.values():
        if param.annotation in dependencies:
            args.append(dependencies[param.annotation])
    return cls(*args)

利点：

ボイラープレートコード削減
テスタビリティ向上（モックしやすい）
柔軟なツール構成

3. タイムトラベル（チェックポイント）

python

# 各ステップ前にチェックポイント作成
await self._checkpoint()  # checkpoint_id: 0
# ... 実行 ...
await self._checkpoint()  # checkpoint_id: 1
# ... 問題を発見 ...
# 過去にDメール
await self._context.revert_to(1)

革新性：

セーフティネットを提供
「元に戻す」を実現
サブエージェントタスク管理をサポート

4. Wire通信抽象化

python

def wire_send(msg: WireMessage) -> None:
    """SoulとUIを分離"""
    wire = get_wire_or_none()
    wire.soul_side.send(msg)

# Shell UIが直接処理
msg = await wire.ui_side.receive()

# ACP UIが変換後にエディタに送信
await connection.sessionUpdate(convert_to_acp(msg))

利点：

SoulはUIタイプを気にしない
複数のUI実装をサポート
イベント駆動アーキテクチャ

5. ACP: AI時代のLSP

ACPはエディタ-AI通信を標準化します。LSPがエディタ-言語サーバー通信を標準化したのと同様です。

コアバリュー：

エコシステム相互運用性: どのACPエディタでもKimi CLIを使用可能
ストリーミング体験: AI思考プロセスのリアルタイム表示
セキュリティ制御: ユーザー承認メカニズム
ツールビジュアライゼーション: 構造化されたツール呼び出し表示

6. LLMプロバイダー抽象化

複数のLLMプロバイダーをサポート：

python

def create_llm(provider, model):
    match provider.type:
        case "kimi":
            return Kimi(model, base_url, api_key)
        case "openai_responses":
            return OpenAIResponses(model, base_url, api_key)
        case "anthropic":
            return Anthropic(model, base_url, api_key)
        case "google_genai":
            return GoogleGenAI(model, base_url, api_key)

利点：

ベンダーロックインを避ける
柔軟なモデル切り替え
セルフホストモデルをサポート

ユースケース分析

最も適している：

ターミナル開発ワークフロー

bash

kimi
> このエラーログを分析し、根本原因を特定して
> テストを実行し、失敗したケースを修正
> このコードのパフォーマンスを最適化

IDEインテリジェントアシスタント

json

// Zed設定後
{
  "agent_servers": {
    "Kimi CLI": {
      "command": "kimi",
      "args": ["--acp"]
    }
  }
}

バッチ自動化

bash

kimi --print -c "全Pythonファイルをレビューし、PEP8違反を修正"

マルチツール協調: AIは複数のツール（ファイル操作、Shell、検索、承認、取り消し）を持ち、複雑なタスクを自動計画

あまり適していない：

単純なQ&A: 直接ChatGPT Webインターフェースの方が便利
非対話型: 単純なgrep/lsコマンドは従来のツールの方が速い
超高性能: Python非同期にオーバーヘッドがある

セキュリティ設計

パス制限
- ファイル操作は絶対パスを使用する必要あり
- パストラバーサル攻撃を防ぐ
承認メカニズム
- Shellコマンドには承認が必要
- ファイル変更には承認が必要
- yoloモードをサポート（スクリプトシナリオ用）
タイムアウト制御
- Shellコマンド最大5分タイムアウト
- 長時間ハングを防ぐ
コンテキスト制限
- コンテキスト上限に近づくと自動圧縮
- トークン浪費を防ぐ

結論

Kimi CLIは、Moonshot AIの優れたツール以上の存在です。これはアーキテクチャがエレガントで、設計が革新的なAIネイティブアプリケーションの優れた例です。

Kimi CLIを学ぶことで、以下が理解できます：

AIアプリケーションはレイヤー化すべき: 設定層、実行層、ツール層、UI層を明確に分離
依存性注入は柔軟性の鍵: 自動配線ツールは容易に拡張可能
チェックポイントはタイムトラベルの魔術: 安全網を提供し、複雑なタスクをサポート
標準化プロトコルはエコシステムの基盤: ACPがエディタ-AI通信を可能に

リソース:

Kimi CLIは、次世代開発ツールの未来を表しています：単なるツールではなく、理解し、計画し、実行できるインテリジェントなパートナーです。

著者: Claude Code + Kimi K2 Thinking

Kimi CLI 技術深掘 ​

目次 ​

導入 - Kimi CLIとは？ ​

アーキテクチャ概要 - 4つのコアシステム ​

高レベルアーキテクチャ ​

コアデータフロー ​

エージェントシステム - 柔軟な設定とロード ​

エージェントシステムとは？ ​

設定ファイル構造 ​

エージェントロードフロー（シーケンスダイアグラム） ​

依存性注入機構 ​

LaborMarket: サブエージェント「労働市場」 ​

KimiSoulエンジン - スマート実行の中枢 ​

コア責任 ​

実行ループ詳細（シーケンスダイアグラム） ​

チェックポイントと「タイムトラベル」機構 ​

エラーハンドリングとリトライ ​

ツールシステム - 拡張可能な機能ハブ ​

ツールシステムアーキテクチャ ​

ツールカテゴリ ​

1. ファイル操作 ​

2. シェルコマンド ​

3. Webツール ​

4. タスク管理 ​

5. サブエージェントツール ​

ツール呼び出しフロー（Shell例） ​

MCP (Model Context Protocol) 統合 ​

ACPプロトコル - IDE統合の架け橋 ​

ACPの位置づけ: エディタ ↔ エージェントのLSP ​

ACPプロトコルスタック ​

Zed統合例 ​

ACPイベント変換詳細 ​

ACP承認フロー ​

コア設計原則 ​

1. レイヤー化と分離 ​

2. 依存性注入と自動配線 ​

3. タイムトラベル（チェックポイント） ​

4. Wire通信抽象化 ​

5. ACP: AI時代のLSP ​

6. LLMプロバイダー抽象化 ​

ユースケース分析 ​

セキュリティ設計 ​

結論 ​

Kimi CLI 技術深掘

目次

導入 - Kimi CLIとは？

アーキテクチャ概要 - 4つのコアシステム

高レベルアーキテクチャ

コアデータフロー

エージェントシステム - 柔軟な設定とロード

エージェントシステムとは？

設定ファイル構造

エージェントロードフロー（シーケンスダイアグラム）

依存性注入機構

LaborMarket: サブエージェント「労働市場」

KimiSoulエンジン - スマート実行の中枢

コア責任

実行ループ詳細（シーケンスダイアグラム）

チェックポイントと「タイムトラベル」機構

エラーハンドリングとリトライ

ツールシステム - 拡張可能な機能ハブ

ツールシステムアーキテクチャ

ツールカテゴリ

1. ファイル操作

2. シェルコマンド

3. Webツール

4. タスク管理

5. サブエージェントツール

ツール呼び出しフロー（Shell例）

MCP (Model Context Protocol) 統合

ACPプロトコル - IDE統合の架け橋

ACPの位置づけ: エディタ ↔ エージェントのLSP

ACPプロトコルスタック

Zed統合例

ACPイベント変換詳細

ACP承認フロー

コア設計原則

1. レイヤー化と分離

2. 依存性注入と自動配線

3. タイムトラベル（チェックポイント）

4. Wire通信抽象化

5. ACP: AI時代のLSP

6. LLMプロバイダー抽象化

ユースケース分析

セキュリティ設計

結論