feat: tiered LLM providers (fast/heavy) with multi-provider config

Adds tier-based LLM routing so fast local models (vLLM, Ollama) handle structured tasks while cloud models (Gemini, Anthropic) are reserved for heavy reasoning. Single-provider configs continue to work via fallback. - Tier type + ProviderRegistry with assignTier/getProvider/fallback chain - Multi-provider config format: { providers: [{ name, type, tier, ... }] } - NamedProvider wrapper for multiple instances of same provider type - Setup wizard: Simple (legacy) / Advanced (fast+heavy tiers) modes - Status display: tiered view with /llm/providers endpoint - Call sites use getProvider('fast') instead of getActive() - Full backward compatibility with existing single-provider configs Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-02-25 02:16:08 +00:00
parent 0824f8e635
commit 9ce705608b
17 changed files with 834 additions and 285 deletions
--- a/src/cli/tests/commands/config-setup.test.ts
+++ b/src/cli/tests/commands/config-setup.test.ts
@@ -67,7 +67,7 @@ async function runSetup(deps: ConfigSetupDeps): Promise<void> {
 describe('config setup wizard', () => {
  describe('provider: none', () => {
    it('disables LLM and saves config', async () => {
-      const deps = buildDeps({ answers: ['none'] });
+      const deps = buildDeps({ answers: ['simple', 'none'] });
      await runSetup(deps);

      const config = readConfig();
@@ -81,7 +81,7 @@ describe('config setup wizard', () => {
    it('auto-detects binary path and saves config', async () => {
      // Answers: select provider, select model (no binary prompt — auto-detected)
      const deps = buildDeps({
-        answers: ['gemini-cli', 'gemini-2.5-flash'],
+        answers: ['simple', 'gemini-cli', 'gemini-2.5-flash'],
        whichBinary: vi.fn(async () => '/home/user/.npm-global/bin/gemini'),
      });
      await runSetup(deps);
@@ -98,7 +98,7 @@ describe('config setup wizard', () => {
    it('prompts for manual path when binary not found', async () => {
      // Answers: select provider, select model, enter manual path
      const deps = buildDeps({
-        answers: ['gemini-cli', 'gemini-2.5-flash', '/opt/gemini'],
+        answers: ['simple', 'gemini-cli', 'gemini-2.5-flash', '/opt/gemini'],
        whichBinary: vi.fn(async () => null),
      });
      await runSetup(deps);
@@ -113,7 +113,7 @@ describe('config setup wizard', () => {
    it('saves gemini-cli with custom model', async () => {
      // Answers: select provider, select custom, enter model name
      const deps = buildDeps({
-        answers: ['gemini-cli', '__custom__', 'gemini-3.0-flash'],
+        answers: ['simple', 'gemini-cli', '__custom__', 'gemini-3.0-flash'],
        whichBinary: vi.fn(async () => '/usr/bin/gemini'),
      });
      await runSetup(deps);
@@ -130,7 +130,7 @@ describe('config setup wizard', () => {
      const fetchModels = vi.fn(async () => ['llama3.2', 'codellama', 'mistral']);
      // Answers: select provider, enter URL, select model
      const deps = buildDeps({
-        answers: ['ollama', 'http://localhost:11434', 'codellama'],
+        answers: ['simple', 'ollama', 'http://localhost:11434', 'codellama'],
        fetchModels,
      });
      await runSetup(deps);
@@ -148,7 +148,7 @@ describe('config setup wizard', () => {
      const fetchModels = vi.fn(async () => []);
      // Answers: select provider, enter URL, enter model manually
      const deps = buildDeps({
-        answers: ['ollama', 'http://localhost:11434', 'llama3.2'],
+        answers: ['simple', 'ollama', 'http://localhost:11434', 'llama3.2'],
        fetchModels,
      });
      await runSetup(deps);
@@ -163,7 +163,7 @@ describe('config setup wizard', () => {
    it('prompts for API key and saves to secret store', async () => {
      // Answers: select provider, enter API key, select model
      const deps = buildDeps({
-        answers: ['anthropic', 'sk-ant-new-key', 'claude-haiku-3-5-20241022'],
+        answers: ['simple', 'anthropic', 'sk-ant-new-key', 'claude-haiku-3-5-20241022'],
      });
      await runSetup(deps);

@@ -181,7 +181,7 @@ describe('config setup wizard', () => {
      // Answers: select provider, confirm change=false, select model
      const deps = buildDeps({
        secrets: { 'anthropic-api-key': 'sk-ant-existing-key-1234' },
-        answers: ['anthropic', false, 'claude-sonnet-4-20250514'],
+        answers: ['simple', 'anthropic', false, 'claude-sonnet-4-20250514'],
      });
      await runSetup(deps);

@@ -196,7 +196,7 @@ describe('config setup wizard', () => {
      // Answers: select provider, confirm change=true, enter new key, select model
      const deps = buildDeps({
        secrets: { 'anthropic-api-key': 'sk-ant-old' },
-        answers: ['anthropic', true, 'sk-ant-new', 'claude-haiku-3-5-20241022'],
+        answers: ['simple', 'anthropic', true, 'sk-ant-new', 'claude-haiku-3-5-20241022'],
      });
      await runSetup(deps);

@@ -210,7 +210,7 @@ describe('config setup wizard', () => {
      const fetchModels = vi.fn(async () => ['my-model', 'llama-70b']);
      // Answers: select provider, enter URL, select model
      const deps = buildDeps({
-        answers: ['vllm', 'http://gpu:8000', 'llama-70b'],
+        answers: ['simple', 'vllm', 'http://gpu:8000', 'llama-70b'],
        fetchModels,
      });
      await runSetup(deps);
@@ -229,7 +229,7 @@ describe('config setup wizard', () => {
    it('prompts for key, model, and optional custom endpoint', async () => {
      // Answers: select provider, enter key, enter model, confirm custom URL=true, enter URL
      const deps = buildDeps({
-        answers: ['openai', 'sk-openai-key', 'gpt-4o', true, 'https://custom.api.com'],
+        answers: ['simple', 'openai', 'sk-openai-key', 'gpt-4o', true, 'https://custom.api.com'],
      });
      await runSetup(deps);

@@ -245,7 +245,7 @@ describe('config setup wizard', () => {
    it('skips custom URL when not requested', async () => {
      // Answers: select provider, enter key, enter model, confirm custom URL=false
      const deps = buildDeps({
-        answers: ['openai', 'sk-openai-key', 'gpt-4o-mini', false],
+        answers: ['simple', 'openai', 'sk-openai-key', 'gpt-4o-mini', false],
      });
      await runSetup(deps);

@@ -260,7 +260,7 @@ describe('config setup wizard', () => {
    it('prompts for key and model', async () => {
      // Answers: select provider, enter key, select model
      const deps = buildDeps({
-        answers: ['deepseek', 'sk-ds-key', 'deepseek-chat'],
+        answers: ['simple', 'deepseek', 'sk-ds-key', 'deepseek-chat'],
      });
      await runSetup(deps);

@@ -275,7 +275,7 @@ describe('config setup wizard', () => {

  describe('output messages', () => {
    it('shows restart instruction', async () => {
-      const deps = buildDeps({ answers: ['gemini-cli', 'gemini-2.5-flash'] });
+      const deps = buildDeps({ answers: ['simple', 'gemini-cli', 'gemini-2.5-flash'] });
      await runSetup(deps);

      expect(logs.some((l) => l.includes('systemctl --user restart mcplocal'))).toBe(true);
@@ -283,7 +283,7 @@ describe('config setup wizard', () => {
    });

    it('shows configured provider and model', async () => {
-      const deps = buildDeps({ answers: ['gemini-cli', 'gemini-2.5-flash'] });
+      const deps = buildDeps({ answers: ['simple', 'gemini-cli', 'gemini-2.5-flash'] });
      await runSetup(deps);

      expect(logs.some((l) => l.includes('gemini-cli') && l.includes('gemini-2.5-flash'))).toBe(true);
--- a/src/cli/tests/commands/status.test.ts
+++ b/src/cli/tests/commands/status.test.ts
@@ -26,6 +26,7 @@ function baseDeps(overrides?: Partial<StatusCommandDeps>): Partial<StatusCommand
    log,
    write,
    checkHealth: async () => true,
+    fetchProviders: async () => null,
    isTTY: false,
    ...overrides,
  };