AIWords 3901Read time10 min

OpenRouter 免费模型白嫖指南:文本、编程与 Agent 模型推荐

根据 OpenRouter 2026 年 5 月免费模型合集,重新整理适合文本处理、编程、Agent 工作流和长上下文实验的免费模型,并说明免费额度、限流与使用策略。

OpenRouter 免费模型白嫖指南:文本、编程与 Agent 模型推荐

OpenRouter 的免费模型更新非常快。之前一些热门免费模型可能突然下架、换 provider、限流,或者不再出现在免费模型榜单里。尤其是之前很多人关注的 1T 级别免费模型,现在已经不适合作为主推对象。

所以这篇文章不再写成“某一个模型永远最强”,而是按用途整理:文本处理、编程、Agent 工作流、长上下文实验分别选不同模型。

OpenRouter 免费模型页面:https://openrouter.ai/models?q=free

OpenRouter 免费模型合集:https://openrouter.ai/collections/free-models

OpenRouter 官方免费模型合集页面显示,当前排名是基于 2026 年 5 月真实使用数据更新的。官方也说明,免费模型主要用于实验、学习和低成本尝试,未来是否继续提供并不能保证。因此,免费模型适合学习、测试、个人项目和轻量工作流,不适合完全当作长期生产主力。

官方说明:OpenRouter Free ModelsOpenRouter Free Models RouterOpenRouter API Rate LimitsOpenRouter Pricing

一、先说结论:现在免费模型应该怎么选?

如果你只是想快速白嫖,可以先记住这个组合:

txt 文本处理:GLM 4.5 Air / Gemma 4 31B / gpt-oss-120b 编程任务:Poolside Laguna M.1 / gpt-oss-120b / DeepSeek V4 Flash Agent 工作流:Owl Alpha / Nemotron 3 Super / MiniMax M2.5 复杂审查:Nemotron 3 Super / gpt-oss-120b / Trinity Large Thinking 长上下文实验:Owl Alpha / Nemotron 3 Super / DeepSeek V4 Flash 通用备用:openrouter/free

我的建议是:不要只押一个免费模型。免费模型的核心玩法是“多模型分工 + fallback”。写文章用文本模型,写代码用 coding 模型,做 Agent 用支持工具调用和长上下文的模型。这样比死守一个模型更稳。

二、当前值得优先关注的免费模型

根据 OpenRouter 当前免费模型合集,下面这些模型值得重点测试:

优先级模型 ID适合用途简评
Sopenrouter/owl-alphaAgent、长上下文、自动化工作流当前免费榜头部模型,1M 上下文,适合 Claude Code / OpenClaw 这类生产力工具实验
Snvidia/nemotron-3-super-120b-a12b:free复杂推理、代码审查、多 Agent120B MoE,1M 上下文,适合复杂规划、长文档分析和跨文档推理
S-poolside/laguna-m.1:free编程、Coding Agent面向复杂软件工程任务,支持 tool calling 和 reasoning,适合代码生成和工具调用
A+openai/gpt-oss-120b:free推理、工具调用、结构化输出OpenAI 开源权重 MoE 模型,适合通用推理、Agent 实验和代码审查
A+deepseek/deepseek-v4-flash:free长上下文、代码、Agent1M 上下文,适合快速响应、长上下文任务和 coding assistant
Az-ai/glm-4.5-air:free中文、通用问答、轻量 Agent中文体验较好,支持 thinking / non-thinking 模式,适合作为文本和轻量推理备用
Aminimax/minimax-m2.5:free办公自动化、Agent、代码面向真实生产力任务,适合 Word、Excel、PPT、代码和多软件工作流理解
A-poolside/laguna-xs-2:free轻量编程、Coding AgentLaguna M.1 的轻量替代,适合作为代码 fallback
A-arcee-ai/trinity-large-thinking:free推理、Agent、复杂审查开源 reasoning 模型,适合保留 reasoning 的 Agent 工作流实验
B+baidu/cobuddy:free代码生成、AI Agent百度代码模型,支持 tool calling 和 reasoning,适合轻量代码和中文代码解释
B+openai/gpt-oss-20b:free轻量推理、结构化输出比 120B 更轻,适合低延迟和普通结构化任务
Bnvidia/nemotron-3-nano-30b-a3b:free轻量 Agent、私有化研究轻量 MoE,适合测试 specialized agentic AI systems
Bopenrouter/free临时测试免费路由自动选择免费模型,方便但不稳定,不适合正式调试

注意:免费模型列表会变化。你真正使用前,最好先打开模型页面确认它是否仍然免费、是否支持工具调用、上下文长度是多少、是否有 provider 限流。

三、文本处理免费模型推荐

文本处理包括中文文章润色、摘要、翻译、长文档整理、知识库整理、邮件写作、说明文改写等。

文本模型优先级

优先级模型 ID适合用途简评
Sz-ai/glm-4.5-air:free中文问答、文章润色、轻量推理中文体验较好,适合作为日常文本主力
S-google/gemma-4-31b-it:free多语言文本、文档理解、普通写作稳定通用,适合普通文本处理和多语言任务
A+openai/gpt-oss-120b:free结构化改写、复杂总结、观点梳理推理能力强,适合复杂文本审查和逻辑重构
Anvidia/nemotron-3-super-120b-a12b:free长文档、复杂文本分析适合大段内容分析,但未必适合高频轻量润色
A-deepseek/deepseek-v4-flash:free长上下文整理、快速摘要适合需要塞长内容、日志或资料的场景
B+openrouter/free临时聊天、快速测试方便,但路由不固定

文本处理首选组合

如果你只是写博客、改文章、做摘要,不一定要上来就用最大模型。普通中文文章可以先试 z-ai/glm-4.5-air:freegoogle/gemma-4-31b-it:free。如果要做复杂观点审查、长文章重构、逻辑分析,再切到 openai/gpt-oss-120b:freenvidia/nemotron-3-super-120b-a12b:free

四、编程免费模型推荐

编程任务包括写 Python、解释报错、修改 bug、生成脚本、阅读代码仓库、做代码审查、辅助开发 AI Agent 等。

编程模型优先级

优先级模型 ID适合用途简评
Spoolside/laguna-m.1:freeCoding Agent、复杂软件工程面向复杂软件工程任务,适合代码生成、工具调用和 agentic coding workflows
S-openai/gpt-oss-120b:free代码推理、结构化输出、工具调用适合代码解释、代码审查和 Agent 实验
A+deepseek/deepseek-v4-flash:free长上下文代码、快速修复适合长代码、快速响应和 coding assistant
Apoolside/laguna-xs-2:free轻量代码、低成本 Agent适合替代 M.1 做 fallback
Abaidu/cobuddy:free代码生成、中文代码解释适合轻量代码任务,尤其是中文解释和工具调用实验
A-minimax/minimax-m2.5:free工程任务、办公自动化、Agent适合真实生产力场景,不只局限代码
B+nvidia/nemotron-3-super-120b-a12b:free代码审查、架构分析适合高级参谋,不建议直接无监督大规模改仓库

编程首选组合

如果你在做类似 Claude Code、Cline、Roo Code、OpenCode 这类工具调用项目,不要只看模型聊天能力。更重要的是看下面几点:

1. 是否支持 tool calling; 2. 是否能稳定输出结构化格式; 3. 是否能理解长上下文; 4. 是否能按步骤执行任务; 5. 是否容易胡乱改文件。

我的排序是:poolside/laguna-m.1:free 负责代码生成,openai/gpt-oss-120b:free 负责推理和结构化输出,nvidia/nemotron-3-super-120b-a12b:free 负责复杂审查和架构判断。

五、Agent / 工具调用免费模型推荐

Agent 模型不是简单聊天模型。它要能读任务、拆步骤、调用工具、看工具结果、继续推理,并且尽量不要乱输出格式。

Agent 模型优先级

优先级模型 ID适合用途简评
Sopenrouter/owl-alphaAgent、长上下文、自动化工作流当前免费榜头部模型,适合 Claude Code / OpenClaw 等工具实验
Snvidia/nemotron-3-super-120b-a12b:free多 Agent、复杂规划、长上下文1M 上下文,适合长期任务规划、跨文档推理和多步任务
S-minimax/minimax-m2.5:free办公自动化、Agent、多软件工作流面向真实生产力环境,适合办公 Agent 思路
A+openai/gpt-oss-120b:free工具调用、结构化输出、推理适合 Agent 框架测试
A+poolside/laguna-m.1:freeCoding Agent适合代码类 Agent
Adeepseek/deepseek-v4-flash:free长上下文 Agent、快速响应适合高吞吐和长上下文任务
A-arcee-ai/trinity-large-thinking:freereasoning Agent、复杂任务适合保留 reasoning 的 Agent 工作流实验
B+z-ai/glm-4.5-air:free轻量 Agent、中文任务适合通用备用
Bopenrouter/free临时免费路由方便但不可控,不适合正式调试

OpenRouter 还有一个特殊模型路由:openrouter/free

它会自动从免费模型中选择可用模型,适合临时聊天和快速测试。但如果你正在写自己的 Agent 框架,不建议长期使用 openrouter/free,因为每次实际路由到的模型可能不同,行为不稳定,调试会很痛苦。

六、重点模型简评

1. openrouter/owl-alpha

模型页面:OpenRouter Owl Alpha

Owl Alpha 是当前 OpenRouter 免费模型榜中非常值得关注的模型。OpenRouter 对它的介绍强调 agentic workloads、tool use、long-context tasks、code generation、automated workflows 和 complex instruction execution,并且标注它兼容 Claude Code、OpenClaw 等生产力工具。

我的定位:

txt 适合:Agent、长上下文、自动化工作流、Claude Code-like 工具实验 不适合:对稳定性要求极高的生产环境

它很适合拿来测试 AgentLab、Claude Code-like CLI、多步任务规划。但它带有 alpha 属性,实际稳定性和输出风格需要自己测试。

2. nvidia/nemotron-3-super-120b-a12b:free

模型页面:NVIDIA Nemotron 3 Super 120B A12B Free

NVIDIA Nemotron 3 Super 是 120B 参数 MoE 模型,每次激活约 12B 参数。OpenRouter 当前介绍它支持 1M token context,面向 long-term agent coherence、cross-document reasoning 和 multi-step task planning。

我的定位:

txt 适合:复杂推理、长文档分析、代码审查、Agent 规划 不适合:完全无监督自动接管项目

它适合当“高级参谋”:审查代码、解释架构、规划任务、分析长文本。但如果直接接入自动写代码工具,最好先小范围测试,避免误改文件或输出格式不稳定。

3. poolside/laguna-m.1:free

模型页面:Poolside Laguna M.1 Free

Laguna M.1 是 Poolside 的 coding agent 模型,OpenRouter 页面介绍它面向 complex software engineering tasks,支持 tool calling 和 reasoning,适合 agentic coding workflows。

我的定位:

txt 适合:代码生成、代码解释、Coding Agent、工具调用 不适合:中文长文润色,不如通用文本模型自然

如果你只想选一个免费代码模型,优先试它。

4. openai/gpt-oss-120b:free

模型页面:OpenAI gpt-oss-120b Free

gpt-oss-120b 是 OpenAI 的开源权重 MoE 模型。OpenRouter 页面介绍它适合 high-reasoning、agentic 和 general-purpose use cases,并支持 native tool use、function calling、browsing 和 structured output generation。

我的定位:

txt 适合:复杂推理、结构化输出、工具调用、代码审查 不适合:无脑替代所有付费模型

它适合作为 Agent 框架里的“推理层”或“审查层”。如果你做的是工具调用实验,它比普通聊天模型更值得测。

5. deepseek/deepseek-v4-flash:free

模型页面:DeepSeek V4 Flash Free

DeepSeek V4 Flash 是效率优化的 MoE 模型。OpenRouter 当前页面介绍它支持 1M-token context window,适合 coding assistants、chat systems 和 agent workflows。

我的定位:

txt 适合:长上下文、快速响应、代码助手、Agent workflow 不适合:需要极强审美表达的中文写作

它的重点是长上下文和效率。如果你要塞很多文件、很多日志、很多项目说明,它值得测试。

6. minimax/minimax-m2.5:free

模型页面:MiniMax M2.5 Free

MiniMax M2.5 面向 real-world productivity。OpenRouter 页面提到它覆盖 Word、Excel、PowerPoint 等办公软件环境,也强调 coding expertise 和 planning。

我的定位:

txt 适合:办公自动化、文档处理、表格任务、生产力 Agent 不适合:只做闲聊时浪费额度

如果你研究的是“AI 如何帮我处理实际办公任务”,这个模型值得单独测试。

7. arcee-ai/trinity-large-thinking:free

模型页面:Arcee AI Trinity Large Thinking Free

Trinity Large Thinking 是 Arcee AI 的开源 reasoning 模型。OpenRouter 页面强调它适合 agentic workloads 和 reasoning tasks,并提示这类模型最好保留 reasoning 过程。

我的定位:

txt 适合:复杂推理、Agent 任务拆解、审查类任务 不适合:低延迟闲聊和普通短文本润色

它可以作为 gpt-oss-120b:freenvidia/nemotron-3-super-120b-a12b:free 之外的 reasoning 备用。

七、我的最终白嫖优先级

综合白嫖榜

排名模型 ID主要用途推荐理由
1openrouter/owl-alphaAgent、长上下文当前免费榜头部,1M 上下文,适合自动化工作流实验
2poolside/laguna-m.1:free编程、Coding Agent代码任务优先测试
3nvidia/nemotron-3-super-120b-a12b:free复杂推理、代码审查1M 上下文,适合复杂分析和跨文档推理
4openai/gpt-oss-120b:free推理、工具调用适合结构化输出和 Agent 测试
5deepseek/deepseek-v4-flash:free长上下文、快速响应1M 上下文,适合长任务
6minimax/minimax-m2.5:free办公 Agent、生产力任务适合文档、表格、PPT 类工作流
7z-ai/glm-4.5-air:free中文通用、轻量推理中文备用模型,适合文章润色和普通问答
8google/gemma-4-31b-it:free文本、多语言、文档理解日常文本处理备用
9arcee-ai/trinity-large-thinking:freereasoning、Agent 审查复杂推理备用
10baidu/cobuddy:free轻量代码、中文代码解释代码备用
11openrouter/free临时测试自动路由方便,但不稳定

如果你只想记住 5 个

八、推荐配置方式

如果你要把这些模型接入自己的项目,可以按用途配置:

env TEXT_MODEL=z-ai/glm-4.5-air:free CODING_MODEL=poolside/laguna-m.1:free AGENT_MODEL=openrouter/owl-alpha REVIEW_MODEL=nvidia/nemotron-3-super-120b-a12b:free REASONING_MODEL=openai/gpt-oss-120b:free LONG_CONTEXT_MODEL=deepseek/deepseek-v4-flash:free FALLBACK_MODEL=openrouter/free

如果你在做 AI Agent,可以设置一个简单的 fallback 策略:

txt 第一步:用 Owl Alpha 做任务规划和长上下文 Agent 测试 第二步:用 Laguna M.1 写代码 第三步:用 gpt-oss-120b 做结构化推理和工具调用 第四步:用 Nemotron 3 Super 做代码审查和架构判断 第五步:如果限流,切换到 DeepSeek V4 Flash、GLM 4.5 Air 或 openrouter/free

这样比只依赖一个免费模型更稳。

九、白嫖注意事项

1. 免费模型变化很快

这篇文章已经删掉了之前的 1T 模型主推内容,因为它不再适合作为当前免费模型推荐核心。免费模型列表会变,写配置时不要迷信旧文章。

2. 不要把免费模型当生产主力

免费模型可能随时改变价格、限流、provider 或可用性。个人学习没问题,正式产品要准备付费 fallback。

3. 不要在免费模型里放敏感信息

免费模型适合公开资料、学习项目、普通文章和非敏感代码。涉及隐私、客户资料、商业机密时,不要随便丢给免费模型。

4. 不要只看参数大小

大模型不一定适合你的任务。写文章看中文表达,写代码看代码能力,做 Agent 看工具调用稳定性。

5. 不要迷信 openrouter/free

openrouter/free 很方便,但模型路由不固定。做正式项目时,最好固定具体模型 ID。

6. 免费额度要省着用

免费用户每日请求数有限,失败请求也可能消耗额度。测试 Agent 时尤其容易一轮任务就调用很多次,所以最好加缓存、限制最大轮数、设置 fallback。

十、总结

OpenRouter 免费模型的价值很高,尤其适合学生、独立开发者、AI Agent 学习者和个人网站作者。

我的最终建议是:

免费模型的核心玩法不是“找一个最强模型用到底”,而是根据任务分工:文本用文本模型,代码用代码模型,Agent 用推理和工具调用更强的模型。这样才能真正把免费额度用出价值。

参考链接

评论

Share

分享这篇文章