Skip to main content

免费模型

本文档罗列目前可用的免费大模型服务,以及它们的主要特点和限制。

OpenRouter 免费模型

可用模型

模型提供商上下文长度免费额度限制
meta-llama/Llama-3.1-8B-InstructLlama8K每天数千万 tokens需要 Cloudflare 账户
meta-llama/Meta-Llama-3.1-70B-InstructLlama8K较少需申请访问权限
google/gemini-2.0-flash-_expGoogle1M每天 1K tokens需 Google 账户
qwen/qwen-vl-plusQwen8K每天 1M tokens需屏蔽图片

限制

  1. 速率限制:每分钟最多 1-2 次请求
  2. 并发数:通常限制为 1 至 5
  3. Token 上限:每天配额有限,超出需付费
  4. 模型访问:部分模型需单独申请权限

Gemini 免费层

特性

  • 模型:Gemini 2.0 Flash、Gemini 1.5 Pro
  • 上下文:支持长上下文(最多 1M tokens)
  • 免费额度:每分钟 1K tokens,每个项目配额有限

限制

  1. 使用量限制:每天最大 1K 万 token
  2. 并发:最多 5 个并发请求
  3. 寿命:免费层账号可能回收

Groq 免费模型

可用模型

模型大小速度特点
llama-3.3-70b-versatile70B极快支持工具调用
llama-3.1-8b-instant8B极速适合简单问答
gemma2-9b-it9B快速数学推理优秀

限制

  • 每天:最多 1K 万 token
  • 并发:限制为 3
  • 速率:每分钟最多 30 次请求

使用建议

开发测试

  • 优先选择 Groq(速度最快)
  • 使用 OpenRouter 进行模型比较

生产场景

  • 评估具体需求后选择付费服务
  • 考虑 Gemini 长上下文场景
  • 参考成本与性能权衡

常见问题

Q: 免费模型是否可以商业使用?
A: 遵循每个平台的许可证条款,Llama 等开源模型可商用,Gemini 和 Groq 的免费层需确认服务条款。

Q: 如何切换免费模型?
A: 在 .env 配置文件中修改 MODEL_NAME,参考 OpenRouter 格式:openrouter/free/model-name