FunctionGemma 是 Google 最小的函数调用专用模型——2.7 亿个参数,288 MB,解码速度约为 126 tok/s。没错,它需要微调(准确率从 58% 提升到 85%),没错,它使用了一种奇怪的自定义格式,而不是 JSON。但它适用于任何手机,响应速度极快,而且确实有效。现在就可以构建带有离线 AI 代理的应用——体积小、速度快、可靠性高,足以满足生产环境的需求。无需等待模型体积更小、设备速度更快的“神奇未来”,未来已来!
"It definitely is the most desperate I've ever felt," she said. "I do worry that this is the new normal."
,推荐阅读im钱包官方下载获取更多信息
Prompt 版本化(像代码一样管理)
BBC sorry for airing racial slur shouted by guest with Tourette's at Baftas