开发喵星球

Ollama发布0.2.0新版本

Ollama发布0.2.0新版本

并行请求

现在Ollama支持多种模型同时加载，还能减少内存的使用，让我们的体验大幅提升：

同时处理多个聊天会话、提供内部团队的代码补全、同时处理文档的不同部分、同时操控多个代理。

多模型

RAG：同时加载嵌入和文本完成模型，轻松高效。
代理：多个不同代理同步运行，效率倍增。
大小型模型并存，满足各种需求。
智能加载和卸载模型，根据需求和 GPU 内存，无缝切换。

使用 ollama ps 命令可以查看当前加载的模型情况：

% ollama ps
NAME                    ID              SIZE    PROCESSOR       UNTIL
gemma:2b                030ee63283b5    2.8 GB  100% GPU        4 minutes from now
all-minilm:latest       1b226e2802db    530 MB  100% GPU        4 minutes from now
llama3:latest           365c0bd3c000    6.7 GB  100% GPU        4 minutes from now

新模型

GLM-4：强大多语言模型，不输给 Llama 3。
CodeGeeX4：AI软件开发利器，包含代码补全功能。
Gemma 2：输出质量更优，基础文本生成神器。

Gemma 2更新

修复了无效令牌问题。
修复了推理输出问题。
可能需要重新下载模型：ollama pull gemma2。
Ollama显示更清晰的错误信息。

Ollama在进步，让模型管理更智能，带来更流畅的使用体验。快来体验吧！

分类：玩技术作者：荡荡, 浩浩发表于：2024-07-09 15:49:09 阅读量：236

<< 面试大揭秘：Java编程岗位的挑战与机遇 Xinference模型详解 >>

powered by kaifamiao