现在Ollama支持多种模型同时加载,还能减少内存的使用,让我们的体验大幅提升:
同时处理多个聊天会话、提供内部团队的代码补全、同时处理文档的不同部分、同时操控多个代理。
使用 ollama ps
命令可以查看当前加载的模型情况:
% ollama ps
NAME ID SIZE PROCESSOR UNTIL
gemma:2b 030ee63283b5 2.8 GB 100% GPU 4 minutes from now
all-minilm:latest 1b226e2802db 530 MB 100% GPU 4 minutes from now
llama3:latest 365c0bd3c000 6.7 GB 100% GPU 4 minutes from now
Ollama在进步,让模型管理更智能,带来更流畅的使用体验。快来体验吧!
powered by kaifamiao