广告国内BGP机房32G内存299元网站收录排名问题解决【超牛】搜外友链平台站长在线扒站工具【免费】【免费】站长开发工具箱【推荐】站长自动外链工具广告位联系QQ：253000106 独立服务器100M/不限/免备 2核2G服务器新用户低至68元/年虚拟资源平台,轻松变现 10000来路IP只需8元站群系统程序-专注SEO站群黑帽SEO论坛_黑帽聚集地企业HTTP代理IP服务提供商软文推广，在线获客【定制】站群服务器99元起 SEO免费工具分享外推代发包收录【国内国际】短信推广，免费测试实力产品收量外链代发 5分一条快速排名 █一解决“收录、排名”问题一█ ●●●优质搜狗泛收录域名●●● AI数字人直播系统源码百度SEO排名7-15天上首页

使用预训练权重在本地运行法学硕士有哪些选择？

PHP中文网 • 2025年2月26日 05:06:29 • 编程技术 • 阅读 2

问题内容

我有一个集群，虽然有一种可用的权重存储库，但未连接到互联网。我需要对其运行 LLM 推理。

到目前为止，我发现的唯一选择是使用 transformers 和 langchain 模块的组合，但我不想调整模型的超参数。我遇到了 ollama 软件，但我无法在集群上安装任何东西，除了 python 库之外。所以，我自然想知道，运行 LLM 推理有哪些选择？还有一些问题。

我可以只安装 ollama-python 软件包而不安装他们的 Linux 软件吗？或者我需要两者来运行我的推理吗？如果我设法在此集群上安装 ollama，如何为模型提供预训练权重？如果有帮助，它们存储在（有时多个）.bin 文件中

正确答案

您实际上不必安装 ollama。相反，您可以直接本地运行 llm，例如 mistral 模型

llm = gpt4all(    model="/home/jeff/.cache/huggingface/hub/gpt4all/mistral-7b-openorca.q4_0.gguf",    device='gpu', n_threads=8,    callbacks=callbacks, verbose=true)

登录后复制

或者对于 falcon

from transformers import AutoTokenizer, AutoModelForCausalLM, pipelineimport torchmodel_id = "tiiuae/falcon-7b-instruct"tokenizer = AutoTokenizer.from_pretrained(model_id)pipeline = pipeline(    "text-generation",    model=model_id,    tokenizer=tokenizer,    torch_dtype=torch.bfloat16,    # trust_remote_code=True,    device_map="auto",    max_new_tokens=100,    # max_length=200,)from langchain_community.llms.huggingface_pipeline import HuggingFacePipelinellm = HuggingFacePipeline(pipeline=pipeline)

登录后复制

我的笔记本电脑上安装了 16g 内存 nvidia 4090，可以支持上述 2 个型号本地运行。

以上就是使用预训练权重在本地运行法学硕士有哪些选择？的详细内容，更多请关注【创想鸟】其它相关文章！

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至253000106@qq.com举报，一经查实，本站将立刻删除。

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2212002.html

赞 (0)

0 0

关于作者

PHP中文网签约作者

253.4K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

Django项目初始化：利用命令行工具快速创建一个全新的项目

上一篇 2025年2月26日 05:06:20

python中end怎么用

下一篇 2025年2月26日 00:34:38

编程技术

Django项目初始化：利用命令行工具快速创建一个全新的项目

Django项目初始化：利用命令行工具快速创建一个全新的项目 Django是一个强大的Python Web框架，它提供了许多便捷的工具和函数，可以帮助开发者快速搭建Web应用。在开始一个新的Django项目之前，我们需要通过一些简单的步骤来…

PHP中文网
2025年2月26日
2000
编程技术

cosmosdb 的计时器触发器无法正常工作

问题内容我对我的函数应用“timertrigger”有疑问。我开发了此功能来与 telegram 机器人进行通信，以便在 api 请求后发送消息。我在本地尝试过该功能应用程序，效果很好。但是，当我尝试使用 cosmosdb 存储信息时…

PHP中文网
2025年2月26日
2000
编程技术

如何有效地打乱 itertools.combinations() 生成的元组？

问题内容我正在使用 itertools.combinations() 基于非重复元素列表生成两项元组列表。然后我将生成的列表打乱。然而，元组本身的内容是按时间顺序组织的。例如，运行以下代码： import randomimport ite…

PHP中文网
2025年2月26日
2000
编程技术

为什么使用相同的种子会得到不同的随机数？

问题内容我正在使用具有以下 mwe 的 numpy 随机数生成器： import numpy as npnp.random.seed(40)print(np.random.randint(-3, 4))rng = np.random.de…

PHP中文网
2025年2月26日
2000
编程技术

Conda使用指南：轻松升级Python版本

Conda使用指南：轻松升级Python版本，需要具体代码示例引言：在Python的开发过程中，我们经常需要升级Python版本来获取新的功能或修复已知的Bug。然而，手动升级Python版本可能会很麻烦，特别是当我们的项目和依赖包相对复…

PHP中文网
2025年2月26日
2000
编程技术

Azure 不记名令牌生命周期

问题内容我有一个 python 代码来调用图形 api 并浏览共享点上的目录。该目录有 120gb 的文件，需要数小时才能扫描。但是，我观察到该脚本仅显示为在 visual studio 代码上运行，并且没有进一步执行。我在循环中打印文件…

PHP中文网
2025年2月26日
2000
编程技术

C程序和子进程

问题内容我编写了这个简单的 c 程序来解释具有相同特征的更困难的问题。 #include int main(int argc, char *argv[]){ int n; while (1){ scanf(“%d”, &n); p…

PHP中文网
2025年2月26日
2000
编程技术

在 Python 中循环时更新列表时出错

问题内容为什么列表“spans”从未更新？我不明白为什么代码会陷入无限循环。 pdf：https://www.sil.org/system/files/reapdata/62/99/18/6299181172056625041194229…

PHP中文网
2025年2月26日
2000
编程技术

与pandas有条件合并

问题内容我有一个 pandas 数据框，如下所示，其中详细说明了对某个区域的其他调用： commsdate area day0 incremental day1 incremental day2 incremental 01/01/24s…

PHP中文网
2025年2月26日
2000
编程技术

保留数据类型的空 pandas 数据框

问题内容我想用保留的数据类型创建一个空的 df 作为模板。代码如下： import pandas as pdimport datetimefrom dataclasses import dataclass@dataclassclass o…

PHP中文网
2025年2月26日
2000

发表回复

登录后才能评论