在2GB DAYU200上本地部署大语言模型

您好！欢迎来到国科网

通行证注册 | 登录登录登录登录

2026-06-22 05:24:47 星期一

立足国科融媒，服务先进科技

网站首页资讯中心科技人工智能

在2GB DAYU200上本地部署大语言模型

点赞

0

发布时间：2024年02月07日浏览量：325次所属栏目：人工智能发布者：田佳恬

实现思路和步骤

移植轻量级LLM模型推理框架InferLLM到OpenHarmony标准系统，编译出能在OpenHarmony运行的二进制产物。（InferLLM 是一个简单高效的 LLM CPU 推理框架，可以本地部署 LLM 中的量化模型）

使用OpenHarmony NDK来编译OpenHarmony上的InferLLM可执行文件（具体使用OpenHarmony lycium 交叉编译框架,然后编写一些脚本。然后把其存放在tpc_c_cplusplusSIG仓库。)

在DAYU200上本地部署大语言模型

编译获取InferLLM三方库编译产物

下载OpenHarmony sdk,下载地址：

http://ci.openharmony.cn/workbench/cicd/dailybuild/dailyList

下载本仓库

git clone https://gitee.com/openharmony-sig/tpc_c_cplusplus.git --depth=1

分享说明：转发分享请注明出处。

上一篇：无需RLHF显著提升GPT-4/Llama2性能，北大团队提出Aligner对齐新范式

下一篇：OccNeRF：完全无需激光雷达数据监督

热点推荐

热点图讯

2025数字军工大会在西安成功召开

最新资讯

最新图讯

2025数字军工大会在西安成功召开

相关资讯

相关图讯

最新入驻

张超²⁰²⁵

网站简介 | 联系我们 | 广告服务 | 监督电话

本网站由国科网运营维护国科网讯（北京）技术有限公司版权所有  咨询电话：010-88516927
地址：北京市海淀区阜石路甲69号院1号楼1层一单元114
ICP备案号：京ICP备15066964号-8   违法和不良信息举报电话：010-67196565
12300电信用户申诉受理中心   网络违法犯罪举报网站   中国互联网举报中心   12321网络不良与垃圾信息举报中心   12318全国文化市场举报网站
代理域名注册服务机构：阿里巴巴云计算（北京）有限公司