支持CUDA的ubuntu版本llama.cpp编译教程-尧图网络科技

首先确保linux系统已安装过cuda，输入如下命令验证：

nvcc --version

以我的编译环境为例，输入结果如下：

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2025 NVIDIA Corporation
Built on Fri_Feb_21_20:23:50_PST_2025
Cuda compilation tools, release 12.8, V12.8.93
Build cuda_12.8.r12.8/compiler.35583870_0

可以看出当前的cuda版本为12.8。接下来拉取 llama.cpp 源码：

git clone https://github.com/ggerganov/llama.cpp
cd llama.cpp

然后在仓库路径下创建一个 build 文件夹用于盛放编译结果：

mkdir build && cd build

之后输入如下命令配置 cmake ：

cmake .. -DGGML_CUDA=ON -DCMAKE_CUDA_COMPILER=/usr/local/cuda/bin/nvcc

开始编译：

cmake --build . --config Release -j $(nproc)

编译完成后，可执行文件会生成在 build/bin/ 目录下。接下来可以将编译结果打包：

tar -czvf llama-bin-linux-cuda-12.8-x86_64.tar -C bin .

资讯详情

相关新闻