Complementary Shaders Java

NovNovikov/llama-cpp-turboquant-mtp

Production-grade KV-cache and weight quantization for llama.cpp, with cross-backend kernel support for Apple Silicon, NVIDIA CUDA, AMD ROCm, and Vulkan.

GitHub

Lex553/llama-cpp-turboquant-Tom

Production-grade KV-cache and weight quantization for llama.cpp, with cross-backend kernel support for Apple Silicon, NVIDIA CUDA, AMD ROCm, and Vulkan.

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

NovNovikov/llama-cpp-turboquant-mtp

Lex553/llama-cpp-turboquant-Tom

今日热点