NeurIPS 官方推荐的开源大模型启动套件

大家好,又见面了,我是 GitHub 精选君!

背景介绍

在处于大数据和高性能计算领域的今天,大型语言模型(LLMs)正逐渐成为人工智能领域最有成效的工具之一。然而,尽管 LLMs 在一系列任务中表现出来的微妙性和宽广的知识使其非常强大,但是它们的部署和实施却很复杂。接触到的问题可能包括:需要处理大量的数据,需要大量的计算能力,对内存和存储需求较高,模型微调和部署的复杂性等。同时,我们也需要一个一站式的解决方案,可以方便地查找和实现不同的模型,这样可以节省我们的时间并提高工作效率。

今天要给大家推荐一个 GitHub 开源项目 Lightning-AI/lit-gpt,该项目在 GitHub 有超过 4.5k Star,用一句话介绍该项目就是:“Hackable implementation of state-of-the-art open-source LLMs based on nanoGPT. Supports flash attention, 4-bit and 8-bit quantization, LoRA and LLaMA-Adapter fine-tuning, pre-training. Apache 2.0-licensed.”。

项目介绍

Lit-GPT 是基于 nanoGPT 的最新的开源大型语言模型的实现方案,支持 flash attention、4-bit 和 8-bit 的量化,LoRA 和 LLaMA-Adapter 进行的微调和预训练。

Lit-GPT 提供了一种 hackable 的实现方式,它的特点是支持多种流行的模型检查点,比如 EleutherAI Pythia、LMSYS LongChat、Meta AI Code Llama、Microsoft Research Phi 等。该项目通过 Lightning Fabric 进行支持,并且使用 Apache 2.0 的开源许可。

以下是一个具体的使用示例,相应速度还是很快的。

目前支持如下模型:

如何使用

参考如下命令即可安装:

git clone https://github.com/Lightning-AI/lit-gpt
cd lit-gpt
pip install -r requirements-all.txt

安装好之后,使用如下命令即可开始使用:

python generate/base.py --prompt "Hello, my name is"
项目推介

Lit-GPT 在 2023 年的 NeurIPS Large Language Model Efficiency Challenge 上,即使用一个大型语言模型和一个 GPU 在一天内完成微调的比赛中,获得了大赛的官方推荐,是官方的启动的套件。

以下是该项目 Star 趋势图(代表项目的活跃程度):

更多项目详情请查看如下链接。

开源项目地址:https://github.com/Lightning-AI/lit-gpt

开源项目作者:Lightning-AI

以下是参与项目建设的所有成员:

关注我们,一起探索有意思的开源项目。


更多精彩请扫码关注如下公众号。

Written on December 29, 2023