GPT4All：一个能在笔记本运行的ChatGPT平替

207次阅读

共计 1924 个字符，预计需要花费 5 分钟才能阅读完成。

GPT4All是一个使用包括代码、故事和对话在内的大量干净助手数据训练的聊天机器人。该项目提供演示、数据和代码，用于训练一个基于 LLaMA 7B 的助手式大型语言模型，包含约 800k 个基于 GPT-3.5-Turbo 生成的对话。

项目上线两天，Star 量已经突破 7.8k。根据项目显示，M1 Mac、Windows 等环境都能运行。

GPT4All：一个能在笔记本运行的ChatGPT平替插图

项目地址：

https://github.com/nomic-ai/gpt4all

技术报告：

https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf

GPT4All：一个能在笔记本运行的ChatGPT平替插图1

与 GPT-4 相似的是，GPT4All 也提供了一份「技术报告」。这份初步的技术报告简要描述了 GPT4All 的搭建细节。

具体地：

数据收集和整理：在 2023 年 3 月 20 日至 2023 年 3 月 26 日期间，研究者使用 GPT-3.5-Turbo OpenAI API 收集了大约 100 万对 prompt 回答。参考斯坦福大学 Alpaca 项目，研究者使用排除法将最初的 prompt 数据集产生了一个包含 437.605 个 prompt – 生成对的最终子集。

GPT4All：一个能在笔记本运行的ChatGPT平替插图2

模型训练：研究者在 LLaMA 7B (Touvron et al., 2023) 的一个实例中将几个模型进行微调。

可重现性：研究者发布了所有的数据、训练代码和模型权重，供社区进行复现。

训练得到的 LoRa 权重：

gpt4all-lora: https://huggingface.co/nomic-ai/gpt4all-lora

gpt4all-lora-epoch-2: https://huggingface.co/nomic-ai/gpt4all-lora-epoch-2

原始数据：

Training Data Without P3

Explorer: https://atlas.nomic.ai/map/gpt4all_data_clean_without_p3

Full Dataset with P3

Explorer: https://atlas.nomic.ai/map/gpt4all_data_clean

设置：

克隆存储库

git clone –recurse-submodules git@github.com:nomic-ai/gpt4all.gitgit submodule configure && git submodule update

Cop

设置环境

python -m pip install -r requirements.txt

cd transformerspip install -e .

cd ../peftpip install -e .

Copy

训练：

accelerate launch –dynamo_backend=inductor –num_processes=8 –num_machines=1 –machine_rank=0 –deepspeed_multinode_launcher standard –mixed_precision=bf16 –use_deepspeed –deepspeed_config_file=configs/deepspeed/ds_config.json train.py –config configs/train/finetune-7b.yaml

Copy

生成：

python generate.py –config configs/generate/generate.yaml –prompt “Write a script to reverse a string in Python”

模型评估 ：研究者使用 SelfInstruct 论文 (Wang et al., 2022) 中的人类评估数据对该模型进行了初步评估。对比 alpaca-lora 模型的 ground truth 困惑度，GPT4All 表现出了更低的困惑度。

GPT4All：一个能在笔记本运行的ChatGPT平替插图3

有了 GPT4All的加持，在 MacBook M1 上本地就能运行 GPT。

可以尝试：

下载 CPU 量化的 gpt4all 模型检查点：gpt4all-lora-quantized.bin

克隆此存储库并将量化模型放在 chat 目录中，然后通过运行以下命令开始聊天：

在 M1 Mac / OSX 上运行 cd chat;./gpt4all-lora-quantized-OSX-m1

在 Windows / Linux 上运行 cd chat;./gpt4all-lora-quantized-linux-x86

Copy

GPT4All：一个能在笔记本运行的ChatGPT平替插图4

图注：在 M1 Mac 上运行(未加速!)

需要注意的是，GPT4All模型的权重和数据仅用于研究目的，并获得许可，禁止任何商业使用。GPT4All 是基于 LLaMA 的，LLaMA 具有非商业许可。

正文完

关注板板AI免费获得移动AI助手

发表至： ChatGPT

2023-04-22

转载说明：

本文由天天资讯网整理发布，转载请注明出处.
版权声明：部分文章内容或图片来源于网络，我们尊重作者的知识产权。如有侵犯,请联系我们在第一时间删除。

免费的ChatGPT网站

ChatGPT与烘焙

如何解决chatgpt的访问被拒绝

探索聊天AI的全新世界 – ChatGPT API接入指南

500+个优质的ChatGPT的提问Prompts（模板）

文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月
文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月
文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月
文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月
文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月	文字广告位10/月
温馨提示：请在上面搜索\| 查找更多免费资源，如需广告位请联系站长QQ 48704478

GPT4All：一个能在笔记本运行的ChatGPT平替

🎁扫码关注板板AI 免费领取AI资料大礼包

史诗级更新！苹果终于可以通话录音了，网友却吵翻了

iPhone通话录音来了，网友炸了

在单位里，永远不要在同事面前，随便说出以下五句话。

在单位里，办公室里是没有朋友的，不管和同事多熟，都不要说的10句话。

在单位里，回报贵人的最佳方式，不是请客送礼，而是想办法做到这三件事：不辜负、不忘恩、不藏私

判断你的同事到底是人是鬼，就看这四点！

iPhone16e这销量，把我的脸都打肿了！

vivo公认最好的四款手机，配置全面，用户满意度最高

2025换机建议不要跟风，4款近乎“零差评”的手机，用到2030年

为什么要远离话少，不合群的人？看完你就明白

在单位里，贵人提携过你，一定要懂得“抱大腿”的正确方式，请用好这三招：1、找准你的价值锚点；2、懂权力场看不见的；3、构建核心

在单位，年龄45岁以上身体不好的，千万不在这4个位置上待太久：1、办公室主任；2、中层干部；3、财务管理；4、频繁加班的

职场中，要假装不知道的几件事。

“领导对你说“谢谢”，别说“不用谢”，高情商这样回”

不管在哪里上班，要想混得开，永远记住这4件事：1、不要和同事翻脸；2、不要同情任何人；3、多给自己留后路；4、少做事多“做对事”