亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現(xiàn)在的位置是:首頁 > 技術(shù)閱讀 >  筆記本就能運行的ChatGPT平替來了,附完整版技術(shù)報告

筆記本就能運行的ChatGPT平替來了,附完整版技術(shù)報告

時間:2024-02-07

GPT4All 是基于大量干凈的助手數(shù)據(jù)(包括代碼、故事和對話)訓練而成的聊天機器人,數(shù)據(jù)包~800k條GPT-3.5-Turbo生成數(shù)據(jù),基于LLaMa完成,M1 Mac、Windows 等環(huán)境都能運行?;蛟S就像它的名字所暗示的那樣,人人都能用上個人GPT的時代已經(jīng)來了。

自從 OpenAI 發(fā)布 ChatGPT 后,最近幾個月聊天機器人熱度不減。
雖然ChatGPT功能強大,但OpenAI幾乎不可能將其開源。不少人都在做開源方面的努力,比如前段時間Meta開源的LLaMA。其是一系列模型的總稱,參數(shù)量從70億到650億不等,其中,130億參數(shù)的LLaMA模型「在大多數(shù)基準上」可以勝過參數(shù)量達1750億的GPT-3。
LLaMA的開源可是利好眾多研究者,比如斯坦福在LLaMA的基礎上加入指令微調(diào)(instruct tuning),訓練了一個名為Alpaca(羊駝)的70億參數(shù)新模型(基于LLaMA 7B)。結(jié)果顯示,只有7B參數(shù)的輕量級模型Alpaca性能可媲美GPT-3.5這樣的超大規(guī)模語言模型。
又比如,我們接下來要介紹的這個模型GPT4All,也是一種基于LLaMA的新型7B語言模型。項目上線兩天,Star量已經(jīng)突破7.8k。

項目地址:

https://github.com/nomic-ai/gpt4all
簡單來講,GPT4All在GPT-3.5-Turbo的800k條數(shù)據(jù)上進行訓練,包括文字問題、故事描述、多輪對話和代碼。
根據(jù)項目顯示,M1 Mac、Windows等環(huán)境都能運行。
我們先來看看效果。如下圖所示,用戶可以和GPT4All進行無障礙交流,比如詢問該模型:「我可以在筆記本上運行大型語言模型嗎?」GPT4All回答是:「是的,你可以使用筆記本來訓練和測試神經(jīng)網(wǎng)絡或其他自然語言(如英語或中文)的機器學習模型。重要的是,你需要足夠可用的內(nèi)存 (RAM) 來適應這些模型的大小……」
接下來,如果你不清楚到底需要多少內(nèi)存,你還可以繼續(xù)詢問GPT4All,然后它給出回答。從結(jié)果來看,GPT4All進行多輪對話的能力還是很強的。 

在M1 Mac上的實時采樣

有人將這項研究稱為「改變游戲規(guī)則,有了GPT4All的加持,現(xiàn)在在MacBook上本地就能運行GPT?!?/span>

與GPT-4相似的是,GPT4All也提供了一份「技術(shù)報告」。

技術(shù)報告地址:

https://s3.amazonaws.com/static.nomic.ai/gpt4all/2023_GPT4All_Technical_Report.pdf
這份初步的技術(shù)報告簡要描述了GPT4All的搭建細節(jié)。研究者公開了收集的數(shù)據(jù)、數(shù)據(jù)整理程序、訓練代碼和最終的模型權(quán)重,以促進開放研究和可重復性,此外還發(fā)布了模型的量化4位(quantized 4-bit)版本,這意味著幾乎任何人都可以在CPU上運行該模型。
接下來,讓我們看看這份報告中寫了什么。

GPT4All技術(shù)報告

1、數(shù)據(jù)收集和整理
在2023年3月20日至2023年3月26日期間,研究者使用GPT-3.5-Turbo OpenAI API收集了大約100萬對prompt回答。

首先,研究者通過利用三個公開可用的數(shù)據(jù)集來收集不同的問題/prompt樣本:

  • LAION OIG 的統(tǒng)一 chip2子集
  • Stackoverflow Questions 的一個隨機子樣本集Coding questions
  • Bigscience/P3子樣本集進行指令調(diào)優(yōu)
參考斯坦福大學Alpaca項目 (Taori et al., 2023),研究者對數(shù)據(jù)準備和整理給予了大量關(guān)注。在收集了最初的prompt生成對的數(shù)據(jù)集后,他們將數(shù)據(jù)加載到Atlas進行整理和清理,刪除了所有GPT-3.5-Turbo未能響應prompt并產(chǎn)生畸形輸出的樣本。這使得樣本總數(shù)減少到806199個高質(zhì)量的prompt -生成對。接下來,研究者從最終的訓練數(shù)據(jù)集中刪除了整個Bigscience/P3子集,因為它的輸出多樣性非常低。P3包含許多同質(zhì)化的prompt,這些prompt從GPT-3.5-Turbo中產(chǎn)生了簡短而同質(zhì)化的反應。
這種排除法產(chǎn)生了一個包含437,605個prompt -生成對的最終子集,如圖2所示。
模型訓練
研究者在LLaMA 7B (Touvron et al., 2023) 的一個實例中將幾個模型進行微調(diào)。他們最初的公開版本相關(guān)的模型是用LoRA (Hu et al., 2021) 在437605個后處理的例子上以4個epoch訓練的。詳細的模型超參數(shù)和訓練代碼可以在相關(guān)的資源庫和模型訓練日志中找到。
可重復性
研究者發(fā)布了所有的數(shù)據(jù)(包括未使用的P3 generations)、訓練代碼和模型權(quán)重,供社區(qū)進行復現(xiàn)。感興趣的研究者可以在Git存儲庫中找到最新的數(shù)據(jù)、訓練細節(jié)和檢查點。
成本
研究者大概用了四天的時間制作這些模型,GPU成本為800美元(從Lambda實驗室和Paperspace租的,其中包括幾次失敗的訓練),此外還有500美元的OpenAI API費用。
最終發(fā)布的模型gpt4all-lora可以在Lambda實驗室的DGX A100 8x 80G上用大約8小時訓練完成,總成本為100美元。
這個模型可以在普通筆記本上運行,真就像網(wǎng)友說的「除了電費之外,沒有任何成本。」

評估

研究者使用SelfInstruct論文 (Wang et al., 2022) 中的人類評估數(shù)據(jù)對該模型進行了初步評估。報告還對比了該模型與已知最好的公開的alpaca-lora模型(該模型由huggingface的用戶chainyo提供)的ground truth困惑度。他們發(fā)現(xiàn),所有的模型在少數(shù)任務上都有非常大的困惑度,并且報告的困惑度最大為100。與Alpaca相比,在這個收集的數(shù)據(jù)集上進行微調(diào)的模型在Self-Instruct評估中表現(xiàn)出了更低的困惑度。研究者表示,這個評估不是詳盡的,仍存在進一步的評估空間 —— 他們歡迎讀者在本地CPU上運行該模型(文件見 Github),并對它的能力有一個定性的認識。
最后,需要注意的是,作者公布了數(shù)據(jù)和訓練細節(jié),希望它能加速開放的LLM研究,特別是在對齊和可解釋性領(lǐng)域。GPT4All模型的權(quán)重和數(shù)據(jù)僅用于研究目的,并獲得許可,禁止任何商業(yè)使用。GPT4All是基于LLaMA的,LLaMA具有非商業(yè)許可。助理數(shù)據(jù)是從OpenAI的GPT-3.5-Turbo收集的,其使用條款禁止開發(fā)與OpenAI進行商業(yè)競爭的模型。

文章來源:機器之心

IEEE Spectrum

《科技縱覽》

官方微信公眾平臺






往期推薦
AI成為強大的像素繪圖工具
2022計算機科學6大突破!

準備好在公司接受大腦掃描了嗎?

亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
欧美美女日韩| 欧美国产日韩一区二区三区| 亚洲一区二区在线观看视频| 国产精品久久| 久久久噜噜噜| 亚洲毛片一区二区| 国产欧美精品一区二区色综合| 99国产精品久久久久久久| 欧美日韩国产二区| 久久久国产午夜精品| 一区二区三区视频在线看| 在线日韩精品视频| 国产日韩欧美高清| 欧美日韩国产三级| 欧美福利一区| 免费欧美在线视频| 久久国产免费看| 亚洲五月六月| 夜夜嗨av一区二区三区中文字幕 | 国产亚洲成av人片在线观看桃| 久久er99精品| 午夜精品一区二区三区在线播放 | 久久青青草原一区二区| 欧美亚洲一级片| 精品成人一区二区| 国产日韩欧美三区| 国产精品手机在线| 欧美绝品在线观看成人午夜影视 | 久久综合色天天久久综合图片| 亚洲综合精品四区| 99re热这里只有精品视频| 亚洲成色www8888| 国内成人精品一区| 黄色精品一二区| 国产精品美女久久久浪潮软件| 欧美日韩中文字幕综合视频| 欧美日韩黄色大片| 黄色日韩网站| 一色屋精品视频在线看| 永久免费精品影视网站| 蜜臀99久久精品久久久久久软件| 又紧又大又爽精品一区二区| 国产精品久久久久久久久果冻传媒| 亚洲欧美视频在线观看| 亚洲综合国产| 亚洲在线不卡| 午夜宅男欧美| 老色鬼精品视频在线观看播放| 久久久欧美一区二区| 麻豆久久精品| 欧美精品久久久久久久久老牛影院 | 美女视频黄 久久| 久久久国产一区二区| 另类专区欧美制服同性| 可以看av的网站久久看| 久久gogo国模啪啪人体图| 裸体歌舞表演一区二区| 欧美极品aⅴ影院| 欧美三区美女| 国产日韩精品在线| 亚洲国产精品久久久久| 一区二区三区久久精品| 欧美一区二区三区在线观看| 欧美在线观看一区| 欧美91大片| 国产精品网站视频| 亚洲国产精品久久人人爱蜜臀| 国产美女精品视频| 亚洲国产片色| 香蕉成人久久| 麻豆精品在线观看| 欧美视频一区在线| 国产欧美日韩一区| 亚洲精品国产日韩| 欧美中文字幕在线| 欧美日韩精品| 国产综合第一页| 日韩午夜在线播放| 久久综合色播五月| 国产精品永久免费| 亚洲裸体视频| 久久久水蜜桃| 国产精品永久免费在线| 亚洲欧洲精品成人久久奇米网| 一区二区免费在线视频| 久久久久久久久蜜桃| 两个人的视频www国产精品| 欧美日韩精品一区视频| 国内精品久久久久国产盗摄免费观看完整版| 亚洲国产三级网| 久久久7777| 国产欧美日韩精品丝袜高跟鞋 | 国产一区二区中文| 一本色道88久久加勒比精品 | 国内偷自视频区视频综合| 99re成人精品视频| 欧美专区日韩视频| 欧美日韩一区二区三| 亚洲第一区色| 久久日韩粉嫩一区二区三区| 国产精品第三页| 中文av一区特黄| 欧美片在线观看| 亚洲日本激情| 麻豆九一精品爱看视频在线观看免费 | 亚洲欧美网站| 久久不射中文字幕| 国产精品自拍小视频| 亚洲午夜一区二区| 欧美日韩三级| 亚洲精品中文字幕在线| 美女任你摸久久| 狠狠干成人综合网| 久久成人免费| 国产一区高清视频| 欧美一区二区三区在线播放| 国产精品久久久久久久7电影| 在线亚洲成人| 欧美性猛片xxxx免费看久爱| 亚洲视频axxx| 国产乱码精品1区2区3区| 亚洲欧美日韩国产中文 | 国产精品一页| 欧美一区二区三区在线视频 | 欧美中文字幕在线| 国产日韩一区二区三区在线播放| 国产精品成人免费| 亚洲在线视频观看| 国产欧美日本一区视频| 久久久久久亚洲精品中文字幕| 激情一区二区| 欧美高清不卡在线| 中文国产成人精品久久一| 国产精品入口麻豆原神| 久久久99久久精品女同性| 亚洲电影免费观看高清完整版| 久久九九国产精品怡红院| 国产视频一区二区在线观看| 久久久久久97三级| 亚洲精品国产精品国自产观看 | 亚洲黄一区二区| 欧美日韩精品综合| 亚洲一区二区综合| 美女日韩在线中文字幕| 激情久久久久久久久久久久久久久久 | 久久av红桃一区二区小说| 国产一区亚洲| 欧美国产精品一区| 久久精品国产免费观看| 亚洲伊人网站| 99精品视频免费在线观看| 狠狠狠色丁香婷婷综合久久五月| 欧美日韩在线一二三| 美女诱惑一区| 久久精品二区| 午夜精品久久久久久久男人的天堂| 亚洲人体大胆视频| 在线看无码的免费网站| 国产欧美一区二区精品秋霞影院| 欧美日韩一区二区视频在线观看| 玖玖玖免费嫩草在线影院一区| 午夜精品亚洲| 亚洲一区二区在线免费观看视频 | 欧美aⅴ99久久黑人专区| 欧美在线一二三区| 香蕉成人伊视频在线观看| 中文欧美日韩| 亚洲视频在线观看| 日韩亚洲欧美在线观看| 亚洲欧洲在线一区| 亚洲欧洲一区二区在线观看| 欲色影视综合吧| 狠狠做深爱婷婷久久综合一区 | 久久男女视频| 亚洲桃色在线一区| 亚洲伦理在线| aⅴ色国产欧美| 亚洲裸体俱乐部裸体舞表演av| 在线观看av一区| 在线成人激情| 91久久香蕉国产日韩欧美9色| 有码中文亚洲精品| 亚洲国产另类精品专区| 99精品福利视频| 在线性视频日韩欧美| 亚洲一区在线播放| 欧美一区二区三区免费大片| 欧美一级理论性理论a| 欧美在线观看视频一区二区| 久久精品成人欧美大片古装| 久久亚洲欧美| 欧美日韩成人一区| 国产精品看片资源| 国产精品一区久久久| 国产一区二区精品久久| 伊甸园精品99久久久久久| 亚洲国产第一页| 一区二区三区高清不卡| 午夜视黄欧洲亚洲| 久久在精品线影院精品国产|