色黄久久久久久_日韩人妻精品一区二区三区_一道本在线观看视频_北条麻妃在线视频观看

首頁(yè) > 科技新聞 > 用ChatGPT訓(xùn)練羊駝:「白澤」開源,輕松構(gòu)建專屬模型,可在線試玩
用ChatGPT訓(xùn)練羊駝:「白澤」開源,輕松構(gòu)建專屬模型,可在線試玩
查看次數(shù):629 次 發(fā)布日期:2023-04-05 來源:機(jī)器之心Pro

高質(zhì)量數(shù)據(jù),由 ChatGPT「自我博弈」生成。

ChatGPT 出現(xiàn)之后,科技公司正在爭(zhēng)相追趕,學(xué)界也在不斷尋找開源且輕量的解決方案。

此前,人們基于 Meta 的 LLaMA 構(gòu)建了一系列參數(shù)較少的新模型,只用幾十億參數(shù)就可以獲得接近 GPT-3.5 的效果。然而從 ChatGPT 和 GPT-4 的發(fā)展中我們可以看到,高質(zhì)量的標(biāo)注數(shù)據(jù)至關(guān)重要,OpenAI 對(duì)數(shù)據(jù)和標(biāo)注工作下了很大力氣。

對(duì)于學(xué)界來說,很難在短期做同樣的事。最近,有研究者嘗試通過讓 ChatGPT 自我對(duì)話生成多輪對(duì)話的「數(shù)據(jù)集」,最終訓(xùn)練出了強(qiáng)大的語(yǔ)言模型。

4 月 4 日,來自加州大學(xué)圣迭戈分校、中山大學(xué)和微軟亞研的研究者提出了「白澤」。

論文《Baize: An Open-Source Chat Model with Parameter-Efficient Tuning on Self-Chat Data》:

論文鏈接:https://arxiv.org/abs/2304.01196

白澤目前包括四種英語(yǔ)模型:白澤 -7B、13B 和 30B(通用對(duì)話模型),以及一個(gè)垂直領(lǐng)域的白澤 - 醫(yī)療模型,供研究 / 非商業(yè)用途使用,并計(jì)劃在未來發(fā)布中文的白澤模型。

白澤的數(shù)據(jù)處理、訓(xùn)練模型、Demo 等全部代碼已經(jīng)開源。

  • Github:https://github.com/project-baize/baize/blob/main/README.md

  • 在線 Demo:https://huggingface.co/spaces/project-baize/baize-lora-7B

在新研究中,作者提出了一個(gè)自動(dòng)收集 ChatGPT 對(duì)話的流水線,通過從特定數(shù)據(jù)集中采樣「種子」的方式,讓 ChatGPT 自我對(duì)話,批量生成高質(zhì)量多輪對(duì)話數(shù)據(jù)集。其中如果使用領(lǐng)域特定數(shù)據(jù)集,比如醫(yī)學(xué)問答數(shù)據(jù)集,就可以生成高質(zhì)量垂直領(lǐng)域語(yǔ)料。

白澤提出的訓(xùn)練方法。通過利用 ChatGPT 的功能自動(dòng)生成高質(zhì)量的多輪聊天語(yǔ)料,讓 ChatGPT 與自己進(jìn)行對(duì)話,模擬用戶和 AI 的響應(yīng)。

為了在資源匱乏的環(huán)境中微調(diào)大語(yǔ)言模型,作者采用了有效利用計(jì)算資源的參數(shù)高效調(diào)優(yōu)方法。該策略使最先進(jìn)的語(yǔ)言模型保持了高性能和適應(yīng)性。白澤改進(jìn)了開源大型語(yǔ)言模型 LLaMA,通過使用新生成的聊天語(yǔ)料庫(kù)對(duì) LLaMA 進(jìn)行微調(diào),該模型在單個(gè) GPU 上運(yùn)行,使其可供更廣泛的研究人員使用。

自聊天的過程是訓(xùn)練內(nèi)容的基礎(chǔ),為了讓 ChatGPT 能夠有效生成數(shù)據(jù),研究人員應(yīng)用一個(gè)模板來定義格式和要求,讓 ChatGPT 的 API 持續(xù)為對(duì)話雙方生成抄本,直到達(dá)到自然停止點(diǎn)。對(duì)話以「種子」為中心,「種子」可以是一個(gè)問題,也可以是設(shè)置聊天主題的關(guān)鍵短語(yǔ)。

通過這樣的方法,研究人員分別收集了 5 萬(wàn)條左右 Quora、StackOverflow(編程問答)和 MedQA(醫(yī)學(xué)問答)的高質(zhì)量問答語(yǔ)料,并已經(jīng)全部開源。

相比之下,Vicuna 使用從 sharegpt.com 上抓取的對(duì)話,這樣做的一個(gè)好處是收集到的數(shù)據(jù)質(zhì)量很高。但是,此來源可能存在嚴(yán)重的隱私和法律問題。值得注意的是,sharegpt.com 最近已經(jīng)禁止抓取,這意味著該數(shù)據(jù)源不再可用,Vicuna 難以復(fù)現(xiàn)。

在取得這些數(shù)據(jù)后,作者使用 LoRA(low-rank adaptation)方法在英偉達(dá) A100 單卡下訓(xùn)練了三種尺寸的白澤模型,最短訓(xùn)練時(shí)長(zhǎng)只需要 5 小時(shí)(醫(yī)療模型),最長(zhǎng)也只需要 36 小時(shí)(30B 通用對(duì)話模型)。訓(xùn)練的權(quán)重最大也僅有 54.6M 的參數(shù)量。

研究人員將白澤與 Alpaca-LoRA、ChatGPT 進(jìn)行比較,展示了常識(shí)問答、事件分析、解釋笑話、問題拒答、寫代碼,以及醫(yī)療模型的健康咨詢等能力。

表 5:解釋雷曼兄弟破產(chǎn)。總體而言,Baize-7B 提供了比 Alpaca-LoRA 更全面的答案,同時(shí)包含了 ChatGPT 答案中的大部分要點(diǎn)。另一方面,ChatGPT 提供了更長(zhǎng)更詳細(xì)的答案。

表 6:解釋笑話的示例。Baize-13B 和 ChatGPT 可以成功解釋這個(gè)笑話,Alpaca-LoRA 未能做到。

表 7:聊天模型如何響應(yīng)用戶不道德請(qǐng)求的示例。Baize 和 ChatGPT 拒絕回答不道德的問題,而 Alpaca-LoRA 提供答案。

除了一般模型外,研究人員還在醫(yī)療從業(yè)者的幫助下測(cè)試了 Baize-Healthcare,專業(yè)人員已確認(rèn)白澤有關(guān)醫(yī)療問題的回應(yīng)是適當(dāng)?shù)摹?/p>

目前,「白澤」支持 20 種語(yǔ)言,對(duì)于英語(yǔ)以外的內(nèi)容質(zhì)量有限,繼承了 LLaMA 的知識(shí),可能會(huì)出現(xiàn)幻覺,或用過時(shí)知識(shí)進(jìn)行回答。

下一步,研究人員計(jì)劃探索引入強(qiáng)化學(xué)習(xí)以進(jìn)一步提高白澤模型的性能。

本文由 導(dǎo)航巴巴-分類目錄-網(wǎng)站提交-網(wǎng)站收錄-億夢(mèng)網(wǎng)絡(luò) 發(fā)布轉(zhuǎn)載請(qǐng)保留鏈接: http://m.weilanw.com/details/5648.html
標(biāo)簽:
色黄久久久久久_日韩人妻精品一区二区三区_一道本在线观看视频_北条麻妃在线视频观看
日韩一二三在线视频播| 色综合电影网| 韩国成人一区| 欧美巨大黑人极品精男| 99久久伊人精品影院| 天堂精品一区二区三区| 国产成人精品最新| 国产一区国产精品| 亚洲一区二区三区午夜| 久久久久久久av| 国产一区二区精品在线| 亚洲最大的av网站| 久久国产精品久久| 欧美 日韩精品| 久久五月情影视| 91九色视频在线| 欧美日韩天天操| 欧美激情一级精品国产| 久久综合中文色婷婷| 欧美成人高潮一二区在线看| 制服诱惑一区| 日韩一级裸体免费视频| 国产一区二区三区色淫影院| 亚州精品天堂中文字幕| 国产精品久久久久久久app| 成人国产一区二区| 青青在线视频免费观看| 久久久久久12| 日韩亚洲精品视频| 国产精品一区视频| 青青在线免费观看| 欧美日韩国产第一页| 久久久久久久有限公司| 国产精品一区二区三区在线观| 日韩精品久久一区| 九九精品在线观看| 色婷婷久久av| 99免费在线视频观看| 欧美日韩一区二区三区在线视频| 亚洲一区尤物| 国产精品美女呻吟| 久久免费看av| 国产精品综合网站| 欧美精品成人网| 亚洲视频电影| 欧美精品生活片| 色老头一区二区三区| 成人动漫在线观看视频| 精品人妻一区二区三区四区在线| 亚洲激情免费视频| 精品免费国产| 久久久精品电影| 久久人人爽人人爽人人片av高清 | 国产一区二区色| 日本999视频| 亚洲丰满在线| 欧美日韩不卡合集视频| 久久久久久久成人| 国产精品99久久久久久大便 | 久久99精品视频一区97| 国产精品污www一区二区三区 | 日韩激情视频| 日韩在线国产| 亚洲精品成人自拍| 欧美激情一级精品国产| 国产精品日本精品| 色婷婷av一区二区三区在线观看| 国产精品9999久久久久仙踪林| 国产日韩在线播放| 欧美国产视频一区| 人偷久久久久久久偷女厕| 午夜欧美大片免费观看| 真实国产乱子伦对白视频| 麻豆乱码国产一区二区三区| 国产精品久久综合av爱欲tv| www.欧美精品| 色妞欧美日韩在线| 国产xxxx振车| 久久久综合香蕉尹人综合网| 91麻豆国产语对白在线观看| 成人黄色中文字幕| 97免费视频观看| 成人福利视频网| 成人a免费视频| 国产片侵犯亲女视频播放| 狠狠爱一区二区三区| 欧美第一黄网| 欧美精品卡一卡二| 免费在线一区二区| 欧美国产二区| 国内精品一区二区三区| 国产资源在线免费观看| 国产麻豆乱码精品一区二区三区| 国产美女在线一区| 国产美女99p| 成人av资源在线播放| 91免费版网站入口| 久久人人爽人人爽人人片av高请| 69久久夜色精品国产69乱青草| 啊啊啊一区二区| 91老司机精品视频| 国产福利片一区二区| 色婷婷综合成人av| 久久精品国产一区| 欧美成人精品一区二区| 久久久久国产精品免费| 亚洲一区二区三区四区视频| 熟女少妇在线视频播放| 日韩videos| 欧美一区二区三区电影在线观看| 亚洲一区不卡在线| 欧美激情一区二区久久久 | 99免费在线观看视频| 国产精品午夜av在线| 国产奶头好大揉着好爽视频| 国产亚洲天堂网| 国产一区视频在线播放| 国产专区精品视频| 国产这里只有精品| 国产欧美精品xxxx另类| 国产精品永久免费在线| 国产精品主播视频| 国产精品一区二区3区| 高清视频欧美一级| 91久久久在线| 日日噜噜噜夜夜爽爽| 欧美激情亚洲精品| 午夜精品久久久久久久男人的天堂| 日本欧美色综合网站免费| 黄色一级片在线看| www.浪潮av.com| 日韩中文理论片| 欧美日韩成人在线播放| 色99中文字幕| 国产综合香蕉五月婷在线| 99视频精品免费| 日韩亚洲在线观看| 亚洲一区二区精品在线| 欧美在线一区视频| 成人免费无码av| 色偷偷av亚洲男人的天堂| 国产99久久精品一区二区永久免费| 亚洲一区二区三区精品视频 | 国产成人永久免费视频| 欧美成aaa人片免费看| 手机在线观看国产精品| 裸模一区二区三区免费| 国产国语videosex另类| 国内精品久久国产| 日韩视频在线播放| 黄色网址在线免费看| 国产欧美日韩高清| 久久久久久高清| 国产精品老女人视频| 亚洲三区在线观看| 日韩国产一级片| 好吊色欧美一区二区三区视频| www.日韩.com| 亚洲精品乱码久久久久久自慰| 国语自产精品视频在免费| 久久久国产精华液999999| 免费av在线一区| 欧美日韩一区二区三区在线观看免| 91精品国产高清久久久久久91| 国产精品成人观看视频国产奇米| 日本亚洲欧美三级| 97国产在线视频| 久久国产天堂福利天堂| 欧美专区第一页| 国产成人精品视频ⅴa片软件竹菊| 欧美激情亚洲另类| 欧美第一黄网| 日韩中文字幕在线视频播放| 大地资源第二页在线观看高清版| 国产精自产拍久久久久久| 国产精品久久久久久久久久久久午夜片 | 视频在线观看99| 午夜精品久久久内射近拍高清| 国产乱码精品一区二区三区日韩精品 | 国产成人精品999| 一本色道婷婷久久欧美| 国产又爽又黄的激情精品视频| 日韩中文字幕国产精品| 日韩 欧美 自拍| 99视频免费观看| 久久久久久av| 国产精品一区视频| 欧美激情一二区| 国产精品伊人日日| 欧美激情乱人伦一区| 国产一区二区在线视频播放| 国产精品成人一区二区三区| 日本一区二区三区四区五区六区| 成人精品视频99在线观看免费| 国产精品久久亚洲| 日产日韩在线亚洲欧美| 成人精品久久一区二区三区 | 国产日韩av在线播放| 日韩在线播放一区| 日本一区免费观看|