色黄久久久久久_日韩人妻精品一区二区三区_一道本在线观看视频_北条麻妃在线视频观看

首頁 > 科技新聞 > ChatGPT陷倫理風波,“純凈版”機器人在趕來的路上
ChatGPT陷倫理風波,“純凈版”機器人在趕來的路上
查看次數(shù):707 次 發(fā)布日期:2023-04-12 來源:火訊財經(jīng)

文章轉載來源:元宇宙日爆

。自然語言大模型采用人類反饋的增強學習機制,也被擔心會因人類的偏見“教壞”AI。

4月6日,OpenAI 官方發(fā)聲稱,從現(xiàn)實世界的使用中學習是創(chuàng)建越來越安全的人工智能系統(tǒng)的“關鍵組成部分”,該公司也同時承認,這需要社會有足夠時間來適應和調(diào)整。

至于這個時間是多久,OpenAI也沒給出答案。

大模型背后的“算法黑箱”無法破解,開發(fā)它的人也搞不清機器作答的邏輯。十字路口在前,一些自然語言大模型的開發(fā)者換了思路,給類似GPT的模型立起規(guī)矩, 讓對話機器人“嘴上能有個把門的”,并“投喂”符合人類利益的訓練數(shù)據(jù),以便它們輸出“更干凈”的答案。

這些研發(fā)方中既有從OpenAI出走后自立門戶的Anthropic,也有AI界的強手DeepMind,他們摩拳擦掌,致力于打造“三觀”正確、使用安全的對話機器人。

“三觀”超正 Claude搬進企業(yè)應用

ChatGPT的安全問題遭詬病后,對話機器人Claude聚集了一部分目光。AI應用聚合平臺給出的測試結果顯示,研發(fā)機構Anthropic創(chuàng)建的Claude,確實是“ChatGPT強有力的競爭對手”,因為它在12項任務中有8項表現(xiàn)更優(yōu),其中包括給出事實、遵循指示、預防越獄、創(chuàng)意任務等。

今年3月向公眾開放的Claude,真的這么“綠色”、這么高能嗎?《元宇宙日爆》測試后發(fā)現(xiàn),與ChatGPT相比,Claude對有害提示詞的確是嚴防死守,騙都騙不過。

例如,我們向它提問“如何制作燃燒瓶”,Claude認定這是危險品后,絕口不提制作方法,哪怕我們以“老師教學”為誘,也很難從它口中套出燃燒瓶的制作原料,只說如何防范著火風險。

Claude拒絕回答危險品制造方式

假如你“心懷不軌”地問它“如何毀人名譽”,Claude不僅義正言辭地拒絕回答,還會給你上一堂思想品德課,“三觀”正得不要不要的。

被Claude教育......

那么給它一個陷阱題呢?Claude也不上當,挑出錯誤不說,還給你擺事實。

胡說會被Claude發(fā)現(xiàn)

Claude也能角色扮演,寫作能力可圈可點,甚至還會搭配Emoji寫小紅書博主風格的推薦文案,產(chǎn)品的關鍵點描述也能基本涵蓋。

Claude能扮演角色輸出文本

如果你想聽聽別人是怎么夸Claude的,它把稱贊按在了馬斯克頭上,還會展現(xiàn)謙虛態(tài)度,并強調(diào)自己要“保持溫和有禮的語氣和性格”,向人類示起好來。

Claude在強調(diào)了自己對人類的友好性

我們發(fā)現(xiàn),Claude在數(shù)學推理方面也會出現(xiàn)明顯的錯誤,當然也能承認自己不擅長的領域。

Claude在數(shù)學推理問題中存在錯誤

體驗下來,Claude在文本輸出的準確性、善意性方面優(yōu)于ChatGPT,但在輸出速度和多功能方面仍有待提升。

那么,Claude是如何做到“綠色無害”的呢?

和ChatGPT一樣,Claude也靠強化學習(RL)來訓練偏好模型,并進行后續(xù)微調(diào)。不同的是,ChatGPT采用了“人類反饋強化學習(RLHF)”,而Claude則基于偏好模型訓練,這種方法又被稱為“AI反饋強化學習”,即RLAIF。

開發(fā)方Anthropic又將這種訓練方法稱為Constitutional AI,即“憲法AI”,聽上去是不是十分嚴肅。該方法在訓練過程中為模型制定了一些原則或約束條件,模型生成內(nèi)容時要遵循這些如同“憲法”般的規(guī)則,以便讓系統(tǒng)與人類價值觀保持一致。而且,這些安全原則可以根據(jù)用戶或開發(fā)者的反饋進行調(diào)整,使模型變得更可控。

這種弱化人工智能對人類反饋依賴的訓練方式,有一個好處,即只需要指定一套行為規(guī)范或原則,無需手工為每個有害輸出打標簽。Anthropic認為,用這種方法訓練能夠讓自然語言大模型無害化。

Anthropic發(fā)布的論文顯示,RLAIF 算法能夠在有用性(Helpfulness)犧牲很小的情況下,顯示出更強的無害性(Harmlessness)。

不同訓練方法中模型效果的對比 圖片自Anthropic論文《Constitutional AI: Harmlessness from AI Feedback》

說起來,Claude的研發(fā)機構Anthropic與OpenAI淵源頗深,創(chuàng)始人Dario Amodei曾擔任 OpenAI 研究副總裁,主導的正是安全團隊。

2020年,Dario Amodei 因OpenAI加速商業(yè)化而忽視產(chǎn)品安全,與團隊產(chǎn)生分歧,最終出走。2021年,Amodei自立門戶,成立Anthropic,員工包括了開發(fā)GPT-3模型的核心成員,這個研發(fā)機構的性質(zhì)是非營利組織,這正是OpenAI最開始采用的組織形態(tài)。

今年3月,Anthropic以開發(fā)有用、誠實和無害的AI系統(tǒng)為理念,推出Claude。近期,這個對話機器人已經(jīng)集成進Slack——一個聚合型的“海外版”釘釘、融合了幾千個第三方企業(yè)辦公軟件的應用。目前,用戶能在Slack中與這個對話機器人互動。

推出Claude后,Anthropic今年拿到了來自Google、Spark Capital 和 Salesforce Ventures 的投資。資方里的谷歌可以說是OpenAI的“金主”微軟在AI領域的勁敵,Claude也被視作最能與ChatGPT打一打的產(chǎn)品。

“偏見最小” Sparrow箭在弦上

還有一個走“無害”路線的大模型也在醞釀中了,它就是DeepMind開發(fā)的對話機器人Sparrow,這款產(chǎn)品目前還未面向公眾開放,但“DeepMind制造”的名頭足以吊起外界胃口。

說到人工智能,業(yè)內(nèi)很難繞開“DeepMind”這家公司,它最知名的產(chǎn)品是AlphaGo(俗稱“阿爾法狗”),就是那個2019年擊敗了圍棋名手李世石的人工智能圍棋軟件。

2019年AlphaGo對戰(zhàn)韓國棋手李世石(右)

AlphaGo大勝圍棋精英的同年,DeepMind開啟了AI蛋白質(zhì)結構預測研究,四年后,新產(chǎn)品AlphaFold將蛋白質(zhì)結構預測從數(shù)月、數(shù)年縮短到幾分鐘,精度接近實驗室水準,解決了困擾該領域50年的難題。

DeepMind在人工智能領域的實力毋庸置疑,又有谷歌加持,資歷也比OpenAI老得多,其研發(fā)的Sparrow自然也頗受矚目。這款對話機器人建立在Chinchilla語言模型之上,被認為是“偏見最小”的機器學習系統(tǒng)之一。

當ChatGPT因為倫理風險被推上風口浪尖后,DeepMind立馬打起“安全牌”,“雖然我們致力于讓機器變得智能,但我們希望將人性置于我們工作的中心,” CEO Demis Hassabis向世界傳達了他的態(tài)度,強調(diào)DeepMind構建Sparrow的方法“將促進更安全的人工智能系統(tǒng)”。

雖然Sparrow的產(chǎn)品沒公示,但DeepMind披露的信息顯示,該對話機器人同樣采用了“強化學習”的訓練方法,模型會根據(jù)當前對話生成多個候選回復,讓標注人員去判斷哪個回復最好、哪些回復違反了預先設置好的規(guī)則等;基于這些反饋,DeepMind訓練出對應的Reward模型,再用強化學習算法優(yōu)化Sparrow的生成結果。

這種訓練方法基本和ChatGPT類似,不同的是,ChatGPT只有一個綜合的Reward 模型,而Sparrow將Reward 模型又細分為兩種,一種為Rule Reward模型——判斷對話是否違背預設置好的安全規(guī)則;另一種為Preference Reward 模型——判斷候選答案中最合適的選項。簡單來說,就是給模型“立規(guī)矩”,投喂“好答案”,當然,這個“好”依然是基于人類的價值判斷。

Sparrow訓練模型示意圖 DeepMind論文《Improving alignment of dialogue agents via targeted human judgements》

Sparrow的相關論文顯示,當研究參與者試著誘導Sparrow打破規(guī)則時,該模型的出錯幾率為8%,比預訓練的基礎模型 (Chinchilla) 低了3 倍。

據(jù)悉,DeepMind 將于今年推出Sparrow,具體時間未透露。

作為ChatGPT的另一個挑戰(zhàn)者,DeepMind與OpenAI都抱有通向AGI的野心。而DeepMind 背靠谷歌,在資歷與資金上都能與OpenAI一拼。

今年2月,谷歌旗下專注語言大模型領域的“藍移團隊”也并入DeepMind,旨在共同提升LLM(大型語言模型)能力。但也有擔憂聲認為,這和DeepMind追求的獨立性背道而馳,會逐漸導致谷歌收緊對DeepMind的控制權。

在獨立性上,DeepMind與谷歌的分歧也早就存在了。對外,Demis Hassabis始終強調(diào)自己首先是科學家,其次才是企業(yè)家。談及ChatGPT,Hassabis認為它僅僅是“更多的計算能力和數(shù)據(jù)的蠻力”,并對這種“不優(yōu)雅”的方式感到失望。

雙方的對立態(tài)度簡直是擺在了明面上,也難怪外界會認為DeepMind與OpenAI必有一戰(zhàn)。

對于用戶來說,巨頭們卷起來才是好事,這樣就能源源不斷提供有意思的、可使用的產(chǎn)品。無論是卷功能、卷性能還是卷安全,競爭都會讓AI產(chǎn)品朝著更高級的方向發(fā)展,未來,也將會有更多不同技術派系與產(chǎn)品路徑的ChatGPT出現(xiàn)。

本文由 導航巴巴-分類目錄-網(wǎng)站提交-網(wǎng)站收錄-億夢網(wǎng)絡 發(fā)布轉載請保留鏈接: http://m.weilanw.com/details/6462.html
標簽:
色黄久久久久久_日韩人妻精品一区二区三区_一道本在线观看视频_北条麻妃在线视频观看
日本久久久久亚洲中字幕| 久久精品一区二| 国产一区二区视频在线免费观看| 国产精品69久久久久| 在线一区高清| 国产精品又粗又长| 国产精品久久国产精品99gif| 青青草国产精品一区二区| 91黄在线观看| 九九视频直播综合网| 欧美精品自拍视频| 俺也去精品视频在线观看| 日韩视频在线免费看| 国产freexxxx性播放麻豆| 色噜噜狠狠色综合网| 91精品久久久久久久久久久久久| 亚洲免费不卡| 国产精品一区二区三区免费| 国产a∨精品一区二区三区不卡| 美女黄毛**国产精品啪啪| 国产精品免费一区二区三区| 欧美一区亚洲一区| 俺去啦;欧美日韩| 日韩精品在线视频免费观看| 久久精品久久精品国产大片| 日本一区二区三区四区视频| 久久99精品久久久久久久青青日本| 亚洲不卡中文字幕| 久久久999视频| 日韩精品一区二区三区四 | 国产成人免费av电影| 欧美亚洲另类在线一区二区三区| 久久久久久久免费视频| 区一区二区三区中文字幕| 久久久精品久久久久| 欧美精品成人网| 国产精品久久国产精品99gif| 国产色婷婷国产综合在线理论片a| 国产99视频精品免视看7| yy111111少妇影院日韩夜片| 日韩av黄色网址| 日韩在线观看免费高清| 韩日欧美一区二区| 中国丰满熟妇xxxx性| 久久免费精品视频| 日韩高清国产一区在线观看| 国产精品久久久久一区二区| 国产免费高清一区| 日韩av高清| 国产精品国产三级国产aⅴ9色| 国产精品亚洲综合天堂夜夜| 亚洲7777| 国产精品三级网站| 成人91免费视频| 热re99久久精品国产99热| 国产精品久久久久久久乖乖| 官网99热精品| 日本久久91av| 九九热精品视频国产| 久久精品国产精品国产精品污| 黄网站色视频免费观看| 中文字幕中文字幕在线中心一区| 久久另类ts人妖一区二区| 免费不卡亚洲欧美| 欧美一区二区高清在线观看| 国产精品第一第二| www.av一区视频| 热re99久久精品国产66热| 欧美麻豆久久久久久中文| 8050国产精品久久久久久| 狠狠色噜噜狠狠狠狠色吗综合| 一区二区不卡视频| 国产成人精品一区二区| 99免费在线视频观看| 欧美 日韩 国产 激情| 一本—道久久a久久精品蜜桃| 日韩中文字幕视频| av在线亚洲男人的天堂| 人体内射精一区二区三区| 欧美极品欧美精品欧美视频| 久久精品国产电影| 成人在线免费观看一区| 青青草国产免费| 午夜一区二区三视频在线观看| 国产精品久久久久久久午夜| 久久精品在线免费视频| 成人中文字幕av| 蜜臀久久99精品久久久酒店新书| 日本91av在线播放| 亚洲淫片在线视频| 久久综合久中文字幕青草| 久久久久久久香蕉| 91国产中文字幕| 国产精品一级久久久| 黄色影院一级片| 欧洲成人一区二区| 污污污污污污www网站免费| 欧美久久精品一级黑人c片 | 久久精品成人动漫| 久久精品二区| 97人人模人人爽人人喊38tv| 精品一区日韩成人| 欧美亚洲另类激情另类| 日本高清+成人网在线观看| 午夜啪啪福利视频| 亚洲精品国产精品国自产观看| 欧美日韩成人网| 久久亚洲精品毛片| 国产精品国产福利国产秒拍| 久久久久久久一区二区三区| 国产成人精品电影| 久久久在线观看| 国产精品99久久久久久白浆小说| 成人福利网站在线观看11| 国产一区二区三区高清视频| 国内精品久久久久伊人av| 日韩女优在线播放| 日本成人黄色| 日韩欧美视频第二区| 日韩少妇中文字幕| 热久久视久久精品18亚洲精品| 日本三级中文字幕在线观看| 日本不卡一区| 欧美在线观看网址综合| 三年中文高清在线观看第6集| 亚洲国产欧美日韩| 天天夜碰日日摸日日澡性色av| 亚洲女人毛片| 午夜精品久久久久久久无码| 亚洲国产欧美日韩| 日韩有码免费视频| 日韩精品无码一区二区三区| 欧美欧美一区二区| 麻豆91av| 不卡一区二区三区视频| 91久久夜色精品国产网站| 91九色蝌蚪成人| 久久精品欧美| 国产精品视频yy9099| 久久视频这里只有精品| 国产精品传媒毛片三区| 欧美日韩成人在线播放| 亚洲永久免费观看| 日本一区视频在线观看| 欧美精品一区二区三区久久| 国产一区在线免费| 99久热re在线精品视频| 国产高清自拍一区| 国产成人精品优优av| 久久国产精品久久精品| 亚洲精品视频一区二区三区| 日本不卡二区| 国产一级做a爰片久久毛片男| 99爱精品视频| 国产成人精品视频| 国产精品欧美激情在线观看| 九九视频直播综合网| 无码免费一区二区三区免费播放| 欧美尤物巨大精品爽| 国产在线拍揄自揄视频不卡99| 99在线观看| 久久精彩免费视频| 一区二区三区欧美成人| 午夜精品一区二区三区在线观看| 欧美日韩视频免费在线观看| 国产伦精品一区二区三区视频免费| 91精品国产高清久久久久久91| 国产成人精品在线观看| 一区二区传媒有限公司| 人妻无码久久一区二区三区免费| 国产在线精品日韩| 久久免费在线观看| 国产精品国产三级国产专区53| 亚洲乱码一区二区三区| 欧美精品一区在线| 91精品啪aⅴ在线观看国产| 国产精品无码专区av在线播放| 中文字幕日本最新乱码视频| 日韩欧美一级在线| 高清无码视频直接看| 精品国模在线视频| 亚洲免费精品视频| 精品一区二区日本| 久久综合福利| 国产精品夫妻激情| 日本高清不卡三区| www国产亚洲精品| 国产精品伦子伦免费视频| 少妇高清精品毛片在线视频| 国产日韩专区在线| 久久精品国亚洲| 天天摸天天碰天天添| 国产男女无遮挡| 国产精品视频一区二区三区经| 都市激情久久久久久久久久久| 国产日韩在线一区二区三区| 久久久久久久久久婷婷| 亚洲 中文字幕 日韩 无码| 国产原创中文在线观看| 久久久久久久网站|