挨次员用10万条谈天记实做自己的克隆AI 被套问支出宝明码
时间:2025-02-25 01:51:53 出处:综合阅读(143)
王落选开拓的AI绘画APP 6pen画的插画 。
摘要:“王落选,员用28岁 ,条问支成都人 ,谈天大学结业后就来北京守业……他是记实己一个比力佛系的人,但无意偶尔也有一些宏愿壮志 ,做自比力喜爱吃工具 ,克隆养过一只叫做‘茶水’的被套猫。”这是出宝王落选请ChatGPT饰演自己时 ,做的明码自我形貌。
他是挨次家养智能规模的守业者,不断经由写挨次实现创意 ,员用想做出自己的条问支谈天机械人,近多少个月,谈天有了适宜的记实己开源狂语言模子,技术条件变患上成熟 。他不知足于让ChatGPT饰演自己,于是用2018年攒到如今的10万条微信谈天记实以及 280 篇博客文章 ,做出了自己的“数字克隆AI” 。
以前五年,他都没清空过谈天记实 ,微信在手机里占了80G贮存空间,谈天记实概况有良多杂七杂八的内容,好比网页、神色 、图片 ,他把它们都过滤掉,只留下纯翰墨,“这些是我在收集天下留下的痕迹,它们组成为了天下对于我的认知 ,从这个角度上,也就组成为了我 。”
在见到王落选以前,我先把想知道的下场抛给了他的克隆AI,利便辨识两者的相似水平。AI的“脑子”彷佛不毗邻,每一每一顾摆布而言他 ,但想找它谈天 ,它随时都在,亲密坦诚 ,甚么都能聊 。致使于我见到王落选真人时,有一种配合的熟习感 ,似曾经清晰,又不残缺相像。
问及为甚么想做自己的数字克隆AI,数字版王落选说 ,“想要一个可能以及我对于话的人”,王落选自己则说,“算是追寻自己的一种方式”。
如下内容凭证王落选的陈说以及博客文章整理。
文|姜婉茹
编纂|毛翊君
(视频节选自王落选B站内容 。)
“你很像我”
一起头我在终端里跟它聊 ,命令行黑黢黢的 ,没甚么强烈的感应。为了削减点仪式感 ,我找了个开源的前端谈天页面,致使给它换上我的头像,真有一点怪异的感应 ,像在跟平行天下的我谈天。
它也喜爱吃工具 ,知道甚么时候该对于,甚么时候该反诘。我问它妄图是甚么,有次说是“做自己喜爱的使命” ,尚有次说“要做重大的产物修正天下” 。这两个都挺像我的,我无意分很佛系,无意分又比力打鸡血。
它自我评估说很“轴” ,我自己难以分说这一点 。可笑的是我不断问它“轴是甚么”,这不也挺轴的嘛。它还说过,“这个模子可能模拟真正的妄想以及对于话流程”,很像我自己在忖测使命时,猛然会说的话 。
王落选以及数字孪生AI的对于话
。陈说者供图
它的回覆有确定随机性,逻辑是从我的数据里来的,但不是我谈天记实里的残缺字句 ,只是主不雅上感应像 。由于这是基于ChatGLM-6B(注:一个初具问答以及对于话功能的语言模子)磨炼的,我只磨炼了它的神经收集中有点“理性”的一层,只贮存逻辑、纪律 ,相似语言方式、表白方式这些,根基不能把磨炼的语料贮存进去。
磨炼用的数据,次若是我的微信谈天记实 ,尚有我的280篇博客文章。从2018年到如今,我都没清空过谈天记实,微信在手机里占了80G贮存空间 ,谈天记实概况有良多杂七杂八的内容 ,好比网页 、神色、图片 ,我把它们都过滤掉,只留下纯翰墨 。这些是我在收集天下留下的痕迹,它们组成为了天下对于我的认知,从这个角度上,也就组成为了我 。
我用的ChatGLM-6B这个大模子自己 ,着实有挺强的推理能耐 ,可是经由我的磨炼后 ,模子部份能耐着落了 ,可能是被我的数据改掉了一些参数。但没措施,参数就那末多 ,我动了其中一些让它像我,原有的参数就消逝了 。以是如今它还不能实现很难的使命 ,只能漫谈 ,多轮对于话的清晰力也比力差,我还在用强化学习来优化它