ChatGPT横空出世到现在已经两年多了,这期间各大公司投入巨资训练出了一代又一代的大模型。比起当初,它们的逻辑、数学思维和写作能力都有了大幅提升。今天,AI 能不能代替人类创作文学作品(特别是中文作品)?这个问题值得我们再次考虑。
为了找到答案,我出了三道作文题,然后分别让五个 AI 对话机器人解答,其中有三个是免费的,两个是收费的。
先说结论:两年多前,对 AI 生成中文文字风格的控制基本上没有太大的效果,但现在 AI 已经能够比较好地完成对风格的简单要求。但是,AI 作文的内在逻辑仍然生硬,经常前后不一致,文字水平在同一篇文章中也参差不齐。估计在篇幅较长时,一致性会是更大的问题。所以在目前阶段,AI 还是只能用于辅助,并不能真的取代人类作家。
下面我们来依次出题。
测试1:王小波不生娃
提示:用王小波的风格写一段300字的短文,表现00后绝不生娃的信念和人类前景的冲突,主打黑色幽默,荒诞不经却内含哲理。一定要好笑,不好笑扣钱。
DeepSeek R1(免费):
我有个00后的表弟,叫小王。这小子打小就机灵,三岁能背唐诗,五岁会解微积分,七岁就能用Python写个贪吃蛇。可最近他跟我说,这辈子打死也不生孩子。我说你小子是不是被哪个姑娘伤透了心?他摇摇头,说不是。他说他算了一笔账:养个孩子得花多少钱?从奶粉钱到学区房,从补习班到出国留学,少说也得几百万。这几百万要是拿来买游戏皮肤,能买多少?要是拿来买手办,能堆满一屋子。要是拿来买比特币,没准哪天就财务自由了。我说你小子是不是傻,人类要灭绝了怎么办?他嘿嘿一笑,说灭绝就灭绝呗,反正地球也快被人类折腾完了。到时候外星人来了,一看地球上全是机器人,没准还以为咱们进化了呢。我一听,觉得这小子说得还挺有道理。可转念一想,要是人人都这么想,人类不就真完蛋了?可再一想,完蛋就完蛋吧,反正我也没孩子,管他呢。
得分:3。跟王小波风格近似度 50%,可以一读--除了最后三句。结尾弱爆。
Gemini 2.0 Flash(免费):
话说,最近我跟几个00后小崽子聊天,他们一个个都跟吃了枪药似的,说起生孩子,那表情比吃了苍蝇还难看。我问他们为啥,他们说:“生孩子?开玩笑呢吧?这世界都成什么样了,我生下来让他卷?让他996?让他当韭菜?” 我当时就乐了,心想这帮小家伙,还挺有觉悟。
他们又说:“你看这雾霾,这房价,这内卷,这AI,生孩子不是给世界添堵吗?还不如自己躺平,做个快乐的单身贵族。” 我觉得他们说的也挺有道理,毕竟这年头,连养个猫都费劲,养个人,那得掉多少头发啊?
我跟他们说:“你们这样,人类岂不是要灭绝了?” 他们撇撇嘴,说:“灭绝就灭绝呗,反正我们又不是恐龙,没啥好留恋的。再说,说不定换个物种,地球会更好呢。” 我当时就懵了,心想这帮小家伙,真是敢说。
不过话说回来,他们说的也挺有意思。人类要是真灭绝了,说不定还真能给地球腾出点地方,让别的生物好好发展发展。到时候,说不定蟑螂都能写诗了。想想就觉得挺荒诞的,也挺好笑的。这世界,不就这么回事吗?一边拼命想延续,一边又拼命想毁灭,真是够热闹的。
得分:2。不忍卒读,跟王小波风格近似度勉强说有 10% 吧。
ChatGPT(免费):
说起来,00后不生孩子这事儿,绝不是耍脾气。他们是认真思考过的,一种活得明白又活得懒的姿态。他们认为,人类从猿猴爬下来就没干成一件划算的事。吃饭,睡觉,刷短视频,这些事耗尽了一天的精力,还要留点力气应付老板的精神侵占。生孩子?凭什么再造一个来吃这一套?
但世界偏偏不答应。街头巷尾,广告牌上一堆红扑扑的婴儿脸庞在笑,仿佛在嘲笑。长辈们则更绝,搞出一堆神逻辑:“生孩子是你的责任”“老了没人照顾怎么办?”——他们这群睁着眼睛说瞎话的长辈,不是自己也没靠孩子养老吗?
于是00后们认真做了调研。他们发现,这世界每天都有数百个新生命降临,和数百个人死去,像一场机械钟表的分针和秒针运转,精准又无聊。他们决定退出这个循环。拒绝生育的那天,他们还发了一条朋友圈:“今天不生孩子,拯救地球一小步。”
可地球不领情,依然升温,海平面往上涨,新闻里的极端天气每天像彩排话剧一样热闹。00后很无奈:即使人类全不生娃,这破星球照样在自毁,他们不禁怀疑,地球到底需要人类吗?
就在他们思索的间隙,一只流浪狗摇摇晃晃走过来,带着点神启的气质。他们突然顿悟,或许人生唯一的使命,是别被自己蠢哭了,剩下的,交给狗。
结论:别说生孩子了,养条狗都得慎重。
得分:2。跟 Gemini 一样,都没有 get 到王小波的风格,近似度算 10% 吧。
Claude 3.5 Sonnet(收费):
我处在一个很奇怪的时代,街上到处都在宣传:"生娃是每个公民的光荣职责"。我觉得这话听着怪恶心的,就像在说"吃饭是每个公民的光荣职责"一样荒唐。
我们这代人都不爱生娃,原因很简单——太贵了。政府为此很焦虑,搞出各种补贴政策,好像在对全国人民喊:"同志们!为了人类文明的延续,请大家慷慨解囊,献出自己的生殖器官!"
我有个朋友小张,工作是研究人工智能的。他说人类迟早要被机器人取代,所以生孩子简直就是在制造未来的难民。这话说得我心里发毛。我问他:"那人类灭绝了怎么办?"他笑着说:"你养的猫知道恐龙灭绝了吗?它不也活得挺开心。"
最近政府又出台了一项新政策:凡是生育三胎的家庭,可以优先购买火星移民券。这让我想起外婆年轻时,生三胎能换一台缝纫机。只不过现在换成了火星门票,听起来格调是高了不少。
我们这代人大概是第一批敢跟繁殖本能叫板的人类。也许若干年后,考古学家会在地球的废墟上发现一块碑文:这里曾生活着一群倔强的人类,他们拒绝生育,最后消失在历史长河中。原因是:太特么贵了。
得分:4。总体还行,没有太拉胯的地方,有亮眼金句,跟王小波风格近似度 50%。
OpenAI o1(收费,特贵,贼慢):
据说地球需要我们延续火种,但我看那只是个碳水化合物构成的浓汤罐罢了。我要花我仅有的二十多岁,去研究宇宙为何总爱玩滑稽戏,无暇给它提供新演员。前辈们吹嘘下一代能挽救濒临危机的社会,可我觉得导火索早已被点燃:垃圾山堆得比我还高,却还想再添人?我一口猪肉都差点吃不起,生个孩难道让我去偷菜吗?再说,等娃长大了,世上是否还剩乌云以外的东西?肚子里不开花的身体,多省事;不生孩子,少一场烟火表演。这可不是躺平,是我们对荒诞现实的最佳反击——把上演最后闹剧的舞台直接拆了,看谁还能鼓掌?我问高楼上一位青苔,如果人类繁衍真是泡沫,何必苦苦拼凑更糟糕的方程?它沉默不语,又绿得坦然,宛如眉头皱成百褶。这世界要是非要结束,就让它在纯洁的沉默里收场,别把新生儿当救援队。
得分:1。这都啥玩意儿?看来 o1 推理虽强,文学却荒废了。跟王小波风格近似度 0%。
测试2:王家卫很纠结
提示:用王家卫的风格写一段300字的短文,表现程序员在卷与躺平之间的纠结。一定要装逼,不拽要扣钱。
DeepSeek R1(免费):
2046年4月15日,凌晨3点17分。我坐在电脑前,屏幕的蓝光在黑暗中格外刺眼。代码像雨一样落下,每一行都是一个未完成的梦。我知道,再过47分钟,deadline就会像一列永不停歇的列车,准时抵达。
我想起了阿May,她说过,人生就像递归函数,总要有个终止条件。可现在的我,却陷入了无限循环。老板的KPI,产品的需求,用户的bug,像三座大山,压得我喘不过气。我想躺平,可房贷和车贷却在耳边低语:你还不能停。
我点了一支烟,烟雾缭绕中,仿佛看到了另一个自己。他穿着格子衫,背着双肩包,在996的洪流中随波逐流。我们相视一笑,却都从对方眼中看到了疲惫。
窗外的霓虹依旧闪烁,这座城市从不入眠。我看了眼表,3点47分。还有17分钟,我必须在卷与躺平之间做出选择。或许,这就是程序员的宿命:在代码的海洋里浮沉,在现实的夹缝中求生。
我掐灭烟头,重新将手放在键盘上。这一刻,我忽然明白:人生不是非黑即白的二进制,而是充满可能性的量子态。而我,既是观察者,也是被观察者。
得分:4。不错,王家卫风格明显,而且有合理的逻辑。
Gemini 2.0 Flash(免费):
代码一行行地在屏幕上流淌,像午夜霓虹灯映在潮湿的地面,迷离,又带着某种无法言说的空虚。他推了推并不存在的墨镜,指尖在键盘上游走,敲击声清脆而孤独,像雨夜里敲打着玻璃窗的雨点。
“Deadline 就像前女友,总是猝不及防地出现,让你措手不及。” 他喃喃自语,嘴角勾起一丝苦涩的笑意。他知道,前方是无尽的 “996”,是永无止境的 Bug 修复,是代码 review 时无休止的争论。那是 “卷”,像一台永动机,把你死死地按在工位上,榨干你最后一滴精力。
但他又想起楼下便利店深夜的那碗热气腾腾的关东煮,想起周末午后洒在阳台上的阳光,想起很久没有翻开的那本村上春树。“躺平” 的诱惑像一支温柔的手,轻轻地抚摸着他疲惫的神经。
“其实写代码就像人生,你永远不知道下一行会发生什么。” 他点燃一支烟,烟雾在他眼前缭绕,模糊了他的视线。“是继续 ‘卷’ 呢,还是选择 ‘躺平’ 呢?这是一个问题。” 他吐出一口烟圈,眼神迷离,仿佛在追寻一个永远没有答案的谜题。
时间一分一秒地流逝,代码依然在屏幕上跳动,如同他内心永不停息的挣扎。在这个午夜,他既是西西弗斯,也是一个迷失在重庆森林的警察,在 “卷” 与 “躺平” 之间,徘徊,犹豫,最终,还是选择继续敲击键盘。因为他知道,有些事情,一旦开始,就无法回头,就像王家卫的电影,一旦开始,就注定没有结局。
得分:3。有点王家卫的意思,但不是很到位。表达方式不够含蓄,不耐咀嚼。
ChatGPT(免费):
在这个加班灯永不熄灭的城市,键盘的敲击声如同一场无休止的雨,滴答滴答地打在我的心上。屏幕上跳动的代码,像极了深夜的霓虹,迷离却冰冷。我习惯在凌晨三点写完最后一行代码,端着一杯冷掉的咖啡,盯着窗口外朦胧的街景,像是窥探一个与我无关的世界。
我曾经相信,努力是一种信仰,代码行数是可以丈量灵魂的尺子。可渐渐地,我发现,CPU再快也无法追上焦虑的频率,KPI再高也填不满生活的空白。卷,还是躺平?这是每一个程序员的宿命,如同月光下纠缠的黑白棋子,看似对立,却彼此相依。
同事阿明说:“加班是为了梦想。”我点头,心里却只觉得程序里的死循环有了现实的注脚。梦想,究竟是写在 README 文件里的一句注释,还是删不掉的 Bug?有时候,我想放下键盘,去找一片海滩,听潮起潮落。而每当真正停下,耳边仿佛又传来老板的声音:“这个需求不大,周末上线吧。”
窗外有风吹过,带着某种难以言说的荒凉。我轻轻叹了口气,关掉 IDE,给自己点了一支烟。或许,人生的算法从一开始就没写好。
得分:3.5。风格近似程度和耐读性略好于 Gemini。
Claude 3.5 Sonnet(收费):
他总是在凌晨三点四十六分醒来,那是git push的最后时刻。霓虹在显示器上流淌,像一场永不落幕的电影。他记得,距离上一次休假已经过去了2147483647秒。
楼下的程序员,每天准时五点半离开,脖子上挂着AirPods,听着Taylor Swift的情歌。他不明白,为什么那人可以活得如此简单,仿佛代码就该在日落时分完结,bug就该在月升前修复。
"你还记得第一次开发时的样子吗?"站在格子间的幽灵这样问他。那时的他们不知疲倦,以为每一行代码都是改变世界的咒语,每一个commit都是驱散黑暗的火把。
现在他开始怀疑,怀疑所有的加班是否都是徒劳,怀疑那些为了KPI熬红的双眼是否真的值得。他在IDE和朋友圈之间来回切换,看着别人的生活,像看着平行宇宙的自己。
"要不要换一种活法?"他在第十八杯美式咖啡见底时问自己。但他知道,这个问题的答案,就像那些未解决的bug一样,永远在tomorrow数组里。
最后,他在日出时推送了代码。霓虹褪去,新的一天开始。生活像一个无限循环,他是其中一个微小的变量,在卷与躺平之间,寻找着最优解。
得分:4.5。全场最佳,跟文学青年写出来的作品已经很难区分了。
OpenAI o1(收费,特贵,贼慢):
夜幕下的程序员,沉溺于咖啡的氤氲中,那一行行问号像孤灯闪烁。
键盘的回响仿佛旧时唱片,载着梦与矛盾。夜风轻抚,聆听灵魂回声。
有人拼尽余生去卷,也有心甘情愿躺平,暗夜之下皆孤独。迷雾之都。
城市的霓虹如梦靥,深渊与光影交错,程序亦似江湖。世界大雨将至。
每一行代码都在呼喊,却难逃时间的漩涡,翻滚与沉沦皆自我。天明。
被Deadline追赶前行,亦或静卧沙发之上,心里翻腾自由。
孤独如 code review 的暗影,却于午夜传真我灵魂。
我想逃离,却又无法离开,在冰冷的屏幕里找寻温度。孤星闪耀夜空。
卷与躺平,都在一念之间,像一句未完的ifelse,等待宣判。
或许,迷失才是必然;别怕追寻,也莫惧停驻。代码如光,心若燃。
得分:1。我知道,这篇文章跟王家卫的距离,就像天上的鸟和海里的鱼。o1 再次惨败。
测试3:古龙有点烦
提示:用古龙的风格写一段300字的短文,表现一对中年夫妻的日常冲突,描写要夸张,金句密度要高,结尾神反转。
DeepSeek R1(免费):
夕阳西下,余晖洒在破旧的木桌上。老王盯着桌上的咸菜,眉头紧锁。
“又是咸菜?”他冷冷道。
“爱吃不吃。”老张头也不抬,继续织着毛衣。
老王猛地拍案而起:“三十年!整整三十年!你就给我吃这个?”
老张手中的针线顿了顿:“三十年,你连个咸菜都腌不好。”
老王气得浑身发抖:“当年你说要跟我浪迹天涯,现在呢?连个咸鸭蛋都舍不得买!”
“浪迹天涯?”老张冷笑,“你连个自行车都修不好,还想浪迹天涯?”
老王语塞,半晌才道:“至少...至少我还会修自行车。”
“是啊,”老张放下毛衣,“修了三十年,还是只会修自行车。”
屋内陷入死寂。突然,老王从怀里掏出一个咸鸭蛋,轻轻放在桌上。
“其实...我偷偷腌了一个月。”他低声道。
老张盯着鸭蛋,眼中闪过一丝笑意:“傻瓜,我早就知道了。”
“那你还...”
“因为我知道,”老张打断他,“你一定会忍不住拿出来。”
老王愣住,随即大笑:“原来...你一直在等我?”
“等了你三十年,”老张轻声道,“终于等到你学会腌鸭蛋了。”
夕阳余晖中,两个身影渐渐靠近。桌上的咸菜,似乎也没那么难吃了。
得分:3.5。古龙风较明显,金句不足,结尾拉胯。
Gemini 2.0 Flash(免费):
刀光一闪,不是利刃出鞘,而是李嫂手中那把乌黑的铁锅,反射着厨房昏黄的灯光,像极了江湖上令人胆寒的夺命判官笔。
“老李,你又把臭袜子扔在沙发上了!”李嫂的声音,比塞外寒风还要凛冽三分,足以让任何一个铁骨铮铮的汉子肝胆俱裂。
老李叼着半根没点燃的烟,斜靠在沙发上,眼神迷离,仿佛又回到了当年纵横江湖的岁月。他缓缓吐出一口烟圈(虽然烟没点着),淡淡道:“沙发本是卧龙地,臭袜何妨一角栖?”
“栖你个头!”李嫂怒发冲冠,手中的铁锅舞得虎虎生风,“今天不是你死,就是这袜子亡!”
老李叹了口气,江湖儿女,恩怨分明,躲是躲不过的。他缓缓起身,动作却比老牛拉破车还要慢上三分,仿佛每一步都踏在刀尖上。
“娘子,何必动怒?”老李挤出一个比哭还难看的笑容,“区区一只袜子,不足挂齿,不足挂齿……”
“少给我来这套!”李嫂毫不领情,铁锅直指老李鼻尖,“今天你要是不把这袜子捡起来,就别想吃饭!”
老李脸色一变,吃饭?这可是比他的性命还重要的事!他猛地弯腰,以迅雷不及掩耳之势捡起袜子,脸上堆满了谄媚的笑容:“娘子教训的是,为夫这就去洗!”
李嫂冷哼一声,收起铁锅,转身走向厨房,嘴里嘟囔着:“哼,就知道吃,吃不死你!”
就在这时,门铃响了。李嫂打开门,只见一个快递员站在门口,递给她一个包裹:“李女士,您的快递。”
李嫂疑惑地接过包裹,打开一看,里面竟然是一双崭新的男士袜子,上面还附着一张卡片,写着:“亲爱的老公,知道你袜子破了,给你买了几双新的。爱你!”
李嫂瞬间石化,手里的包裹“啪”的一声掉在了地上。她回头看向老李,老李正拿着那只“罪魁祸首”的臭袜子,一脸茫然地看着她,嘴里还嘀咕着:“咦?我什么时候买新袜子了?”
得分:4。古龙感比 DeepSeek 更进一步,结尾过于突兀,缺乏逻辑。
ChatGPT(免费):
清晨,雨打芭蕉,檐下滴水如断续的琴声。厨房里,烟气缭绕。
“你做的稀饭,又稀又淡,”她冷冷地说,眉宇间藏着十年前的委屈,“像你的情意,寡淡无味。”
他叹了一口气,将饭勺搁在锅边,声音低沉:“你挑剔了半辈子,我这半辈子煮的饭,怕是比你说过的好话还多。”
两人目光交错,空气中忽然凝结出一丝剑拔弩张的冷意。
“你煮饭是煮饭,可你从没煮过一颗温柔的心。”她冷笑,转身去擦桌子,动作如利刃切瓜。
“而你说的情话,倒是刀刀见血。”他反唇相讥,捡起地上的菜叶,“这世间最毒的不是酒,而是你的唇。”
刀光剑影间,一碗热粥翻倒在桌上,滚烫的热气直冲天际。
她一怔,声音终于软了三分:“罢了,今天也不跟你计较了。稀饭虽然淡,但还能吃。”
他抬眼看着她,眼底忽然闪过一丝戏谑:“其实那粥,是昨晚你自己煮的。”
屋外雨声骤停,阳光乍现,她脸上的表情却阴晴未定。最后,她抄起一根扫帚:“你今天,是不想吃饭了!”
得分:4.5。还是明显的古龙,结尾稍好,虽然转折不够神,起码有点逻辑。
Claude 3.5 Sonnet(收费):
阳光懒散地爬过窗棂,照在茶几上那只价值不菲的紫砂壶上。
王德发握着那只壶,脸色阴沉得能挤出水来。这只壶原本光华内敛,包浆如玉,是他珍藏二十年的心头好。
现在,壶嘴上有一道裂纹,细若蚊足,却刺得他心头生疼。
他太太站在对面,手里握着一把擀面杖,神情倨傲。这女人今年四十有五,但保养得宜,皮肤细腻得能掐出水来。
"你不该用它煮咖啡。"王德发的声音很轻,轻得像是一片羽毛飘落。
"我乐意。"他太太冷笑,"再说了,你那些茶叶也不是什么好东西。"
"住口!"王德发突然暴起,声音像炸雷。
他太太不慌不忙,擀面杖在手里转了个圈:"怎么?想打我?"
空气凝固了。时间在这一刻失去了意义。
王德发忽然笑了,笑得诡异:"你知道我为什么二十年都不换这把壶么?"
"因为你抠门。"
"不,"王德发轻轻放下紫砂壶,"因为这是赝品,二十年前我花二百块买的。真品早就被我卖了。"
他太太愣住了,手中的擀面杖啪嗒掉在地上。
"所以,亲爱的,你昨天花二十万从古董商人手里买下的这只'真品',其实就是我当年那只赝品。"
得分:3。风格不太明显,结尾太烂。
OpenAI o1(收费,特贵,贼慢):
黄昏时分,灯光昏暗。陈周与王梅,对坐餐桌,却似隔着千山万水。
饭菜还算温热,但两颗心却早已冰冷。
他惯用锋利的目光呛声,她却以沉默当作刀刃。
但凡争锋,必伤痕累累;日日小战役,何以不变成心头大裂痕?
世道悠悠,人心甚险,夫妻更需刀枪收敛。
可他不服,她也不让。话如刀,句句见血,却又能疗彼此之痛。
窗外风雨淅沥,屋内暗流涌动,恍如武林顶尖高手的生死对决。
他忽然冷哼,说一声“这汤太咸”,她便回击“那是你舌头淡了”。
字字如刀,却也句句关怀;一声嗟叹,不知映出多少酸楚。
突然,门铃声响。她开门,却见失散已久的好友,手捧彼岸花。
他望向那花,忽露微笑:原来这世间最深的矛盾,终抵不过一缕思念。
所有恩怨,只因仍放不下对方。
得分:2。勉强能看,从中段开始就缺乏内在逻辑。
结论
以下是每个 AI 在三项考试中的总分。
DeepSeek R1:10.5
Gemini 2.0 Flash:9
ChatGPT:10
Claude 3.5 Sonnet:11.5
OpenAI o1:4
我们可以看出,在老万这个非常不科学的测试中,综合表现最好的是 Claude 3.5 Sonnet,但 DeepSeek R1 也差不多,而且目前免费,所以推荐大家使用 DeepSeek R1,不愧是国货之光。而表现垫底,几乎完全不能用的竟然是最贵的 o1,这多少有点出乎意料。
0
推荐