City Background
Article cover

一次和 AI 写作有关的漫谈

前几天,我受少数派编辑尼克老师邀约,录制了一期 Podcast,聊聊和 AI 写作有关的话题。在这期访谈中,我们提及了和应用、风格、评价、伦理等诸多写作面向,像是AI辅助写作的经验与感受、关于不同 AI 模型写作风格的讨论、对不同 AI 模型在写作等方面的评价、使用 AI 工具辅助写作的经验分享、以及 AI 生成内容对创作行业的影响及相关思考。

我们一起聊了两个小时,最后尼克老师神一样地剪辑成了一期一小时的精致内容。考虑本次讨论有一定的深度和价值,我决定请专业速录师将其整理成文字稿,以供读喜欢文字内容的读者参与讨论。

暖场

尼克: 各位少数派播客的听众朋友们大家好,欢迎大家收听最新一期的节目。好久不见,过年后我们就没有更新了。今天我给大家聊一期是我一直以来都非常想聊的一个话题,而且今天我们的嘉宾刚好也有这样的兴趣和冲动,和我们一起聊一聊。那今天我们要聊的就是 AI 的辅助写作。

大家都知道少数派本体是一个以图文写作为核心的平台。所以我们编辑部近期遇到的最大的问题,是我们在讨论某某作者投来的文章太有AI感,导致我们不愿意给他通过新手上路或者文章的审核。我们也想跟我们的作者螺丝老师一起来聊一下这方面的内容。

我们先请螺丝跟大家打个招呼。

螺丝: 大家好,我是你们的AI博主螺丝!咦?莫名其妙地从心理学博主变成了 AI 博主。

尼克: 之所以有这样的一个搭配就是因为螺丝近期在大量地用 AI 写作,积累了很多经验,这让我非常得感兴趣。虽然我平时也用 AI 来辅助写作,但我用得还比较基础。基本上都是改错别字类的或者是生成我不想写的,比如说小红书推广文案这种东西。但螺丝已经把他的这套工作流附着在 AI 之上了。从小的改错别字,改一些语气,到大的可能辅助他的创作,都已经在用AI工具了。所以我觉得这里面有很多东西是可以聊的。

我想先从最基本的一些问题出发,来问一下螺老师。首先第一个问题请你评价一下,你用了这么久的 AI 辅助工作,你现在是什么感觉?

螺丝: 这个话讲起来可能就没啥劲,我就没啥感觉。

尼克: 没啥感觉是啥感觉?

螺丝: 其实我以前不太能写明白文字,ADHD 是这样的。可能不同的 ADHD 的症状可能不太一样,但我这一型的 ADHD 的症状就是,我说话和写作的时候会呈现一种片断的状态。你看早些年没有 AI 的年代我写出来的文字,和我用AI写出来的文字之后,有非常明显的区别。在不用AI的情况下,我写出来的文字经常都是支离破碎的,都是一句话、一句话地瞎蹦,而且很容易在一句话里绕圈圈,或者是两句话之间的衔接变得怪怪的。

有了AI之后我相对来讲会能够把我的注意力放在怎么样去控制文字的逻辑流动上。但具体的执行细节,就不需要把得那么深。那个东西是我控制不好的,也控制不了的。

那么我为什么不找个轮椅坐上去呢?如果我不能下楼走路了,但是又要去做一点什么事情 ——我有表达的欲望、想写点什么东西——那我就找一个轮椅,这个轮椅就是各种各样的 AI 模型。

尼克: 我听上去,你在两个层面上对AI的评价都是蛮高的。第一,你觉得它确实辅助到了你的写作或者你的工作。第二个你刚才有提到,你觉得 AI 这个东西进来之后非常得无感。我觉得这也是一个很高的评价。

大部分看到的,比如大家关于当下 AI 的,生成式 AI 的这种讨论,其实都还是有感范畴的讨论。比如说最近火的吉卜力风格的文生图,还有各种乱七八糟的之前的比如什么 deepseek 火了,还有再往前的 ChatGPT 火了。大家都会觉得,它是一个讨论的话题。我一定要有事没事找点事让AI给我干点活。但你说的这个无感让我觉得它很自然地融入了你的工作流,这在我看来反而是一个更高的评价。

螺丝: 因为这个东西出来已经有一段时间了,从 ChatGPT3 左右的时候就有了一个免费的在线服务。我是从那个时候就已经在用 ChatGPT 来写作和写代码了。对我个人来说,那个新鲜劲已经过了。用到现在只是觉得,它比以前犯白痴的次数少了。但是 so what?我没有一些额外的诧异感或者是惊喜感:只是它能做的事情变多了一点点,然后又多了一点点,但是那一点点好像又不足以让我特别得惊诧地说「哇它好棒哦」。R1 出来的时候我也觉得,好像文笔好了一些,但是事情不还是要自己来做。

回顾 AI 写作的发展

尼克: 回到你最早接触这种生成式 AI,并且你开始拿它写作的时候,你还记得当时你的感受吗?具体使用的过程大概是怎样的?

螺丝: 我最一开始用 AI 写作的时候,它更多的还是启发我,有的时候我要写一个东西。不知道你写的时候有没有这个感觉,在构建一个论述的时候,有时候被卡住,这个话不知道该往下怎么说了。

尼克: 脑内你知道你想要说什么,但具体用文字怎么表达,你是不确定的,你是这种感觉吗?

螺丝: 可能我脑内都没有想明白,只有一种大概的感觉,但那个东西就可以被称之为其实你不太知道你想要说什么。大概有一个方向,你知道什么是对的,但是你不知道那个东西具体是什么的时候,那时候我有可能让 AI 帮我写一点东西出来,我大概写到这儿了,但是我不知道接下来应该怎么办了。它可能会给我一些可能的选择,我会觉得哪个东西大概我要的那个方向,然后我会去亲自沿着那个方向写。但在那个年代,其实你不太能够完整地把大段的写作交给它。因为它写出来的文字风格非常得版,不自然。

尼克: 所谓的AI味?

螺丝: 它的风格非常非常得清晰。比如说一开头就是「想像一下」、然后「不但是…… 更是……」。这是一种很英文的写作思维,被套在了中文的上下文上。一般情况下,中国人不这么说话,我觉得可能因为模型的训练语聊里有大量英文语聊造成的。如果它写的是英文,你会觉得它很自然,但是如果写的是中文,你就觉得哪里怪怪的。

比如说你写英文的话,你可能会用「Imagine that」开头,这很正常的。但如果你中文也这么写,就会觉得我好像没有见过谁这么讲话。

尼克: 什么时候你觉得它由所谓的量变到质变或者写作风格上变成熟了,你觉得是哪个产品或者什么时间段?

螺丝: Claude 3.5。

尼克: 你是怎么觉察到这点的?

螺丝: 我觉得它的写作的风格没那么强了。可能有些人会觉得很奇怪,一般情况下风格不应该越强越好。但是我个人觉得文字的风格特别是 AI 写出来的文字,它的风格应该是越弱越好的。因为它没有自己的风格的时候,你往里边缝自己的风格,去加自己的东西会比较有空间。一旦那种特别张扬的个性出来了之后,你要改那个文本的时候就会变得非常得麻烦。

我个人觉得 Claude 3.5 这个模型出来了之后对写作的帮助是最大的,但 3.7 就不行了。所以我现在会用 Poe 去调用旧模型。因为官网 Claude 的 3.5 已经不能免费用了。虽然明显感觉 3.7 的确在写代码方面更强了,但是在写作上面就让人觉得这模型很难驾驭。

工作流

尼克: 我觉得我们在这儿可以先梳理一下,你用AI工具写作的大体流程。你写一篇文章,你的工作流程大概是怎样?到什么情况下你会让 AI 介入进来?

螺丝: 我的工作流程发生过很多次的变化,但最近的最新版本的,可能是螺丝 V4.0?(笑),是这样的:

我依然还是相信我自己,大量的稿子还是我自己要去写。我在写之下我大概会花 3、4 天的时间,先在脑子里过这个东西。「过」是什么意思?就是我要不停地去从头开始想这个东西要怎么讲,而不是从中间开始,跳跃式的构建观点。每一次都是从头讲一遍。然后讲到哪儿卡的时候,去想这个地方怎么讲是顺的。这个地方想通了之后,再从头顺一遍,顺到哪里,卡了,然后停了,不行,然后再重新想。直到把整个论述讲通了之后,我才会把它诉诸于文字。

落笔搓文章还是我自己来写的,因为我要控我自己的风格和问题的逻辑发展。但写的时候还是会卡在笔头上。虽然在脑子里已经想得「挺清楚」了,但是真正落在笔头的时候,做论述链条的发展的时候,会发现很多地方不太好执行成文字,这个时候我就会把这部分喂给 AI。甚至有的时候我甚至还不知道我正在面对的问题是什么的时候,我就会对 AI 说「ok,我说到这儿了,你续写一下,我看一看。」。

这个时候我会打开一大堆模型网站,比如 Gemini、Claude,在 Poe 里面可能再随便捡几个模型,然后大家一起写。然后根据所有的结果来审酌,接下来可以往哪个方向发展。但因为我有我的一个论述方向,我会找哪个东西最适合我的论述方向。找到了之后把这个东西剪进来,有的时候可能是复制粘贴进来,然后去修一修。大概是这样的一个流程,不断地由我和 AI 交互发展,把这一篇文章执行完。大多数的情况还是我在写,但是中间有一些东西我会交给 AI。

但也有例外,比如「举例子」,这东西谁举不是举。比如举一些脑科学上面很经典的例子,比如盖奇的实验,三重脑假说,那个都是交给谁说不是说,这个时候我可能就会交给 AI。有的时候我的读者就会过来质问我,这个地方是不是 AI 写的?我当然会说「是」,我甚至修都没有修,何必去修?我没有打算掩盖这件事情,你交给谁写不是写。

第一遍从头初稿写出来了之后,接下来要改稿。有的时候可能发现有些逻辑没有处理好,而且是自己处理不明白的那种,这时我就会把逻辑断掉的地方剪开,前面一段、后面一段,中间打一个省略号,然后扔给 AI。告诉它这个地方,中间你帮我填点东西,想办法把这个逻辑抹平了或者想办法把这个逻辑接顺了,它就会给我一些很好的启发,这时候 Claude 非常非常好用。

这有点类似于长头发的女生可能会经常玩的一个游戏——顺你的头发,你可能会发现这里有个小结,那里有个小结,你可能会想办法把那个结剪掉或者是揪掉,差不多是这样的一个过程。直到你把文章修理成了「一头柔顺的长发之后」,写作任务就结束了。

螺丝 V2.0 和螺丝 V3.0 的年代,我可能会直接把大纲扔给 AI,让 AI 帮我写。然后我再从里边去捡能用的东西,不断地复制粘贴和细部处理。但是我总觉得,随着脑子里面的画面和写作手感起来了之后,你会发现这么做效率反而变得很低。因为要花很大的力气去处理每一个 AI 自己的文字风格和怪脾气,让人觉得很累。

尼克: 可不可以理解为在那个时代 AI 写出来的大部分还是你不需要的?

螺丝: 你只是从大量的输出当中去找你需要的部分。我最夸张的一次让它生成 40、50 篇文章。因为我那段时间睡眠很不好,但是有表达欲,想写。自己写不出来的时候,就想硬写。怎么办?AI 写出来好几十篇文章,从里边一个句子一个句子去摘,摘出来了之后自己去缝,缝往了之后再往下顺,然后再去处理。写完了之后我想一想何苦。

尼克: 我想到一个有趣的问题,我们传统写作当中会有一种工艺的满足感或者叫构建的满足感。当你把脑子里的碎片用键盘敲出来或者手写出来组合成一段文字一篇文章的时候,你会有那种我构建了一个东西的满足感。当你从 AI 的这种 block 的片断里面去剪你适合的这些片断或者句子,你把它凑成文章的过程当中你会有类似的或者相同的满足感吗?

螺丝: 我会把这种东西理解成一种「哆啦A梦」感——你把想像当中的一个东西变成了现实。 yes,是有的。刚写完之后读整篇文章,会有很明显的「多巴胺起来了」的感觉,满足感很强。第二天你再看的时候,可能还是感觉良好:「我竟然能写出来这样的一篇东西」。但是第三天的时候就不会了,我会觉得很糟糕:「事情怎么会变成这样,我怎么能写出这种东西,这根本不是我,我怎么能做这样的事情」。那种感觉很失落也很羞愧。

我之前发的一篇文章其实就是这么搞出来的。那文章根本就没有讲清楚,我只是沉浸在「完成感」之中。从学术上来看,这依然是一篇好文章,但是我依然会觉得原本能做好的事情其实并没有做好,这时候会有很强大的失落感。

尼克: 可不可以这样说,你好像抄袭了一篇文章,带着你的名字发了,但真实的作者并不是你?或者这篇文章是你爸写的,但是以你的名字发表了,投给了一篇作文然后还获奖了。你作为作文的获奖者去领奖了,从此之后荣誉都是你的,但事实上你知道那篇文章的作文是你爸?

螺丝: 这里面还有一点不一样,我觉得这里面有很微妙的不同。我在那篇文章的写作上面也付出了很多的精力,我依然是坐在电脑前面写了一整天,也有很多我手调的部分。最后会觉得失落的原因是,最后的产物根本不像是我写的东西。那种感觉是没有认同感或者一种没有归属感的感觉。

我为什么在挑模型的时候会挑文字风格没有那么强的模型来去做的原因就在这里,因为你比较好驾驭它,你可以很容易地去 tune 它的时候,你自己很擅长的那部分东西就更容易被融合进去,没有一种你被 AI 附身的感觉。无论写代码还是写文字的时候,一旦你脑子是不清楚的,你就开始被 AI 附身,你就会开始表达 AI 想表达的东西。AI 本身是没有意识的,但是你去「摸它」的时候,你的意识就变成了它的形状,那个感觉很恐怖。

尼克: 我又想到了另外一个点,你刚刚提到的表达欲的满足感。从头到尾都是由我原创或者由我自己主导原创的一篇文章和通过 AI 挑挑拣拣的文章,在满足你表达欲的过程当中有什么区别?

螺丝: 它依然满足了我的表达欲,因为我想表达的东西还是表达出来了。

尼克: 所以你觉得差别不大?

螺丝: 没有什么太大的差别。依然是 9 千 1 万字,也不算很短的文章也出来了,那个多巴胺的分泌没有差很多。你在付出了努力的情况下,当然你如果不付出努力,真的以像大学生对付期末作业的那种方式去写,我猜你们每天应该是能看到大量的作者向少数派投稿这种东西,有点类似于对付作业那种AI,我觉得那个是不一样的。

你经历了磨难、经历了努力收获结果,就会分泌多巴胺。哪怕是用 AI 写出来的东西,从里面捡也是蛮无聊的。忍过了这段「无聊」,得到了 bling bling 放着光的东西,任何人都会觉得很爽。

几个模型的使用体验

DeepSeek R1

尼克: 你说容易修改的文风或者是没那么强烈风格的文风。在我的理解,它应该就是一种很一板一眼,议论文而且是那种小学标准议论文范文风格的东西?

螺丝: 对。比如,它们特别喜欢列条目。小学范文甚至还没有这种做法。每个条目前面都有一个加粗的标题,有一个冒号,说话也是一条一条地在说。有的时候,它这个逻辑咬得还不是很严密,特别是那种上下文很短的模型,它输出出来的东西可能并不是围绕一个逻辑线条在展开的。虽然有一个结构,但是那个结构看起来也很松散,它看起来就不是一个流畅的和逻辑通顺的文章。我的理解,它只是面上,形式上看着有逻辑,但是你如果真去硬抓它,就会发现它只是在堆积,在生成。

尼克: 这种文风是刻意训练出来的,还是受我们自然语言影响。大家现在看到的大部分的文字,尤其是在网上的这种文字,首先是议论文为 base 的文体的,受科技写作的影响或者科技 blog 的影响,最后出来的结果,整个互联网上不管是中文还是英文,大家在说事的时候整体的基本文风都是这样的。你觉得 AI 现在表现出来的基础的写作的风格是刻意而为,比如开发人员 tunning 它的时候,让它保持一种客观中立,还是本身投喂的这些素材语料就是这种风格,导致它也就会这么说话?

螺丝: 我觉得不是语料的问题,可能还是训练过程中做了一些什么。模型本身训练过程是有偏好的。我们很难想像,比如 R1 的输出有一些很重要的特点,很显著的特点,古罗马、量子力学、辞藻特别得华丽,但是你去深究的时候,你发现它经不起推敲,还有很严重的幻觉。这样的一些文风绝对不是互联网上常见的这种风格。我觉得可能还是开发者会有自己的偏好。我感觉还是调的那个人的手艺问题。

尼克: 你能解释一下你刚才举的这几个例子吗?比如古罗马、量子力学、辞藻华丽,大概具体表现在 R1 的状态是什么样子的?

螺丝: 用R1生成出来的,尤其是你想办法让它议论一件事情的时候,那个里边一定会有古罗马哲学,特别是你给它的写作任务相对来说社科人文一点。

尼克: 它会刻意引用古罗马的一些哲学理念或者文字?

螺丝: 对,它会刻意地去说古罗马哪位哲学家说了什么什么,甚至不是古罗马哲学家的,它就一定会往那个地方去套。

尼克: 听上去很像小学作文的模板?

螺丝: 对。

尼克: 古人曾经说。

螺丝: 量子力学也是。有一次我印象非常深刻。我的硕士是脑科学,所以我会写很多脑科学的科普。有一次我让它帮我去处理一段脑科学科普的时候,它就开始扯到了量子计算机。它说量子计算机里出现了某种脑波,出现了某种波动,这种波动和人的大脑当中的某种波动是耦合的,然后就开始赞颂这种波动。我说这个东西写在高考作文里应该是蛮唬人的。但作为业内人士来看,一看就是在扯。当时我心理还想给它一个机会,万一人家说的是对的。因为我已经脱离学术界很久了,说不定这是最新的成果。但后来一搜,无论是拿中文搜,还是拿英文搜,都没有这回事。

尼克: 它编的?

螺丝: 对。它会开始瞎编,而且是往量子力学那个方向去编,我们平常人不会这样说话。有一次非常离谱的是,我让它帮我整理一份统计学的笔记,讲「自由度」这个概念。它也往量子力学上去扯。当看到量子力学那四个字的时候,我就把那个窗口关掉了——完了,这篇文字没法看了。

尼克: 听上去,DeepSeek 有一种刻意宏大叙事的倾向?

螺丝: 是。

尼克: 比如它会把它的论述方式刻意地拔高到古罗马哲学的这种程度,如果是现代科学,就要往量子力学这种最高的物理成就上去引导?

螺丝: 对。而且它是一定会往这两个方向去走,它没有第三条路,这是非常奇怪的一件事。我觉得这个一定是训练的人的手艺活。他在训练的时候是不是刻意在往这个方向上去强化,不然怎么会呈现出这种非常古怪的样子。

尼克: 你在讲这段的时候,我自己的感觉是,听上去这个风格会非常像我们小学的时候,老师在进作文范文的时候的写法,你一定要起一个很高的头,把你整个的建构架得很高,多引用名人名言,多引用一些理论来增强你的说论的可靠性。实际写出来的结果非常空洞,充满了像你说的古人的名言或者是高深的理论,但事实上它没有什么实际的可执行的可操作的内容,可操作的空间,很像初中、小学讲议论文的写法的状态。

螺丝: 应试作文题是可以撒谎或者你是可以写假的东西。因为考试考的是你构建逻辑链条的能力或者你论述一件事情的能力,它不太在乎真实。但我们在写少数派的文章的时候或者我们发自己博客的时候,我们是要为这个观点负责的,所以你不能那样搞。

尼克: 反过来 DeepSeek 就是在完成你给它布置的作业?

螺丝: 对。它在写应试作文。这句话讲出来有点政治不正确,但是我觉得,一看就是中国训练出来的模型,完全经历了应试教育的洗礼之后,非常专业的写手也出来的东西。但实操的写作上面是不可以这样做,这样的文字是不能直接用的,甚至根本用不了。因为文本的肌理已经是那个屌样子了,怎么去修也修不回来。

尼克: 因为我不用 DeepSeek,所以我不确定,有这种强烈的感觉的目前只有 DeepSeek是这样的?

螺丝: 当然我用的没有那么广,我现在主要在用的是Grok、Gemini、GPT、Claude,剩下的就是 DeepSeek。像通义千问或者豆包,我没有在用。我的感觉是只有 DeepSeek呈现出来这样的风格。而且很有趣的是,V3不这样,或者出现这样的情况很少。但 R1 的推理模型就很容易出现这个问题。

尼克: 听上去这个事情就更加玄妙了。在我们看来推理模型是一个理论上应该更聪明一点的,因为它加了一套逻辑的逻辑线,但也不排除,因为它要装作自己懂逻辑的样子,所以它或有意或无意地把自己的文章写成这种应试作文的格式?

螺丝: 有可能。当然在这里我还是要澄清我没有说它不好的意思,这个模型用于写代码还是挺好用的。特别是我在写一篇文章的时候,我想在某一个地方加点情感、想故意让一个地方看起来比较跳脱一点、或者多着一些艳丽的笔墨的时候,R1能够起到非常非常好的效果。但它不适大段的正儿八经的文字。一块一块去写小的内容,没有问题。但如果你把整个写作任务扔给它,但凡超过一个自然段,这个事就不行。

尼克: 我有观察,大家最近讨论很少具体地谈比如说这种 AI 工具在某些具体的领域的功能性的对比,大家对比的点都是很宏大叙事的东西,比如对产业的影响,AI的技术路线,或者在 benchmark上谁比谁领先,算力、算法、中美战争,谁能引领未来生成式AI的节奏和风潮。

螺丝: 对,什么「国运级」模型,我看了真是头很痛。

尼克: 具体到实际的使用,比如你写科技博客,哪一个更好用,或者你写代码,哪一个更好用,或者你是做海外出海电商的,这种中文转英文的互译,哪一个更好用。大家没有这方面的对比。所以我们来弥补一下这部分的空白。至少从我们科技项或者论述项写作的角度去锐评一下,还是挺不错的。

螺丝: 我的结论是,我们不看纸面的 benchmark,我们只看写出来的文字的质量,Claude 3.5 绝对是最好的。

尼克: 接下来锐评一下 Claude,因为我收到的反馈,大家都普遍认为 Claude 的文字能力特别强。在你看来它的强强在哪里?

螺丝: 如果用雅思的那个评价文本的方式来讲,它输出的是很完整的一段文字,它会给你足够多新的观点,这是Claude模型很擅长做的事情。它会给你很新的观点去启发你,它输出的文本又没有很强的风格,你又很好地能去驾驭它。你可以很容易地往里边插你自己的内容和你自己的思考。这对我来讲就是一个好的模型。3.7 就没有,我严重怀疑 3.7 的训练语料是不是加了一点 R1 的输出,它的输出的东西看起来特别像 R1。唯一不一样的一点就是它没有古罗马和量子力学。

尼克: 像的部分是什么?它论述的方式也开始虚头巴脑的大框架?

螺丝: 对。论述的方式和结构,讲话的腔调开始变得很像 R1。3.5 没有,之前大家对 3.5 的评价都很好,认为它是温润的、谦逊的、能共情的,情感是柔软的。但 3.7 有点应试作文的感觉了,但又没像 R1 那么过分。不过,真写作的时候,我下意识不会去用它。都不是说我主动去用它,而是下意识的。

我想要做一件事,一定会根据我自己的经验去挑我觉得最好用的。比如翻译,我最常用的就是 Grok 那个模型,它的确好用。我要去润色的话,我下意识地可能就会用 Gemini 2.5 或者 2.0 的那个思考模型。我用什么写作任务我都不会下意识地去用 Claude 3.7 因为我实在没有办法接受那个东西输出来的文字语料或者它不会减少我的工作量,反而会增加我的思考,让我变得很累,去处理很多文字。

尼克: 这个蛮有意思的,它曾经是你评价最高的,但现在又是你评价最低的?

螺丝: 3.5 还是很好的。如果你要写文字,你用 Poe 网站上面还可以调 3.5 的模型,也不要钱,也还挺好的。除了用量比较吝啬之外,剩下的都没有什么太大的问题。

Gemini

尼克: 接下来聊一下 Gemini。这也是评价起伏比较大的一个模型。我之前也开过几个月的谷歌的 Advance,用他们最新的 pro 版本的模型。我之前的感觉,在我还在用的时候,它偏科非常严重。它会的那个部分,擅长的部分可以给答案给得很好,但是它傻起来真的非常傻。它基本的语义都理解不了。比如我发一句话,接下来给我翻译。它说好,你有什么东西可以发给我,接下来我再发给它如果是一个问句,它就开始回答我的提问了,它完全不管前面,一句话之前我是让它翻译这么一个语境,非常得荒诞。比如我们有一个需求给中西文之间加空格。我把这个需求发给它,发给它一段,它给我所有中文和中文之间加一个空格。当它发挥正常的时候,它的反应速度还是挺快的,它的文风也没有特别的倾向,我觉得都是 ok 的。但它傻起来就过于傻了。最近它升级了之后,很多人给它的评价也很好。我有看到过,这是目前用过最强的生成类模型,看过这样的评价。我不知道你是什么感觉?

螺丝: 我大量地用 Gemini 2.0 和 2.5 去做过翻译工作。我只讲翻译工作的话,它很强,非常非常强。你让它做翻译,它会主动地给你提供各种各样的思路,去引导你怎么样去思考这个翻译。我觉得文字的质量没有太大的问题,特别是2.5。但它非常容易,莫名其妙蹦出来一段俄文。

尼克: 川普通俄铁证。

螺丝: 我不知道那是不是俄文,但是它是一段西里尔字母,有点类似于Claude早期会中英夹杂。

尼克: 其实就是中文没有训练好,所以它硬翻译过来。

螺丝: 对。但写出来的东西没有太大的毛病。基本一看,大概是这么回事,也能给我一些启发,虽然不像 3.5 做得那么好。虽然没有思维链的模型可能有点蠢,上了 CoT 之后,我觉得还不错。

尼克: 翻译这个确实是。我早些年很长一段时间是用 Gemini 去做语法分析的,给长难句让它去解析,它解得确实是最好的。但它在那个状态下,确实也有类似的问题。我前面也有聊到,比如我上一句让它干一个什么,让它以后都这么干。就像没有语境一样,它只能记忆一次或者是一步。比如我有一个通用的 Prompt,大概意思是让 AI 帮我,当我发给它中文的时候,它翻译成英文,我发给它英文的时候,它翻译成中文。如果我发给它的是美式英语,它要把它改成英式英语,并且告诉我英式英语和美式英语,这个句子里用到的那些区别的点。如果我发给它的是英语的句子,它要在翻译的同时做一个语法分析,把句子的主干结构拆出来。大概是这么几句话,类似于bullet的几个条件。

目前完成最好的肯定是 ChatGPT,很长很长的文字,都还能记得我老早前跟它说过的这个 Prompt,最差的就是 Gemini。它就像一个失忆儿童一样,两句之后,它就不记得自己该干啥,就开始胡说了。

螺丝: 特别像一个ADHD是吧。

尼克: 对。不知道它现在怎么样了。因为我最近没有在用了。因为吉卜力风格出来之后,我最近在大量地搞图片转各种风格的玩意。我开了 ChatGPT 的会员,所以最近主力都是 ChatGPT 了,我就没有再用过其他的。

我觉得下一部分我们可以聊一下 AI 的能力。在你用过这么多 AI 的大模型之后,你觉得当下的生成式AI不管它带不带推理,或者它版本的表现,benchmark 怎么样。在你看来 AI 擅长或者不擅长的东西,目前它们的能力点分别在哪个方向?或者更具体一点,当你在写作这些东西的时候,在用这些AI工具的时候,你会刻意地用AI的哪些能力或者刻意规避 AI 的哪些表现?

螺丝: 我觉得AI特别不擅长的是文风的模仿。当然你说小红书,一句话里面插好多个 emoji,那个东西不是文风。某种程度上,那个东西更像是写作的一种特别奇怪的写作技术。但如果想要让它像你写文字一样去写,它其实是做不到的。它依然会回归成它的那个样子,你用 R1的话,依然会给你古罗马,量子力学。

它为什么不擅长?可能是因为你也不知道自己的文风是由什么东西构成的。大概率这个世界上也不会用人去总结你的文字风格是什么样的,或者你的写作习惯。比如你喜欢用词的方式,你发展一段逻辑的方式,这个事有时候是很难以分析和表达的。你如果已经能够分析和表达出来,那你大概率也不需要用AI来写了。

我个人的感受是它很不擅长去维持你的风格,特别在修稿的时候。我以前试过,我写过一两万字的文章,ADHD 大爆发的时候写的。甚至写作的过程当中也没用 AI,写出来的东西磕磕绊绊的,全部都是逻辑打弯和错别字,语病。这时候我交给 AI 修稿,你在维持文字风格的情况下去修,它做不到维持文字风格,只能用它的方式再去叙述一遍。

尼克: 即使你把你的素材,你的上下文投给它,喂它,让它模仿它也模仿不来?

螺丝: 对。它也不知道你的文字风格是什么。可能因为那时候 CoT 还没有出来。我不知道现在是什么样。说不一定现在用 CoT 也能做到,但是我对这个事有非常大的怀疑——它不一定能把这个事推理得清楚。因为推理并不是为了解决这个事而诞生的,更多的是为了解数学题。

如果你自己的文字风格特别明确,我觉得你最好不要放下你自己的文字风格。我的读者有跟我抱怨过你写的文章有时候会失去你的风格,这个是很要命的一点。

我个人觉得它很擅长的一点是衔接、逻辑的处理、观点的发散、观点的收束。你的推理链条处理不明白的时候,你交给它,它大概率能给你处理明白,它 100% 是干这个事的。比如整理资料,比如,谷歌的 research 模型简直是所有 research 模型里最好用的。你让它根据某一个事情帮你调查一下现在主流的状态是什么样的,你如果自己去查,一下午就没了。但你如果给它,可能十分钟它就把观点给你整理好了之后,你很容易以它为起点去往下走。它能够很好地帮助你从零到一,但从一到二的过程还是得你自己走。

风格

尼克: 你说到刚才风格的问题,我也有类似的感觉。乍一听可能大家会觉得这种生成式 AI 还挺擅长模仿人类的文字风格的。因为有一种玩法就是让你模仿鲁迅的语调写一段文字或者模仿某个名人的说话方式写一段文字,初看之下,AI写出来的东西确实挺像的。尤其文学上的模仿,比如你让它用一种文白夹杂的满清小说的风格,让它写,或者让它用一种很现代的风格写,它都是能写出来的,甚至翻译腔之类的,稀奇古怪的,它确实能写出来。但当你用多了之后你就会发现内里的写作的思考方式是完全一样的。就像螺老师说的这种感觉。如果你让它用鲁迅风格写三段文字,你就会发现内在写作的东西是一样的,明显是在盯着鲁迅的那个风格在抄的,你能感觉到它那种模仿和抄袭的痕迹。它并不类似一个人,真的发自内心地,从一开始写作就有这样的文笔,有这样的风格,它并不存在这样天然的东西。我觉得这是一个挺有意思的观察。

螺丝: 对。很常见的提示词模板是「你是一个什么专家」,这个时候 AI 确是可以像模像样地以那个专家的方式去做事情。但你说它以一个什么样特定人的风格说话,它做不到。现在任何一个模型都做不到。

尼克: 或者让它不是以模仿,而是以自然的状态,它没有那种自然的感觉,很明显它是在模仿。

螺丝: 你看多了之后大脑里就会有一个神经紧绷,里面就有一个铃,一看到某一个文章的时候, 5 秒之内,你就能很快速地鉴别出来这篇文章是不是AI写的。

尼克: 我们说到今天要聊的一个关键点,就是 AI 味和人味之间的区别。我们接下来可以聊一下这个事。你也用 AI 写过这么多东西,你也读过 AI 写的东西。在你看来到底怎么判断一个文章到底是 AI 写的还是人写的。人味和 AI 味之间的区别到底在哪里?

螺丝: 这更多的是一种感觉。刚才咱们有聊过AI写的文字有很明确它特别爱用的词和表达方式。那种表达方式是英文的表达方式,硬套在中文上的。

尼克: DeepSeek是一个中国团队用中文语料训练的大模型,它在写的时候也会有翻译腔或者转译的感觉吗?

螺丝: DeepSeek 是另外一个问题,它的确没有翻译腔没有转译的问题,但它最大的问题是古罗马量子力学,味道太浓郁了,你一看就看得出来。

尼克: 它走向了另一个极端,过于中国式传统教育了?

螺丝: 对。DeepSeek 的文字风格很明确的就是宏大叙事,特别宏大叙事。我感觉没有中文写作经验的国外的人工智能团队听说了 DeepSeek 火了之后,他们的语料里面绝对是混了 R1 的输出内容。所以 Claude 3.7 和 Gemini 2.5 的输出也开始沾上这个味的。我用的时候我就很难受,我觉得以前的模型不是挺好的。我知道可能推理能力没那么强,但有一说一,写作不需要那么强的能力,或者是不需要那么强的纸面能力,就像以前那样说话,不挺好的,咱们之间的相处也是挺愉快的。但为什么睡一觉醒来你就变了,你怎么变成了这个样子,我不认识了。

那个感觉就是觉得很诧异。最早的模型,大家的输出全部都是 ChatGPT 的味,就是英式表达。现在特别近的这种,带推理链的模型的输出的风格味道马上就变了,新的模型宏大叙事非常得多。

有一次我印象非常清楚,群友贴了一个链接进来,我没读到底,我扫了一下第一段,一看就是 R1 写的。我说对了一半,确实是 AI 写的,但人家说是用 Gemini 的最新模型写的,用的不是R1。挺可惜的,以一个作者来讲,我觉得大家没必要这么作践自己的模型。但说这事已经来不及了。

尼克: 我聊这个的时候想到一个反向的案例,你有没有发现很多人开始写得越来越AI味了。这篇文章真的是他自己写的,但是他的行文逻辑和文笔就很像机器翻译过来的或者是用英文的语法写的中文。

螺丝: 对。的确是会有这样的情况,这个不是令人诧异的事。有一些外文系的学生讲中文的时候,有也可能会有一些非常古怪的倒装,浸在那个语言环境里时间长了之后,思维就会被拧过去。

现在的简中互联网里,哪怕你没有亲自用 AI 写过东西,日常所阅读的东西大量都是 AI 生成的部分。在这种情况下,你的文字风格的确会发生变化。特别在对自己的文字风格没有觉察的情况下,更容易丢失自己的文字风格,这事是完全没有办法避免的。中文写作可能还好,但英文写作就很麻烦了。因为英文老师很贵,所以大家开始用大语言模型教自己怎么样写英文作文。这个行为本身是没有错的但是你写出来的英文的确会变得 AI 味越来越浓。

尼克: 我记得GPT刚火就有大量的大学老师在投诉这个事,他们的学生写的都跟AI生成的一样。

螺丝: 我觉得大学老师也是不知足,至少它说出来是人话了。在没有 ChatGPT 的情况下,我见过大学生写出来的文字,一看血压就很高,因为他通篇没有在说人话,主谓宾都不全。

尼克: 可以讨论一下我们有预设的一个问题,或者说我们预设了一种理想情景,存不存在一种情况,人类向 AI 学习写作。在 AI 辅助写作的过程中,比如我是一个新手,我可能有表达欲但是我确实不会写。我一开始一半用AI生成,一半自己写,通过跟 AI 的反反复复的生成、修改、引用,我去模仿学习,慢慢地在AI的带领下,我学会了写作,是否存在这种理想的状态?

螺丝: 我觉得是存在的,但这个东西一定有一个实现路径,或者要有一个很谨慎的「对你好」的方法论,而不是「把活完成了」的方法论。有助于你个人发展的方法论和帮助你把活完成的方法论可能会呈现出来截然不同的样子。

帮助你把活做完的方法论,就是你网上能够找到的各种各样的提示词大师、AI大V、AI博主、 AI YouTuber,会给你各种各样的提示词,告诉你把这个魔法字符加上去,再问问题,你会得到很好的答案,这个是帮你把活做完的方法论。但如果我真的想要让那个东西变成「我的」,我想有更好的表达,做事情的方法会变得截然不同。

在我看来或者我观察的很多作者,为什么写不出来好的文章是因为他根本不知道自己想说什么。他们虽然大概知道我想表达的东西是什么,但那个东西非常非常得模糊和模棱两可。所以很多时候,并不是你的写作技术出了什么问题,甚至我觉得写作技术并没有那么重要,最重要的是需要有一个办法或者你需要能够完整地知道你自己的想法究竟是什么。

这时候 AI 就能起到作用。在写作前期,如果你真的不知道自己想说什么,还想表达的话,可以先用 AI 把想法理清楚,之后我觉得很多作者,大概率就不需要用 AI 了。写作的时候,为什么你会感到沮丧?为什么会感到写不出来?我认为,原因在你不知道自己究竟在想什么。那个其实并不是「写不出来」,而是你「根本不知道自己想说什么」,「提不出来问题」才是最可怕的。一旦明晰了自己想说什么,表达就会是流畅自然的。哪怕文笔拙劣一点,但我觉得只要论理的逻辑清晰,就没有什么问题。但怎么样让你的论理清晰,这个事交给 AI 教你的效率没有一个哲学训练或者写作方法论的书能够教得快或者成体系。

最简单的办法,你去考一个雅思。你不用非得把雅思的作文考到 7 或者 7.5。你只要奔着 7 和 7.5,写 40、50 篇,大概就知道怎么样去论述了,然后你再回去看你之前写的东西会发现以前写的东西都是什么怪玩意。一旦基本的思维的方法论构建起来了,A I能帮助你的事就比较明确了。

你可以提出来一个关于写作很明确的问题的时候,AI 才能真正地有效地帮你写作。不然就是 AI 在用你的身体在写东西,那个感受真的是非常不好的。

写作伦理

尼克: 我觉得聊到这儿其实就涉及到前面刻意没有在聊的东西,就是关于 AI 伦理的问题。我到底怎么定义我的存在或者当我和 AI 在写作的过程当中,我所扮演的作用到底是怎样的?可能具体表现在一些实际问题上,假设还以写作这件事为例。我要写一篇文章,这个文章里的观点、思想全是我投给AI的,都是我让AI想讲的。但整篇文章写,全部是AI自己完成。这篇文章到底还算不算我的文章,或者这还是不是一篇我写的或者人写的文章,我在这个文章当中到底扮演的是什么样的角色。对于这些事你有看法吗?

螺丝: 我一方面觉得AI不可能完全理解你。除非脑后插管实现了,但是我跟你讲,真正脑后插管是比较可怕的,这个东西是需要在的颅骨上钻孔,把针插进去才能做到的,你绝对不想让这件事发生在你的大脑上。在没有脑后插管的情况下,我觉得 AI 不太可能有这么精准的读心术 100% 地知道你的大脑里在想什么。一个很大的前提是那个东西大概率不是你想表达的。

另外一方面,有一个很重要的评判标准,没了 AI,你还能不能写得出来这个东西。如果你的答案是能,我觉得你把它当成你的,这完全没有问题。但是这个东西我们一定要做出区别,是AI写出来了之后我才觉得认同,还是没了AI我也能写得出来,这是两个完全不一样的事情。一定要避免自己欺骗自己,AI写出来的,你很认同,你觉得这个东西很好了,我就把它当成我的就扔出去了,那个不一样的,那个东西绝对不是你的东西。但如果没了 AI,你也能说这个东西,只是我讲得磕磕绊绊的。我觉得那就是你的,你只是在用 AI 节省时间,那依然是你的思想,那当然没有什么问题。

我们再绕回来,那个问题是不是你提的,推理过程是不是你的,你能不能为这里面所有的论述过程和论据负责,能不能为准确性负责?在没了 AI 之后,你有没有能力自己把这些资料调出来,这些东西都是很重要的。

尼克: 我衍生到一个类似的问题,也是一个很经典的哲学问题,在写作问题上的延伸。我先写出来了一篇文章了,从头到尾每个字都是我抠的。但是我真的写得很烂,逻辑也不通顺,错别字一大把,没有一句完整的句子,就跟不会说人话一样。但这个时候我把我的这篇文章投给 AI,让它帮我重新改一遍。当它改完之后很显然这篇文章从头到尾表达至少都是通顺的,甚至文法都还不错。但与此同时这篇文章的内核又是我的,我表达的中心思想或者我想表达的情感,又都没有变。这篇文章到底还能不能算成我的文章?从形式上来说可能每一个字都已经不是我当初投给它的状态。但这篇文章从它的起始到终点到中间的中心思想,甚至讲的故事又都是我想表达的东西。这到底还是我的文章吗?那艘船换了每一个零件之后到底还是不是那艘船?

螺丝: 我个人觉得,现实层面上来讲,那是不是你的不太重要。那个东西是不是你的不是很重要。你为什么要做这个事?你的目的是什么?你为什么要写文章?驱动你写文章的动机是什么?你想表达。你想表达这个东西有没有表达出来?表达出来了,这个问题就结束了,这是其一。

另外一方面,正如前面所言,写得磕磕绊绊,逻辑乱七八糟,大概率是自己不知道你自己想说什么。我会这样解释这个事情。

但跳回刚才的话语体系来讲,我觉得你把它当成你的当然是没有太大的问题。还是那句话,虽然我觉得在出现这个情况下,你大概率是不知道自己究竟在说什么,但如果你真的知道你在做什么,你能为它负责,没有什么问题,是你的就是你的。

这就像炒菜,你不能说柴不是你劈的、菜不是你种的,所以这盘菜就没有你的味道了。还是我炒的,有什么问题吗?我觉得没有什么问题。在这个层面上说,我不觉得你没有一个字一个字地打,那个东西就不是你的。也不能说,你没有打到多少,一定要打到多少,那个东西才是你的。如果抱着这个想法,就有一点在排斥现代科技,或者一现代生活方式了。

尼克: 少数派现在每天也会收到很多这种东西,好在我们是有双重审核机制的,大家是看不到的。但事实上我们在后台是能看到很多,甚至还有装孙子的。他用 AI 投厂商的,甚至还不是传统手机厂商,就是一个传统行业的,比如建筑行业、机械工程行业,他们投的行业的 AI 生成水文,批量粘贴到少数派,少数派就驳回他的写作权限或者把他的文章驳回。他私信跟编辑装孙子,说我没有违反你们的社区规则。

螺丝: 竟然还有这种事,我的天。

未来

尼克: 你说的那个未来很快就要到了,尤其我们看到现在这种多模态的大模型已经越来越成熟。现在文字、图片、语音是分开的。这些东西迟早会挂在一条链条上的,由一个模型统一或者由一套自动化流程统一。未来批量生成短影片几乎近在眼前了,可能一年后甚至半年后就会成为主流。最近很流行小明剑魔的那个梗,用大量的 AI 做。半年内这种基于原始素材进行 AI 变音和 AI 换脸批量生成内容会完全落地在短影片的平台上,到时候问题就交给平台了。抖音,TikTok 是否愿意接纳这种内容的大量存在,我觉得很难说。

螺丝: 我觉得平台是愿意接纳这些内容的。比如各位热爱轻音乐的朋友们,最近 Spotify 还能听了吗?朋友们,每周推荐全都被 AI 生成音乐给灌了。随便打开一个所谓的轻音乐,让它「漫游」,就会莫名其妙掉到 AI 的生成堆里。多的时候我大概需要屏蔽 30、40 个 AI 生成的「音乐家」。这种东西绝对是在挤占好内容的生存空间。而且的确现在的平台算法并不在乎创作者「个人」,而更在乎独立的「作品」,在这种情景下「人味」并不容易被体现出来。

这么说可能有点对不起这个网站,但是我觉得可以讲一讲。我有一段时间没看煎蛋了,前一段时间我抱着些许好奇,也抱着某种想要回顾一下当年愉快氛围的感受,我重新回煎蛋看了一下他们的文章。点开了4、5篇,全都是AI翻译的。我完全没有指责站长的意思,因为我知道煎蛋这个站能活到今天已经挺不容易的了。现在和当年大家都在看的内容不一样,现在大家全都是指着无聊图在活,可能也没有那么多人在意煎蛋主站的那些优质的翻译内容了,所以现在也没有什么人去写,但是你就会觉得很可惜,一方面优秀的作者不出稿了。另一方面,大量的AI生成的内容,哪怕是煎蛋这种,很早期互联网风味的那种网站,也变得开始这样做的时候,我就会觉得我们正在不可避免地失去一些对我们来讲很重要的事情。

尼克: 这议题也长久存在,从人类诞生以来就存在,就人类普遍的这种惰性和某些个体对于自我的认同或者对于存在的认同,一直是矛盾的。就像前面聊到的那个商业的问题。如果你想真正地拍有意义的照片,在形式上它可能看起来就是不华丽的,就是朴实的,甚至没有意义的。但对于商业摄影来说,它就是要很形式主义的,色彩浓烈的,糖水片的。但当 AI 的大潮来的时候,正因为你的那些共性的东西是很强烈,并且很容易模仿,很风格化的,所以最先受到冲击的就是商业摄影的那部分。图生图,多模态的能力更强之后,那部分真的是可以未来三两年内被淘汰了。而且 AI 现在生图还有一些在商业说没法落地的,比如说它生成图片的分辨率还是不够。如果你想要那种高清的高分辨率的商业大图,现在 AI 还做不到,或者需要很高的成本,但是未来三两年内这都不是问题。反过来留下的,不被取代的那部分,就是那部分依然坚持那个广场我要看到我才按下快门的那群人。但那群人在历史的长河中永远都是少数的,那些照片永远都是少数的,被大家广为接受的,被普遍认知为摄影作品的还是那些商业图片。我觉得这个矛盾是永远存在的。

AI 的到来或者未来的新工具永远会淘汰的恰恰也都是这批所谓的主流。但反过来讲,那些永远坚持要自己按快门的人,可能永远都是那些赚不到钱的人,就是那些不商业的人。有 AI 工具不用,坚持自己抠字的人。最近都在说,已经坚持不用 AI 辅助工具原创代码的那些人,已经叫江湖手艺人了。

可能坚持自我,坚持人之所以为人的这群人永远是少数的,永远是不商业的,不主流的。他们似乎代表了某种人类最坚守最纯真的东西,但也确实是最不受这种时代浪潮所影响的,但他们可能也永远是那些生活得最不好,离商业最远,离社会主流语境最远,收获不到大众认可的那群人。我觉得这个矛盾是永远存在的。

螺丝: 对。这个事是存在的。说实话,我们这代人应该算是被 AI 斩头的一代人。我现在有点认命了。看到这个大趋势来,我个人没有能力和大浪潮去做搏斗,哪怕你去呐喊某些东西很重要。但如果大家都不在乎,都不为你投票,还是没用。我们只能蹲下,把那个宝贵的东西捧在自己的手边。虽然很可惜,但至少你我还在乎,至少还有一些人在乎。比如我拿 AI 写了一篇文章出来之后,还会有人冲出来说,你这篇文章写得没有你的味道,这看起来太 AI 了。我虽然觉得他它得很好,但是我不喜欢它,我还是想看到你写的东西。

现在我主要思考的是,它既然已经这样了,我怎么样去利用它。当然我也不是说去成为焦虑的 AI 博主,「利用它」每天宣传焦虑。虽然我是学心理学的,这个事你让我干,我可以干得很好,但是我下不下去这个黑手。我觉得大家都已经够焦虑了,我不想再让你变得更加不快乐。

尼克: 每次聊到涉及伦理、哲学的话题,我们都能有聊不尽的素材。最后我们把这个思考交给我们的听众。大家可以在评论区聊一聊我的存在的意义到底是怎么看的。当浪潮冲击的时候,我们到底在坚守什么东西,大家也可以聊一聊自己的观点和看法。

Comments

Loading animation

Loading comments...