说书唱戏劝人方 一条大路走中央 善恶到头终有报 人间正道是沧桑 ——确认下眼神,我不是喜剧人 一定是特别的缘分,才可以一路走来,变成了段子手。误入段子界已有四五年,早期只是看各路高手的创造,一段时间后实在技痒也加入了创作的大军中,甚至在年会的时候上台表演了脱口秀(一个多么错误的选择)。流传比较广的段子是加工创作了一位男同事的口头禅 "我只是个小喽啰"。 "你们知道,‘我只是一个小喽啰 ’用英文怎么说?" "I am just a low boy"(谐音+双关梗) 没想到自己的业余爱好会在自己的工作中发挥不少作用,原来还可以这样做设计。 写段子就是玩梗,玩梗的核心总结就是:情理之中,意料之外。 语音交互的核心玩法则是:要什么,给什么。 这两个看似南辕北辙的两件事情,里面有很多原则是互通或互斥的。 一、简单点,说话的方式简单点 段子是有多个故事组合而成,列出来的时间要写得尽可能简洁,避免冗长的描述。莎士比亚曾经说过:简洁即幽默(莎翁真说过这句话???) 举个互联网界的段子: 丁磊说赚钱只是一个顺便的事; 周鸿祎说他的人生很失败; 马云说他这辈子最后悔的事就是创建了阿里; 网友说我也想顺便人生失败后悔一辈子。 里面的三个核心故事还是很不错的,只是表述地过于啰嗦,网友们用古汉语的绝句诗体,一改就大不一样: 顺便赚钱丁三石 人生失败周鸿祎 悔创阿里杰克马 …… 通过对信息的重新组合和排练,用一首三句"七绝"将互联网大佬们的人生态度以及段子的"笑果"表现出来了。 喜剧有一条属于自己的能量守恒定律: 用户用了多少能量去思考,他们便少了多少能量去发笑。 这条同样适用于语音交互,用户通过听觉器官去获取准备信息,所耗费的注意和认知资源是视觉通道的数倍,准确,简单是对用户耳朵"最后的温柔"。 以语音助手的引导语为例: "我是你的人工智能助手瓜瓜,可以帮你查询各地天气,播报今日新闻,设定闹钟,你只要和我说:你好瓜瓜,就可以叫醒我了。" 引导语是语音助手和用户第一次见面时,打招呼说的话,话中需要包含三类必要信息:自我介绍、功能介绍、操作介绍。 "Hi,我是瓜瓜,可以查天气,播新闻,定闹钟,和我说你好瓜瓜,播新闻,试试吧" 同样的缩减、组合,可以减少前两类必要信息的冗余,最后的操作介绍不宜为了减少字数而牺牲信息传播的准确性,而是通过具体化到某个功能的介绍。 一来让操作更加直观,二来也弥补了听觉信息以短时记忆为主要载体的,与前面功能介绍里的"播新闻"相呼应。 二、"底线"要不要? 段子里面的核心笑点一般是用"底"收尾的,每个笑点都有一个关键词,短语或者动作揭示出再解读,然后打破观众的原有预期,达到"笑"果。 相声里就是抖包袱里揭开最后一层包袱皮。笑点提前给出来,观众笑完还会继续听下面你在说什么,除非是连着给笑点,小笑点后面跟着大笑点,不然这样的效果会很差。 例子感受一下: 刘备的马脱缰跑向悬崖,张飞急得大喊:"大哥,你快勒马!" 刘备骂道:"我很快乐!" 刘备的马脱缰跑向悬崖,张飞急得大喊:"大哥,你快勒马!" 刘备骂道:"我很快乐!你傻呀,三弟!" 但在语音交互设计中却要避免这样的操作,核心的信息要尽快给出,这样才契合"要什么,给什么"的原则。要注意的是:对话要满足日常的对话结构,不为信息的前置而前置。 示例如下: 用户:杭州明天是晴天吗? 瓜瓜:杭州明天天气晴,气温23到30度。 这条回复中的必要信息没有问题,但是在回答用户核心的意图(天气状况)之前,加了地区(杭州)和时间(明天)两类信息,核心信息给的不够及时。 用户:杭州明天是晴天吗? 瓜瓜:是晴天,气温23到30度。 有人说还可以更简洁。 用户:杭州明天是晴天吗? 瓜瓜:晴,气温23到30度。 这里不这样做的原因有俩: "晴"作为单个字,可以是一句话,作为声音信息来说,有信息遗漏的风险; 另外就是,顺着用户的问法,对前句有信息继承,可以打消用户对信息可信度疑虑。(只报告"晴",用户回疑惑是杭州的天气吗?是明天的吗?) 三、玩过节奏大师吗? 喜剧中,同一种节奏很容易让观众产生假设:接下来还会是同样的节奏,达到层层蓄势,在最后打破观众的假设。比较经典的例子就是《吐槽大会》第一季第一集周杰对吐槽嘉宾的"灭霸"式反吐槽: "史航说他伶牙俐齿,在大学校园里深受女大学生的欢迎,甚至有人要和他厮守终生,这句话估计你们都听不明白,自健不明白什么是伶牙俐齿,蛋蛋不明白什么是很受欢迎,王琳不明白什么是厮守终生,池子不明白什么是大学校园,张全蛋不明白什么是女大学生哪!?" 在语音交互中,中文本身的特殊性,单音节字、词或者短语都可以组成一个句子。语音交互中,当不得不陈述大信息量语句,例如:用户询问附近餐厅,最近热门影片时,使用三段结构,可以有效降低用户的认知负荷。 四、背景不一样,背影再多也没用 在脱口秀中,表演者需要非常了解他要表演的观众,针对性地修改里面的故事,让台下的观众最快地进入故事,产生假设。 当观众不明白你在说什么就不会笑,这是一个常识,某个词或者引用语对段子的理解非常重要,必须思考观众是否熟悉。语音交互中对应的就是要避免使用专业术语和名词,避免引入一些有知识壁垒和共同背景的短语。 用户:你好,瓜瓜,推荐你最喜欢的三首歌 瓜瓜:李志的《热河》,蔡琴的《渡口》,童丽的《相思》。 这是我们项目组测试用的歌,大家对此非常熟悉,但组外的人就不明白这三首歌的点在哪里,讲出去就无法引发共鸣。 天气类型中有几种气象类型很小众:扬沙、冻雨、浮尘,即使出现概率很低,在具体播报的时候可以考虑修改为用户熟悉的气象类型:扬沙(沙尘暴)、冻雨(雨)。在AI闲聊写作中这点更是要注意。 用户:你觉得我今天好看吗? 瓜瓜:云想衣裳花想容,春风拂槛露华浓。 这首诗意境很美,理解这两句诗是有知识门槛,使用的时候要非常慎重。 五、凛冬将至 在专业的脱口秀里面,有个潜规则:"谐音梗是要扣钱的"。 谐音梗是一种相对老套的喜剧形式,日常和朋友聊天,综艺节目可以用,对话AI产品中也可以用。大多数对话AI产品的人格定位不是专业的脱口秀演员,而是身边的助手或者朋友,更适合用谐音梗或者冷笑话的方式来拉近距离。 数据显示:天猫精灵回答了1亿个问题,讲笑话次数达1296万次,可见用户对AI娱乐搞笑的需求很强烈。 目前喜剧界的现状是逗乐观众越来越难,原因是信息传播太快了。一个好笑的段子,在一天之内占领微博热搜,三天之内基本全国人民都知道了,讲大家都知道的梗,就真的是味同嚼蜡。 在原创的段子质量无法保证的基础上(毕竟只是业余爱好者),冷笑话可能更适合作为AI讲笑话的主攻方法。目前大部分AI用女性的声音,女性作为谐星来逗乐观众的难度要比男性大很多,重口味梗不能用(明显的性暗示,脏话和下三路的段子)。 目前的语音合成技术,大部分的声音的自然度和韵律距离人声还有距离,说话的机械感比较强,声情并茂地讲段子是万万做不到的,效果无法保证。 最后就是目前阶段的人工智能水平,用户对AI助手的定位还是"不智能,呆"。冷笑话这种需要逻辑推理一下,过段时间才反应过来的笑话,更契合AI当前的预期定位。 六、非视觉系 人们说话和写作用的语言是不一样,写段子的时候要用说的语言,而不是看的。 有一类段子就是视觉系的,例如: 皮卡丘是怎么走路的?皮卡乒 皮卡乓 皮卡乒 皮卡乓 皮卡乒 皮卡乓 这类段子就很难通过声音来表达它的笑点,只有变成文字,读者才能第一时间明白它的意思。 在很多的语音交互准则中都提到过:"要用听的语言而不是看的",但是设计师在写这些对话的时候,还是摆脱不了用书面语言,甚至把一些常用的口语强行书面化。 比如 :"好的 ","没问题",这两个是常用的同意态度应答语。"好的好的"、"好的没问题"、"没问题,好的"都是口语中使用频率更高的,表达更积极的同意态度,语法上有点问题,但表达上没问题。 上面讲到的是在写段子中的常用的一些原则和技巧,以及如何在语言交互中的运用这些技巧。但光会写段子,还不足以做好语音交互,那么除了会写段子,VUI设计师还需要会什么? 下期见!