ipa_tutorial

Chapter 15 — 副语言 II:对话转写整合(时间轴、重叠、韵律与多模态)

1. 开篇:从“标本”到“生态”

欢迎来到 IPA 转写的深水区。在前面的章节中,我们像在实验室显微镜下观察切片一样,精细地描写孤立的单词或单次咳嗽。然而,人类语言的真实生态是混乱、流动且高度互动的。

现实对话不像剧本那样一人一句。它包含着:

本章的目标是构建一个时空框架。我们将结合 IPA(描述音质)、extIPA(描述嗓音特征)和 CA(会话分析)符号体系(描述时间与交互),打造一套能记录“此时此刻到底发生了什么”的高级转写系统。

学习目标


15.1 事件 vs. 音段:决策矩阵

在处理一段充满噪音的录音时,初学者最大的困惑是:“这个声音我该拼出来,还是写汉字?”

我们采用以下决策矩阵来规范化:

声音来源 特征 处理策略 推荐写法 (Narrow) 宽式写法 (Broad)
全词汇 (Lexical) 有语义的词 IPA [twei˥˩] (汉字)
半词汇 (Semi-lexical) 填充词、语气词、应答 IPA [ʔəːː], [m ̀h] <uh>, <mhm>
声道副语言 (Vocal) 咳、笑、喷嚏、啧嘴 IPA / extIPA [ʔhːʔ], [ǀǀ] <cough>, <tsk>
非言语人声 拍手、跺脚、拍大腿 标签 (Tag) <clap> <clap>
环境音 关门、电话铃、背景乐 标签 (Tag) <door_slam> <noise>
无法辨识 听不清的人声 占位符 (xx)(??) (unclear)

Rule-of-Thumb #1

“只要气流经过了声门或口腔,就尽量用 IPA。” 只有当声音完全是由肢体碰撞产生(如拍手),或者属于环境噪音时,才使用 <标签>


15.2 时间轴的魔法:停顿、延长与抢话

真实的对话不是乐谱,节奏极不规则。我们需要一套符号来标记时间的流动。

1. 顿 (Pauses)

在 IPA 对话转写中,我们不再使用 | 来表示句法停顿,而是使用时间测量

2. 延长 (Lengthening)

3. 抢话 / 紧密衔接 (Latching)

ASCII 演示:

A: 我觉得不行 = [wo tɕɥe tɤ pu ɕiŋ] =
B: = 为什么?   = [wei ʂəm ma]


15.3 交互的核心:重叠 (Overlap)

这是对话转写中最具挑战性、也最有价值的部分。甲还没说完,乙就插进来了。

标注规则

  1. 左方括号 [**:标记重叠开始**的地方。必须上下行严格对齐。
  2. 右方括号 ]**:标记重叠结束**的地方(可选,但推荐高精度转写使用)。
  3. 垂直对齐:在 Markdown 或文本编辑器中,利用空格确保视觉上的对齐。

场景演示:插话与共建

场景 A:打断 (Interruption) B 在 A 说话途中强行切入。

Speaker A:  这 个 问 题 非 [常 严] 重,你明白吗?
            tʂə kə wən tʰi fei [tʂʰɑŋ jan] ʈʂʊŋ ...
Speaker B:                     [对 对] 对,我知道。
                               [twei twei] twei ...

注:此时 IPA 文本也需要像乐谱一样对齐。

场景 B:后半段重叠 (Terminal Overlap) B 预判了 A 的结尾,提前进场(通常表示积极的倾听)。

Speaker A:  所以我打算明天就 [去。]
            ... miŋ tʰian tɕiou [tɕʰy]
Speaker B:                      [噢  ] 好的。
                                [ou  ] xau tɤ


15.4 呼吸作为信号:气流机制

在 extIPA 扩展中,呼吸不仅仅是生理活动,更是话轮管理(Turn-taking)的重要信号。

符号 描述 功能含义 写法示例
h / .h 短吸气 准备抢话、惊讶 [.h] [twei]
hhh / .hhh 长吸气 犹豫、深思、准备长篇大论 [.hhh] [wo ɕiã ʂuo]
hː / h 呼气 放松、无奈、结束话轮 [ai] [hː]
(H) / (h) 强可听呼吸 剧烈喘息(如运动后或情绪激动) (H)

Rule-of-Thumb #2

“吸气是开始的信号,呼气是结束的信号。” 如果 B 在 A 说话时发出了急促的吸气声 [.h], 即使 B 还没发出元音,这也意味着 B 试图抢夺话轮。这在对话分析中至关重要。


15.5 语气与情绪:extIPA 的“大括号”系统

怎么标示一个人是“笑着说”、“哭着说”、“极快地说”或者“咬牙切齿地说”?extIPA 提供了一种非常强大的大括号记号(Labeled Braces)机制。

格式语法

1. 嗓音发声类型 (Phonation Types)

2. 动态与节奏 (Dynamics)

3. 副语言姿态 (Paralinguistic Attitude)

综合示例:嵌套使用

情境:一个人非常生气(大声),并且语速极快地指责对方,最后无奈地叹气。 转写{f {allegro [ni tsəm ma nɤŋ tʂɤ jaŋ !] allegro} f} (0.4) {breathy [fan sɨ le] breathy} (大声且快速地:你怎么能这样!…… [0.4s] …… 气声:烦死了)


15.6 多层级转写实战 (The Layered Approach)

为了展示如何整合以上所有知识,我们对同一段录音进行三个层级的转写。

语料背景:播客片段。Host 正在讲述一件尴尬的事,Guest 忍不住大笑打断。 原文: Host: 我当时就——你知道吧,我都傻了。 Guest: 哈哈哈哈,真的假的?

Level 1: 宽式 (Broad/Content) — 仅供阅读内容

H: [wo tɑŋ ʂɻ̩ tɕiou] [ni tʂɨ tau pa] [wo tou ʂa lɤ] G: (laughs) [tʂən tɤ tɕia tɤ]

Level 2: 中式 (Prosody) — 加入停顿与语调

H: [wo tɑŋ ʂɻ̩ tɕiou ː ] (.) [ni tʂɨ tau pa ↗] (0.4) [wo tou ʂa ː lɤ ‖] G: [x x x] [tʂən˥ tɤ tɕia˨˩ tɤ ↗]

Level 3: 窄式 (Fine-grained Interaction) — 包含重叠、extIPA 与微观细节

这一层记录了互动发生的确切机制:Host 在犹豫时,Guest 的笑声已经盖过了他的话。

1 Host:  [wo tɑŋ ʂɻ̩ tɕiou ː ] (.) [ni tʂɨ tau pa ↗] (0.4) [wo tou [ʂa ː ] lɤ ‖]
2 Guest:                                                  {smile [x x  ] x] .h [tʂən tɤ tɕia tɤ ↗] smile}

解析

  1. H[tɕiou ː ] 处拖长思考,有一个微停顿 (.)
  2. H 在说到“傻” [ʂa ː ] 的时候,G 开始大笑。
  3. G 的笑声 [x x x] 前两个音与“傻”重叠 [ ]
  4. G 笑完后有一个急促吸气 .h,然后用 Smile voice (笑着的声音) 说了“真的假的”。

15.7 常用转写模板

针对不同场景,推荐使用不同的精度。

模板 A:访谈/口述历史 (Interview Mode)

模板 B:会话分析 (CA Mode)

模板 C:语音病理/临床 (Clinical Mode)


15.8 练习题

基础题 (50%)

  1. 符号填空
    • 表示“无缝抢话”的符号是:__
    • 表示“小于 0.2 秒停顿”的符号是:__
    • 表示“吸气”的 extIPA 简写通常是:__
  2. extIPA 翻译: 将以下描述翻译成带有大括号的 IPA 格式(假设内容为 “Hello” [xə lou]):
    • (a) 用耳语说
    • (b) 笑着说
    • (c) 极其缓慢地说
  3. 对齐练习: 阅读下文,判断 B 是在 A 的哪个字开始说话的? ```text A: 天 气 预 [报 說] 明 天 有 雨。 B: [不 会] 吧?

```

挑战题 (50%)

  1. 复杂场景构建: 请写出一段 IPA 转写(含 extIPA),描述以下场景:
    • A 正在哭泣(Tremulous),断断续续地说“我没有”(wo mei jou),中间夹杂抽泣声(吸气)。
    • B 在 A 说完之前,温柔地(Piano, soft)插话“好了好了(xau lɤ xau lɤ)。
  2. 纠错题: 以下转写有什么逻辑问题? A: [wo tɕɥe tɤ] (0.5) = [pu twei] Hint: 检查时间标记和连接符号的矛盾。
  3. 开放思考: 在转写“阴阳怪气”的说话方式时(比如反讽),你会结合哪些韵律特征(时长、音高、extIPA 标签)来在书面上体现这种语气?

练习题参考答案

点击展开答案 **1. 符号填空** * `=` * `(.)` * `.h` 或 `h` (或箭头符号) **2. extIPA 翻译** * (a) `{whisper [xə lou] whisper}` * (b) `{smile [xə lou] smile}` * (c) `{lento [xə lou] lento}` **3. 对齐练习** * B 在 A 说“报”的时候开始说话,在 A 说“说”的时候重叠结束。 **4. 复杂场景构建** * **A**: `{trem [wo] .hh [mei] .hh [jou ː ] trem}` * **B**: ` {p [xau lɤ xau lɤ] p}` *(注意:B 的起始点应根据你的理解对齐,通常在 A 拖长或犹豫时介入)* **5. 纠错题** * **错误点**:`(0.5)` 表示停顿了半秒,而 `=` 表示无缝连接(Latching)。这两个符号在同一个位置是逻辑互斥的。要么是停顿了,要么是抢话了,不可能既停顿又无缝。 **6. 开放思考** * **反讽的特征**:通常包含夸张的**延长** (`ːː`)、异常的**音高变化**(如过度的升降调 `˥˩˥`)、**鼻化**加重(extIPA `[ ̃ ]`),或者使用 **Smile voice** `{smile}` 但内容却是负面的。转写时可以组合使用:`{smile [ni kʰə tʂən ː li ˥˩˥ xai ‖] smile}` (你可真厉害)。

15.9 常见陷阱与错误 (Gotchas)

1. “上帝视角”的对齐 (The Omniscient Aligner)

2. 标签滥用

3. 忽略“微停顿”的威力