欢迎来到 IPA 转写的深水区。在前面的章节中,我们像在实验室显微镜下观察切片一样,精细地描写孤立的单词或单次咳嗽。然而,人类语言的真实生态是混乱、流动且高度互动的。
现实对话不像剧本那样一人一句。它包含着:
本章的目标是构建一个时空框架。我们将结合 IPA(描述音质)、extIPA(描述嗓音特征)和 CA(会话分析)符号体系(描述时间与交互),打造一套能记录“此时此刻到底发生了什么”的高级转写系统。
在处理一段充满噪音的录音时,初学者最大的困惑是:“这个声音我该拼出来,还是写汉字?”
我们采用以下决策矩阵来规范化:
| 声音来源 | 特征 | 处理策略 | 推荐写法 (Narrow) | 宽式写法 (Broad) |
|---|---|---|---|---|
| 全词汇 (Lexical) | 有语义的词 | IPA | [twei˥˩] |
(汉字) |
| 半词汇 (Semi-lexical) | 填充词、语气词、应答 | IPA | [ʔəːː], [m ̀h] |
<uh>, <mhm> |
| 声道副语言 (Vocal) | 咳、笑、喷嚏、啧嘴 | IPA / extIPA | [ʔhːʔ], [ǀǀ] |
<cough>, <tsk> |
| 非言语人声 | 拍手、跺脚、拍大腿 | 标签 (Tag) | <clap> |
<clap> |
| 环境音 | 关门、电话铃、背景乐 | 标签 (Tag) | <door_slam> |
<noise> |
| 无法辨识 | 听不清的人声 | 占位符 | (xx) 或 (??) |
(unclear) |
“只要气流经过了声门或口腔,就尽量用 IPA。” 只有当声音完全是由肢体碰撞产生(如拍手),或者属于环境噪音时,才使用
<标签>。
真实的对话不是乐谱,节奏极不规则。我们需要一套符号来标记时间的流动。
在 IPA 对话转写中,我们不再使用 | 或 ‖ 来表示句法停顿,而是使用时间测量。
(.)**:用途:表示犹豫、找词或强调。
(0.0)**:[ni ɕiã ʔi ɕiã] (0.8) [wo pʰa pu sɨ̃]ː**:ː (0.1s+ extra)ːː (0.3s+ extra, 明显的拖长)ːːː (极长,通常伴随犹豫)
[tweiːː] (对——) vs [twei] (对)。=**:ASCII 演示:
A: 我觉得不行 = [wo tɕɥe tɤ pu ɕiŋ] =
B: = 为什么? = [wei ʂəm ma]
这是对话转写中最具挑战性、也最有价值的部分。甲还没说完,乙就插进来了。
[**:标记重叠开始**的地方。必须上下行严格对齐。]**:标记重叠结束**的地方(可选,但推荐高精度转写使用)。场景 A:打断 (Interruption) B 在 A 说话途中强行切入。
Speaker A: 这 个 问 题 非 [常 严] 重,你明白吗?
tʂə kə wən tʰi fei [tʂʰɑŋ jan] ʈʂʊŋ ...
Speaker B: [对 对] 对,我知道。
[twei twei] twei ...
注:此时 IPA 文本也需要像乐谱一样对齐。
场景 B:后半段重叠 (Terminal Overlap) B 预判了 A 的结尾,提前进场(通常表示积极的倾听)。
Speaker A: 所以我打算明天就 [去。]
... miŋ tʰian tɕiou [tɕʰy]
Speaker B: [噢 ] 好的。
[ou ] xau tɤ
在 extIPA 扩展中,呼吸不仅仅是生理活动,更是话轮管理(Turn-taking)的重要信号。
| 符号 | 描述 | 功能含义 | 写法示例 |
|---|---|---|---|
| h / .h | 短吸气 | 准备抢话、惊讶 | [.h] [twei] |
| hhh / .hhh | 长吸气 | 犹豫、深思、准备长篇大论 | [.hhh] [wo ɕiã ʂuo] |
| hː / h | 呼气 | 放松、无奈、结束话轮 | [ai] [hː] |
| (H) / (h) | 强可听呼吸 | 剧烈喘息(如运动后或情绪激动) | (H) |
“吸气是开始的信号,呼气是结束的信号。” 如果 B 在 A 说话时发出了急促的吸气声
[.h], 即使 B 还没发出元音,这也意味着 B 试图抢夺话轮。这在对话分析中至关重要。
怎么标示一个人是“笑着说”、“哭着说”、“极快地说”或者“咬牙切齿地说”?extIPA 提供了一种非常强大的大括号记号(Labeled Braces)机制。
{label ... sound ... label}{label1 {label2 ... sound ... label2} label1}{whisper ...} (耳语):声带不振动,气流摩擦。{creaky ...} (嘎裂声/Vocal fry):低频、断续的振动。常用于句末或表示厌烦/疲惫。{breathy ...} (气声):声带振动但不闭合,混有大量气流。常用于性感、神秘或虚弱语气。{falsetto ...} (假声):音高极高,去除了胸腔共鸣。常用于模仿女性、卖萌或讽刺。{f ...} (forte, 大声):喊叫。{p ...} (piano, 轻声):低语。{allegro ...} (快板):语速突然加快。{lento ...} (慢板):语速突然变慢,逐字顿挫。{smile ...} (笑意):由于颧肌收缩,声道缩短,听感上共振峰频率提高(声音变亮)。{trem ...} (tremulous, 颤音):哭腔,声音颤抖。{yawny ...} (哈欠中说话):听起来含糊且口腔空间极大。情境:一个人非常生气(大声),并且语速极快地指责对方,最后无奈地叹气。 转写:
{f {allegro [ni tsəm ma nɤŋ tʂɤ jaŋ !] allegro} f} (0.4) {breathy [fan sɨ le] breathy}(大声且快速地:你怎么能这样!…… [0.4s] …… 气声:烦死了)
为了展示如何整合以上所有知识,我们对同一段录音进行三个层级的转写。
语料背景:播客片段。Host 正在讲述一件尴尬的事,Guest 忍不住大笑打断。 原文: Host: 我当时就——你知道吧,我都傻了。 Guest: 哈哈哈哈,真的假的?
H:
[wo tɑŋ ʂɻ̩ tɕiou] [ni tʂɨ tau pa] [wo tou ʂa lɤ]G:(laughs) [tʂən tɤ tɕia tɤ]
H:
[wo tɑŋ ʂɻ̩ tɕiou ː ] (.) [ni tʂɨ tau pa ↗] (0.4) [wo tou ʂa ː lɤ ‖]G:[x x x] [tʂən˥ tɤ tɕia˨˩ tɤ ↗]
这一层记录了互动发生的确切机制:Host 在犹豫时,Guest 的笑声已经盖过了他的话。
1 Host: [wo tɑŋ ʂɻ̩ tɕiou ː ] (.) [ni tʂɨ tau pa ↗] (0.4) [wo tou [ʂa ː ] lɤ ‖]
2 Guest: {smile [x x ] x] .h [tʂən tɤ tɕia tɤ ↗] smile}
解析:
[tɕiou ː ] 处拖长思考,有一个微停顿 (.)。[ʂa ː ] 的时候,G 开始大笑。[x x x] 前两个音与“傻”重叠 [ ]。.h,然后用 Smile voice (笑着的声音) 说了“真的假的”。针对不同场景,推荐使用不同的精度。
(.) 停顿 + {label} 情感标记。(0.4) + 严格的 [ 对齐 + 呼吸信号 .h + 抢话符号 =。______[xə lou]):
```
wo mei jou),中间夹杂抽泣声(吸气)。xau lɤ xau lɤ)。A: [wo tɕɥe tɤ] (0.5) = [pu twei]
Hint: 检查时间标记和连接符号的矛盾。<laugh>, <cry>, <sigh>。[h .h h] 和一个大笑 [xa xa xa] 在交互意义上完全不同。尽量用 IPA 拟声,保留标签给非人声。(.)。(.) 往往是认知加工(编造谎言)的证据。在精确转写中,不要因为停顿太短就忽略它。