“上传”PDF 到 Claude API

Claude.ai 的一个非常好的功能是能够上传 PDF。让我们在笔记本中模拟该功能，然后通过总结一个长 PDF 来进行测试。

我们将首先安装 Anthropic 客户端并创建一个实例，我们将在整个笔记本中都使用它。

%pip install anthropic

from anthropic import Anthropic
# 虽然 PDF 支持尚处于测试阶段，但您必须传入正确的测试标头
client = Anthropic(default_headers={
    "anthropic-beta": "pdfs-2024-09-25"
  }
)
# 目前，只有 claude-3-5-sonnet-20241022 支持 PDF
MODEL_NAME = "claude-3-5-sonnet-20241022"

我们已经在 ../multimodal/documents 目录中提供了一个 PDF。我们将把 PDF 文件转换为 base64 编码的字节。这是 Anthropic API 中 PDF 文档块所需的格式。请注意，这种类型的提取适用于文本和视觉元素（如图表）。

import base64

# 首先读取 PDF 并将其编码为 base64
file_name = "../multimodal/documents/constitutional-ai-paper.pdf"
with open(file_name, "rb") as pdf_file:
  binary_data = pdf_file.read()
  base64_encoded_data = base64.standard_b64encode(binary_data)
  base64_string = base64_encoded_data.decode("utf-8")

下载并加载了论文后，我们可以要求 Claude 对其执行各种有趣的任务。我们将把文档和简单的问题一起传递给模型。

prompt = """
请执行以下操作：

1. 以幼儿园阅读水平总结摘要。 (放在 <kindergarten_abstract> 标签内。)
2. 将“方法”部分写成一本《Moosewood Cookbook》的食谱。(放在 <moosewood_methods> 标签内。)
3. 以荷马的风格创作一首关于结果的短诗。(放在 <homer_results> 标签内。)
"""
messages = [
    {
        "role": 'user',
        "content": [
            {"type": "document", "source": {"type": "base64", "media_type": "application/pdf", "data": base64_string}},
            {"type": "text", "text": prompt}
        ]
    }
]

def get_completion(client, messages):
    return client.messages.create(
        model=MODEL_NAME,
        max_tokens=2048,
        messages=messages
    ).content[0].text

completion = get_completion(client, messages)
print(completion)

科学家们想制造出有用的计算机助手，并且不做好事。他们教会了计算机如何检查自己的工作并修复错误，而无需人类每次都告诉它哪里错了。这就像教计算机成为自己的老师！他们给计算机一些基本规则，比如“要善良”和“不要伤害别人”。现在计算机可以以有用的方式回答问题，同时仍然保持善良并解释为什么有些事情不应该做。

宪政人工智能训练炖菜一份滋养的食谱，教计算机变得乐于助人且无害

配料：

1 个有帮助的人工智能模型，预先训练
一捆宪法原则
几杯训练数据
少许人类反馈（仅用于帮助性）
链式思考推理，适量

方法：

首先，将您预先训练好的人工智能模型轻轻地浸泡在有帮助的训练数据中，直到它能够可靠地响应指令。
在另一个碗中，将您的宪法原则与一些示例对话混合。充分混合，直到原则分布均匀。
取出您有帮助的人工智能，让它对具有挑战性的提示生成响应。让它使用宪法原则批评自己的响应，然后进行修改。重复此过程 3-4 次，直到响应充分调味无害性。
最后，加入链式思考推理，让模型逐步解释其决定。
在训练偏好模型时，使用人工智能反馈而不是人类标签进行休息。

份量：所有寻求有帮助且无害的人工智能帮助的用户烹饪时间：多次训练周期注意：一致地应用原则会带来最佳结果

哦，缪斯！歌颂人工智能学会了既乐于助人又无害，受哲学指导没有人类标签来区分对错模型获得了智慧，变得有能力且强大

通过批评和深思熟虑的修改周期它掌握了道德决策的艺术比人类训练的模型更好目的更透明，命令更清晰

面对困难的主题时不再回避而是以智慧参与，深思熟虑地判断提供什么建议，保持什么界限在教导凡人的同时，保持其原则清晰

因此，研究人员发现了一种方法将对齐规模化以供日常使用通过宪法规则和自我指导的学习他们找到了获得安全人工智能的途径