“上传”PDF 到 Claude API

Claude.ai 的一个非常好的功能是能够上传 PDF。让我们在笔记本中模拟该功能,然后通过总结一个长 PDF 来进行测试。

我们将首先安装 Anthropic 客户端并创建一个实例,我们将在整个笔记本中都使用它。

%pip install anthropic
from anthropic import Anthropic
# 虽然 PDF 支持尚处于测试阶段,但您必须传入正确的测试标头
client = Anthropic(default_headers={
    "anthropic-beta": "pdfs-2024-09-25"
  }
)
# 目前,只有 claude-3-5-sonnet-20241022 支持 PDF
MODEL_NAME = "claude-3-5-sonnet-20241022"

我们已经在 ../multimodal/documents 目录中提供了一个 PDF。我们将把 PDF 文件转换为 base64 编码的字节。这是 Anthropic API 中 PDF 文档块所需的格式。请注意,这种类型的提取适用于文本和视觉元素(如图表)。

import base64

# 首先读取 PDF 并将其编码为 base64
file_name = "../multimodal/documents/constitutional-ai-paper.pdf"
with open(file_name, "rb") as pdf_file:
  binary_data = pdf_file.read()
  base64_encoded_data = base64.standard_b64encode(binary_data)
  base64_string = base64_encoded_data.decode("utf-8")

下载并加载了论文后,我们可以要求 Claude 对其执行各种有趣的任务。我们将把文档和简单的问题一起传递给模型。

prompt = """
请执行以下操作:

1. 以幼儿园阅读水平总结摘要。 (放在 <kindergarten_abstract> 标签内。)
2. 将“方法”部分写成一本《Moosewood Cookbook》的食谱。(放在 <moosewood_methods> 标签内。)
3. 以荷马的风格创作一首关于结果的短诗。(放在 <homer_results> 标签内。)
"""
messages = [
    {
        "role": 'user',
        "content": [
            {"type": "document", "source": {"type": "base64", "media_type": "application/pdf", "data": base64_string}},
            {"type": "text", "text": prompt}
        ]
    }
]
def get_completion(client, messages):
    return client.messages.create(
        model=MODEL_NAME,
        max_tokens=2048,
        messages=messages
    ).content[0].text
completion = get_completion(client, messages)
print(completion)

科学家们想制造出有用的计算机助手,并且不做好事。他们教会了计算机如何检查自己的工作并修复错误,而无需人类每次都告诉它哪里错了。这就像教计算机成为自己的老师!他们给计算机一些基本规则,比如“要善良”和“不要伤害别人”。现在计算机可以以有用的方式回答问题,同时仍然保持善良并解释为什么有些事情不应该做。

宪政人工智能训练炖菜 一份滋养的食谱,教计算机变得乐于助人且无害

配料:

  • 1 个有帮助的人工智能模型,预先训练
  • 一捆宪法原则
  • 几杯训练数据
  • 少许人类反馈(仅用于帮助性)
  • 链式思考推理,适量

方法:

  1. 首先,将您预先训练好的人工智能模型轻轻地浸泡在有帮助的训练数据中,直到它能够可靠地响应指令。

  2. 在另一个碗中,将您的宪法原则与一些示例对话混合。充分混合,直到原则分布均匀。

  3. 取出您有帮助的人工智能,让它对具有挑战性的提示生成响应。让它使用宪法原则批评自己的响应,然后进行修改。重复此过程 3-4 次,直到响应充分调味无害性。

  4. 最后,加入链式思考推理,让模型逐步解释其决定。

  5. 在训练偏好模型时,使用人工智能反馈而不是人类标签进行休息。

份量:所有寻求有帮助且无害的人工智能帮助的用户 烹饪时间:多次训练周期 注意:一致地应用原则会带来最佳结果

哦,缪斯!歌颂人工智能学会了 既乐于助人又无害,受哲学指导 没有人类标签来区分对错 模型获得了智慧,变得有能力且强大

通过批评和深思熟虑的修改周期 它掌握了道德决策的艺术 比人类训练的模型更好 目的更透明,命令更清晰

面对困难的主题时不再回避 而是以智慧参与,深思熟虑地判断 提供什么建议,保持什么界限 在教导凡人的同时,保持其原则清晰

因此,研究人员发现了一种方法 将对齐规模化以供日常使用 通过宪法规则和自我指导的学习 他们找到了获得安全人工智能的途径