在 Atlas 中可视化 OpenAI 嵌入
在本示例中,我们将食品评论嵌入上传到 Atlas 以可视化这些嵌入。
什么是 Atlas?
Atlas 是一个机器学习工具,用于在您的网页浏览器中可视化海量嵌入数据集。将数百万个嵌入上传到 Atlas,并在您的网页浏览器或 jupyter notebook 中与它们进行交互。
1. 登录 Atlas。
!pip install nomic
import pandas as pd
import numpy as np
from ast import literal_eval
# 加载嵌入
datafile_path = "data/fine_food_reviews_with_embeddings_1k.csv"
df = pd.read_csv(datafile_path)
# 转换为列表的列表的浮点数
embeddings = np.array(df.embedding.apply(literal_eval).to_list())
df = df.drop('embedding', axis=1)
df = df.rename(columns={'Unnamed: 0': 'id'})
import nomic
from nomic import atlas
nomic.login('7xDPkYXSYDc1_ErdTPIcoAR9RNd8YDlkS3nVNXcVoIMZ6') #演示账户
data = df.to_dict('records')
project = atlas.map_embeddings(embeddings=embeddings, data=data,
id_field='id',
colorable_fields=['Score'])
map = project.maps[0]
2. 在 Jupyter 中与您的嵌入进行交互
map
<h3>Project: meek-laborer</h3>
<script>
destroy = function() {
document.getElementById("iframe463f4614-7689-47e4-b55b-1da0cc679559").remove()
}
Projection ID: 463f4614-7689-47e4-b55b-1da0cc679559
Hide embedded project