跟 OpenAI 学写 ChatGPT API 的 Python SDK 库
ChatGPT 问世后,OpenAI 就开源了模型调用的 Python 库 openai-python。这个库功能十分齐全,封装了 OpenAI 对外公布的 API,使用起来也十分简单。
这个库的第一个版本,实现了 ChatGPT 各种 API 的参数封装 Python 抽象类和调用方法,通过 requests 和 aiohttp 库来发送同步或者异步 HTTP 请求。整体来说,对外接口良好,很容易就会使用。并且整体源码实现有很好的逻辑抽象,用了很多 Python 高级特性,代码写的很漂亮,值得学习。但是从本质上讲,这还是 “API boy“ 的工作,更多是重复体力劳动,没有太多技术含量。
于是,OpenAI 在 2023 年 11 月,开始引入 Stainless,自此不用再手工编写 SDK 代码。每次只用提供 API 协议更新,然后就能自动生成代码,摆脱了重复体力劳动。具体是在 Pull 677 中引入新的代码,并且作为正式的 V1 版本发布。
手动打造的 SDK
最开始的 Python SDK 可以称之为手动打造的 SDK,代码全部手工写好,和 API 耦合在一起。整体目录结构如下:
这个版本的代码,整体结构还是比较清晰的,我用 Pyreverse 和 graphviz 为 openapi-sdk 生成了类图,去掉一些不重要的类之后,整体的类依赖关系如下:
其中有个基础的类 OpenAIObject,里面定义一些基本的字段,比如 api_key, api_version 等,平时用到的 ChatCompletion 类间接继承自这个类。另外还有 OpenAIError 和 APIRequestor 两个类,分别用于处理错误以及发送 HTTP 请求。OpenAI 的代码用到了不少高级的 Python 特性,这里以 overload 装饰器为例,下面来详细看看。当然,如果对 Pyhton 不感兴趣,可以跳过这部分,直接看后面的自动化生成部分。
overload 装饰器
openai-python/openai/api_requestor.py 中的 APIRequestor 类有很多 overload 修饰的方法,这是 Python 3.5 新增的语法,属于 typeing 包。
1 | class APIRequestor: |
在 Python 中,使用 @overload
装饰器定义的方法重载仅用于类型检查和文档,它们实际上不会被执行。这些重载主要是为了提供更准确的类型信息,以便在使用静态类型检查器(如 mypy)或 IDE(如 PyCharm)时能够得到更准确的提示和错误检查。
使用 @overload 可以更准确地描述一个函数或方法在不同参数组合下的行为。实际的实现是在没有 @overload
装饰器的 request 方法中。这个方法通常会使用条件语句(如 if、elif、else)或其他逻辑来根据不同的参数组合执行不同的操作。上面 overload 修饰的 4 个 request 方法,实际上是定义了4个不同的方法,分别接受不同的参数组合,返回不通的类型值。
上面代码请求参数解释:
files=...
:这里的 files=… 表示 files 参数是可选的,但类型没有明确指定。在 Python 的类型提示中,...
(省略号)通常用作占位符,表示“这里应该有内容,但尚未指定”。stream: Literal[True]
:这里的 stream:Literal[True]
表示 stream 参数必须是布尔值 True。Literal 类型用于指定一个变量只能是特定的字面值,这里就是 True。request_id: Optional[str] = ...
:这里的Optional[str]
表示 request_id 参数可以是 str 类型,也可以是 None。Optional 在类型提示中通常用于表示一个值可以是某种类型或 None。这里的= ...
同样是一个占位符,表示默认值尚未指定。在实际的方法实现中,这通常会被一个实际的默认值替换。
举一个相对简单的例子,假设我们有一个函数 add,它可以接受两个整数或两个字符串,但不能接受一个整数和一个字符串,使用 @overload 的情况:
1 | from typing import Union, overload |
添加注解后的好处有:
- 类型检查:使用
@overload
后,如果尝试传入一个整数和一个字符串到 add 函数,静态类型检查器会立即报错,而不需要等到运行时。 - 代码可读性:通过查看
@overload
定义,其他开发者可以更容易地理解 add 函数接受哪些类型的参数,以及在不同情况下的返回类型。 - IDE 支持:在像
PyCharm
这样的 IDE 中,@overload
可以提供更准确的自动完成和参数提示。 - 文档:
@overload
也可以作为文档,说明函数或方法的不同用法。
上面的 add
函数,如果你这样调用: print(add(1, “2”)),mypy 就能检查出错误,不用到运行时才发现:
1 | override.py:22: error: No overload variant of "add" matches argument types "int", "str" [call-overload] |
引入 stainless 重构库
上面是比较传统的根据 API 接口定义来生成 Client 代码的方式。其实很多程序员日常的工作类似这种,提供 API 的各种参数然后去调用,或者是提供对外的接口,这就是所谓的 API boy。
OpenAI 的程序员,显然不满足于做一个 API boy,从仓库的提交记录中可以看到,在 2023.11 在 V1 中做了比较大的改动,使用 stainless 来生成代码,并且随后就引入了 stainless-bot
机器人。
stainless 是一个开源的 API SDK 生成工具,可以根据 API 协议定义,自动生成对应的代码。你只需要提供 API 接口文件,也就是 OpenAPI Specification 文件,然后就会生成各种语言的 SDK 了。目前(2024.01)支持 TypeScript, Node, Python, Java, Go, Kotlin 等语言。
这里生成的代码质量也是有保障的,按照文档所说,会尽量让自动生成的代码和专家级别的人写的代码一样。生成的库还会支持丰富的类型校验,可以用于自动补全和 IDE 中光标悬停时的文档提示,另外还支持带退避的自动重试,以及身份验证等。每次 API 接口有新的变更,只有更新 API 协议定义文件,然后用 Github Action 推送给 stainless,就能自动生成新的代码,接着给你的仓库提供一个 Pull Request。
听起来很美好,只用改下协议,然后就有生成的代码了,整个过程不用人去写代码,也没有重复体力劳动了。我们来看看 OpenAI 的 SDK 最近提交记录,基本都是 stainless-bot 提交的代码了。
这里其实还有点疑问,stainless-bot 的更新feat(client): support reading the base url from an env variable,支持从环境变量读取 OPENAI_BASE_URL,但是在 API spec 里面并没有看到相关说明,不知道这里的更新 stainless-bot 是怎么产生的。
另外值得注意的是,这次重构是破坏了兼容性的,改变了库的调用方式,因此老版本的调用代码需要做出改变。OpenAI 也给出了一个迁移指导文档 v1.0.0 Migration Guide,还提供了自动化迁移脚本,可以一键迁移。
OpenAPI Specification
根据 stainless 的说法,自动化生成代码的依据就是 OpenAPI 描述文件,具体协议可以参考文档 OpenAPI Specification。OpenAPI 主要用于设计、构建、文档化和使用 RESTful Web 服务。它提供了一种标准化的方法来描述 RESTful 接口,方便开发者用 YAML 或 JSON 格式定义 API 的请求路径、参数、响应、安全性等。有了描述文件,就可以自动化生成人类可读的文档,创建自动化测试,包括生成客户端 SDK等。
OpenAI ChatGPT 的 API 定义也是开源的,在 Github 仓库 openai-openapi 中,2.0 版本的 API 接口定义在这里可以看到。
这里以 /chat/completions
接口为例,来看看一个接口要定义哪些内容。首先是一些元信息:
1 | paths: |
其中 post 说明这个接口支持 post 请求,operationId 是这个操作的唯一标识符,tags 将这个操作分类为 “Chat”,summary 提供了这个操作的简短描述。接下来是关键的对请求和响应的一些约束,整体有比较高的可读性了,比如 requestBody 定义了请求需要的数据,required: true 表示请求体是必需的,content 指定了请求体的内容类型,这里是 application/json。这里需要说明的是 schema 引用了一个定义在文档其他地方的模式(CreateChatCompletionRequest),用于描述请求体的结构。这样做的好处是,可以在多个地方引用同一个模式,避免重复写同样的内容。
1 | requestBody: |
CreateChatCompletionRequest 的定义在后面,如下图,也是比较复杂的。里面会对请求体里面每个参数的类型,是否必须,是否是 enum 内容等都做了详细的说明。请求的回复 responses 也是类似的,整个回包靠 CreateChatCompletionResponse 指定格式,这里不再赘述。
接下来是自定义扩展元数据 x-oaiMeta
部分,name, group, returns, path 提供了操作的额外信息,examples 提供了不同场景下的请求和响应示例,包括使用 cURL、Python 和 Node.js 的代码示例,以及相应的响应体示例。通过提供具体的使用示例,使得 API 文档更加易于理解和使用。
总结
目前 stainless 应该还是 beta 阶段,只有 OpenAI, Lithic 等个别几家公司使用,也没有对外的详细文档。并且从目前的收费标准来看,需要 250$/month,对于小开发者来说,还是有点贵的。不过如果后面足够成熟,还是可以考虑引入 stainless 来生成代码,这样就不用人工去写了,也不用太担心代码质量问题。
不得不说,OpenAI 不亏是 AI 的引领者,从这里 SDK 代码生成的自动化过程,也能感受到对写代码这件事情的不断优化。相信随着 AI 的不断成熟,写代码这件事情,AI 参与的会越来越多,帮忙生成越来越多代码。