OpenAI Assistants v2 api support for OpenAIAssistantRunnable (#21484)

**Title**: "langchain: OpenAI Assistants v2 api support" ***Descriptions*** - [x] "attachments" support added along with backward compatibility of "file_ids" - [x] "tool_resources" support added while creating new assistant - [ ] "tool_choice" parameter support - [ ] Streaming support - **Dependencies:** OpenAI v2 API (openai>=1.23.0) - **Twitter handle:** @skanta_rath --------- Co-authored-by: Chester Curme <chester.curme@gmail.com>
4 weeks ago · eb096675a8
parent 7a5d042bd2
commit eb096675a8
2 changed files with 526 additions and 1 deletions
--- a/libs/langchain/langchain/agents/openai_assistant/init.py
+++ b/libs/langchain/langchain/agents/openai_assistant/init.py
@ -1,3 +1,4 @@
 from langchain.agents.openai_assistant.base import OpenAIAssistantRunnable
+from langchain.agents.openai_assistant.base_v2 import OpenAIAssistantV2Runnable

-__all__ = ["OpenAIAssistantRunnable"]
+__all__ = ["OpenAIAssistantRunnable", "OpenAIAssistantV2Runnable"]
--- a/libs/langchain/langchain/agents/openai_assistant/base_v2.py
+++ b/libs/langchain/langchain/agents/openai_assistant/base_v2.py
@ -0,0 +1,524 @@
+from __future__ import annotations
+
+from typing import (
+    TYPE_CHECKING,
+    Any,
+    Callable,
+    Dict,
+    Optional,
+    Sequence,
+    Type,
+    Union,
+)
+
+from langchain_core._api import beta
+from langchain_core.callbacks import CallbackManager
+from langchain_core.load import dumpd
+from langchain_core.pydantic_v1 import BaseModel, Field, root_validator
+from langchain_core.runnables import RunnableConfig, ensure_config
+from langchain_core.tools import BaseTool
+from langchain_core.utils.function_calling import convert_to_openai_tool
+
+from langchain.agents.openai_assistant.base import OpenAIAssistantRunnable, OutputType
+
+if TYPE_CHECKING:
+    import openai
+    from openai._types import NotGiven
+    from openai.types.beta.assistant import ToolResources as AssistantToolResources
+
+
+def _get_openai_client() -> openai.OpenAI:
+    try:
+        import openai
+
+        return openai.OpenAI(default_headers={"OpenAI-Beta": "assistants=v2"})
+    except ImportError as e:
+        raise ImportError(
+            "Unable to import openai, please install with `pip install openai`."
+        ) from e
+    except AttributeError as e:
+        raise AttributeError(
+            "Please make sure you are using a v1.23-compatible version of openai. You "
+            'can install with `pip install "openai>=1.23"`.'
+        ) from e
+
+
+def _get_openai_async_client() -> openai.AsyncOpenAI:
+    try:
+        import openai
+
+        return openai.AsyncOpenAI(default_headers={"OpenAI-Beta": "assistants=v2"})
+    except ImportError as e:
+        raise ImportError(
+            "Unable to import openai, please install with `pip install openai`."
+        ) from e
+    except AttributeError as e:
+        raise AttributeError(
+            "Please make sure you are using a v1.23-compatible version of openai. You "
+            'can install with `pip install "openai>=1.23"`.'
+        ) from e
+
+
+def _convert_file_ids_into_attachments(file_ids: list) -> list:
+    """
+    Convert file_ids into attachments
+    File search and Code interpreter will be turned on by default
+    """
+    attachments = []
+    for id in file_ids:
+        attachments.append(
+            {
+                "file_id": id,
+                "tools": [{"type": "file_search"}, {"type": "code_interpreter"}],
+            }
+        )
+    return attachments
+
+
+def _is_assistants_builtin_tool(
+    tool: Union[Dict[str, Any], Type[BaseModel], Callable, BaseTool],
+) -> bool:
+    """Determine if tool corresponds to OpenAI Assistants built-in."""
+    assistants_builtin_tools = ("code_interpreter", "retrieval")
+    return (
+        isinstance(tool, dict)
+        and ("type" in tool)
+        and (tool["type"] in assistants_builtin_tools)
+    )
+
+
+def _get_assistants_tool(
+    tool: Union[Dict[str, Any], Type[BaseModel], Callable, BaseTool],
+) -> Dict[str, Any]:
+    """Convert a raw function/class to an OpenAI tool.
+
+    Note that OpenAI assistants supports several built-in tools,
+    such as "code_interpreter" and "retrieval."
+    """
+    if _is_assistants_builtin_tool(tool):
+        return tool  # type: ignore
+    else:
+        return convert_to_openai_tool(tool)
+
+
+@beta()
+class OpenAIAssistantV2Runnable(OpenAIAssistantRunnable):
+    """Run an OpenAI Assistant.
+
+    Example using OpenAI tools:
+        .. code-block:: python
+
+            from langchain.agents.openai_assistant import OpenAIAssistantV2Runnable
+
+            interpreter_assistant = OpenAIAssistantV2Runnable.create_assistant(
+                name="langchain assistant",
+                instructions="You are a personal math tutor. Write and run code to answer math questions.",
+                tools=[{"type": "code_interpreter"}],
+                model="gpt-4-1106-preview"
+            )
+            output = interpreter_assistant.invoke({"content": "What's 10 - 4 raised to the 2.7"})
+
+    Example using custom tools and AgentExecutor:
+        .. code-block:: python
+
+            from langchain.agents.openai_assistant import OpenAIAssistantV2Runnable
+            from langchain.agents import AgentExecutor
+            from langchain.tools import E2BDataAnalysisTool
+
+
+            tools = [E2BDataAnalysisTool(api_key="...")]
+            agent = OpenAIAssistantV2Runnable.create_assistant(
+                name="langchain assistant e2b tool",
+                instructions="You are a personal math tutor. Write and run code to answer math questions.",
+                tools=tools,
+                model="gpt-4-1106-preview",
+                as_agent=True
+            )
+
+            agent_executor = AgentExecutor(agent=agent, tools=tools)
+            agent_executor.invoke({"content": "What's 10 - 4 raised to the 2.7"})
+
+
+    Example using custom tools and custom execution:
+        .. code-block:: python
+
+            from langchain.agents.openai_assistant import OpenAIAssistantV2Runnable
+            from langchain.agents import AgentExecutor
+            from langchain_core.agents import AgentFinish
+            from langchain.tools import E2BDataAnalysisTool
+
+
+            tools = [E2BDataAnalysisTool(api_key="...")]
+            agent = OpenAIAssistantV2Runnable.create_assistant(
+                name="langchain assistant e2b tool",
+                instructions="You are a personal math tutor. Write and run code to answer math questions.",
+                tools=tools,
+                model="gpt-4-1106-preview",
+                as_agent=True
+            )
+
+            def execute_agent(agent, tools, input):
+                tool_map = {tool.name: tool for tool in tools}
+                response = agent.invoke(input)
+                while not isinstance(response, AgentFinish):
+                    tool_outputs = []
+                    for action in response:
+                        tool_output = tool_map[action.tool].invoke(action.tool_input)
+                        tool_outputs.append({"output": tool_output, "tool_call_id": action.tool_call_id})
+                    response = agent.invoke(
+                        {
+                            "tool_outputs": tool_outputs,
+                            "run_id": action.run_id,
+                            "thread_id": action.thread_id
+                        }
+                    )
+
+                return response
+
+            response = execute_agent(agent, tools, {"content": "What's 10 - 4 raised to the 2.7"})
+            next_response = execute_agent(agent, tools, {"content": "now add 17.241", "thread_id": response.thread_id})
+
+    """  # noqa: E501
+
+    client: Any = Field(default_factory=_get_openai_client)
+    """OpenAI or AzureOpenAI client."""
+    async_client: Any = None
+    """OpenAI or AzureOpenAI async client."""
+    assistant_id: str
+    """OpenAI assistant id."""
+    check_every_ms: float = 1_000.0
+    """Frequency with which to check run progress in ms."""
+    as_agent: bool = False
+    """Use as a LangChain agent, compatible with the AgentExecutor."""
+
+    @root_validator()
+    def validate_async_client(cls, values: dict) -> dict:
+        if values["async_client"] is None:
+            import openai
+
+            api_key = values["client"].api_key
+            values["async_client"] = openai.AsyncOpenAI(api_key=api_key)
+        return values
+
+    @classmethod
+    def create_assistant(
+        cls,
+        name: str,
+        instructions: str,
+        tools: Sequence[Union[BaseTool, dict]],
+        model: str,
+        *,
+        client: Optional[Union[openai.OpenAI, openai.AzureOpenAI]] = None,
+        tool_resources: Optional[Union[AssistantToolResources, dict, NotGiven]] = None,
+        **kwargs: Any,
+    ) -> OpenAIAssistantRunnable:
+        """Create an OpenAI Assistant and instantiate the Runnable.
+
+        Args:
+            name: Assistant name.
+            instructions: Assistant instructions.
+            tools: Assistant tools. Can be passed in OpenAI format or as BaseTools.
+            tool_resources: Assistant tool resources. Can be passed in OpenAI format
+            model: Assistant model to use.
+            client: OpenAI or AzureOpenAI client.
+                Will create default OpenAI client (Assistant v2) if not specified.
+
+        Returns:
+            OpenAIAssistantRunnable configured to run using the created assistant.
+        """
+
+        client = client or _get_openai_client()
+        if tool_resources is None:
+            from openai._types import NOT_GIVEN
+
+            tool_resources = NOT_GIVEN
+        assistant = client.beta.assistants.create(
+            name=name,
+            instructions=instructions,
+            tools=[_get_assistants_tool(tool) for tool in tools],  # type: ignore
+            tool_resources=tool_resources,
+            model=model,
+        )
+        return cls(assistant_id=assistant.id, client=client, **kwargs)
+
+    def invoke(
+        self, input: dict, config: Optional[RunnableConfig] = None, **kwargs: Any
+    ) -> OutputType:
+        """Invoke assistant.
+
+        Args:
+            input: Runnable input dict that can have:
+                content: User message when starting a new run.
+                thread_id: Existing thread to use.
+                run_id: Existing run to use. Should only be supplied when providing
+                    the tool output for a required action after an initial invocation.
+                file_ids: (deprecated) File ids to include in new run. Use
+                    'attachments' instead
+                attachments: Assistant files to include in new run. (v2 API).
+                message_metadata: Metadata to associate with new message.
+                thread_metadata: Metadata to associate with new thread. Only relevant
+                    when new thread being created.
+                instructions: Additional run instructions.
+                model: Override Assistant model for this run.
+                tools: Override Assistant tools for this run.
+                tool_resources: Override Assistant tool resources for this run (v2 API).
+                run_metadata: Metadata to associate with new run.
+            config: Runnable config:
+
+        Return:
+            If self.as_agent, will return
+                Union[List[OpenAIAssistantAction], OpenAIAssistantFinish]. Otherwise,
+                will return OpenAI types
+                Union[List[ThreadMessage], List[RequiredActionFunctionToolCall]].
+        """
+
+        config = ensure_config(config)
+        callback_manager = CallbackManager.configure(
+            inheritable_callbacks=config.get("callbacks"),
+            inheritable_tags=config.get("tags"),
+            inheritable_metadata=config.get("metadata"),
+        )
+        run_manager = callback_manager.on_chain_start(
+            dumpd(self), input, name=config.get("run_name")
+        )
+
+        files = _convert_file_ids_into_attachments(kwargs.get("file_ids", []))
+        attachments = kwargs.get("attachments", []) + files
+
+        try:
+            # Being run within AgentExecutor and there are tool outputs to submit.
+            if self.as_agent and input.get("intermediate_steps"):
+                tool_outputs = self._parse_intermediate_steps(
+                    input["intermediate_steps"]
+                )
+                run = self.client.beta.threads.runs.submit_tool_outputs(**tool_outputs)
+            # Starting a new thread and a new run.
+            elif "thread_id" not in input:
+                thread = {
+                    "messages": [
+                        {
+                            "role": "user",
+                            "content": input["content"],
+                            "attachments": attachments,
+                            "metadata": input.get("message_metadata"),
+                        }
+                    ],
+                    "metadata": input.get("thread_metadata"),
+                }
+                run = self._create_thread_and_run(input, thread)
+            # Starting a new run in an existing thread.
+            elif "run_id" not in input:
+                _ = self.client.beta.threads.messages.create(
+                    input["thread_id"],
+                    content=input["content"],
+                    role="user",
+                    attachments=attachments,
+                    metadata=input.get("message_metadata"),
+                )
+                run = self._create_run(input)
+            # Submitting tool outputs to an existing run, outside the AgentExecutor
+            # framework.
+            else:
+                run = self.client.beta.threads.runs.submit_tool_outputs(**input)
+            run = self._wait_for_run(run.id, run.thread_id)
+        except BaseException as e:
+            run_manager.on_chain_error(e)
+            raise e
+        try:
+            response = self._get_response(run)
+        except BaseException as e:
+            run_manager.on_chain_error(e, metadata=run.dict())
+            raise e
+        else:
+            run_manager.on_chain_end(response)
+            return response
+
+    @classmethod
+    async def acreate_assistant(
+        cls,
+        name: str,
+        instructions: str,
+        tools: Sequence[Union[BaseTool, dict]],
+        model: str,
+        *,
+        async_client: Optional[
+            Union[openai.AsyncOpenAI, openai.AsyncAzureOpenAI]
+        ] = None,
+        tool_resources: Optional[Union[AssistantToolResources, dict, NotGiven]] = None,
+        **kwargs: Any,
+    ) -> OpenAIAssistantRunnable:
+        """Create an AsyncOpenAI Assistant and instantiate the Runnable.
+
+        Args:
+            name: Assistant name.
+            instructions: Assistant instructions.
+            tools: Assistant tools. Can be passed in OpenAI format or as BaseTools.
+            tool_resources: Assistant tool resources. Can be passed in OpenAI format
+            model: Assistant model to use.
+            async_client: AsyncOpenAI client.
+            Will create default async_client if not specified.
+
+        Returns:
+            AsyncOpenAIAssistantRunnable configured to run using the created assistant.
+        """
+        async_client = async_client or _get_openai_async_client()
+        if tool_resources is None:
+            from openai._types import NOT_GIVEN
+
+            tool_resources = NOT_GIVEN
+        openai_tools = [_get_assistants_tool(tool) for tool in tools]
+
+        assistant = await async_client.beta.assistants.create(
+            name=name,
+            instructions=instructions,
+            tools=openai_tools,  # type: ignore
+            tool_resources=tool_resources,
+            model=model,
+        )
+        return cls(assistant_id=assistant.id, async_client=async_client, **kwargs)
+
+    async def ainvoke(
+        self, input: dict, config: Optional[RunnableConfig] = None, **kwargs: Any
+    ) -> OutputType:
+        """Async invoke assistant.
+
+        Args:
+            input: Runnable input dict that can have:
+                content: User message when starting a new run.
+                thread_id: Existing thread to use.
+                run_id: Existing run to use. Should only be supplied when providing
+                    the tool output for a required action after an initial invocation.
+                file_ids: (deprecated) File ids to include in new run. Use
+                    'attachments' instead
+                attachments: Assistant files to include in new run. (v2 API).
+                message_metadata: Metadata to associate with new message.
+                thread_metadata: Metadata to associate with new thread. Only relevant
+                    when new thread being created.
+                instructions: Additional run instructions.
+                model: Override Assistant model for this run.
+                tools: Override Assistant tools for this run.
+                tool_resources: Override Assistant tool resources for this run (v2 API).
+                run_metadata: Metadata to associate with new run.
+            config: Runnable config:
+
+        Return:
+            If self.as_agent, will return
+                Union[List[OpenAIAssistantAction], OpenAIAssistantFinish]. Otherwise,
+                will return OpenAI types
+                Union[List[ThreadMessage], List[RequiredActionFunctionToolCall]].
+        """
+
+        config = config or {}
+        callback_manager = CallbackManager.configure(
+            inheritable_callbacks=config.get("callbacks"),
+            inheritable_tags=config.get("tags"),
+            inheritable_metadata=config.get("metadata"),
+        )
+        run_manager = callback_manager.on_chain_start(
+            dumpd(self), input, name=config.get("run_name")
+        )
+
+        files = _convert_file_ids_into_attachments(kwargs.get("file_ids", []))
+        attachments = kwargs.get("attachments", []) + files
+
+        try:
+            # Being run within AgentExecutor and there are tool outputs to submit.
+            if self.as_agent and input.get("intermediate_steps"):
+                tool_outputs = self._parse_intermediate_steps(
+                    input["intermediate_steps"]
+                )
+                run = await self.async_client.beta.threads.runs.submit_tool_outputs(
+                    **tool_outputs
+                )
+            # Starting a new thread and a new run.
+            elif "thread_id" not in input:
+                thread = {
+                    "messages": [
+                        {
+                            "role": "user",
+                            "content": input["content"],
+                            "attachments": attachments,
+                            "metadata": input.get("message_metadata"),
+                        }
+                    ],
+                    "metadata": input.get("thread_metadata"),
+                }
+                run = await self._acreate_thread_and_run(input, thread)
+            # Starting a new run in an existing thread.
+            elif "run_id" not in input:
+                _ = await self.async_client.beta.threads.messages.create(
+                    input["thread_id"],
+                    content=input["content"],
+                    role="user",
+                    attachments=attachments,
+                    metadata=input.get("message_metadata"),
+                )
+                run = await self._acreate_run(input)
+            # Submitting tool outputs to an existing run, outside the AgentExecutor
+            # framework.
+            else:
+                run = await self.async_client.beta.threads.runs.submit_tool_outputs(
+                    **input
+                )
+            run = await self._await_for_run(run.id, run.thread_id)
+        except BaseException as e:
+            run_manager.on_chain_error(e)
+            raise e
+        try:
+            response = self._get_response(run)
+        except BaseException as e:
+            run_manager.on_chain_error(e, metadata=run.dict())
+            raise e
+        else:
+            run_manager.on_chain_end(response)
+            return response
+
+    def _create_run(self, input: dict) -> Any:
+        params = {
+            k: v
+            for k, v in input.items()
+            if k in ("instructions", "model", "tools", "tool_resources", "run_metadata")
+        }
+        return self.client.beta.threads.runs.create(
+            input["thread_id"],
+            assistant_id=self.assistant_id,
+            **params,
+        )
+
+    def _create_thread_and_run(self, input: dict, thread: dict) -> Any:
+        params = {
+            k: v
+            for k, v in input.items()
+            if k in ("instructions", "model", "tools", "tool_resources", "run_metadata")
+        }
+        run = self.client.beta.threads.create_and_run(
+            assistant_id=self.assistant_id,
+            thread=thread,
+            **params,
+        )
+        return run
+
+    async def _acreate_run(self, input: dict) -> Any:
+        params = {
+            k: v
+            for k, v in input.items()
+            if k in ("instructions", "model", "tools", "tool_resources" "run_metadata")
+        }
+        return await self.async_client.beta.threads.runs.create(
+            input["thread_id"],
+            assistant_id=self.assistant_id,
+            **params,
+        )
+
+    async def _acreate_thread_and_run(self, input: dict, thread: dict) -> Any:
+        params = {
+            k: v
+            for k, v in input.items()
+            if k in ("instructions", "model", "tools", "tool_resources", "run_metadata")
+        }
+        run = await self.async_client.beta.threads.create_and_run(
+            assistant_id=self.assistant_id,
+            thread=thread,
+            **params,
+        )
+        return run