EVAL/core/agents/llm.py

"""OpenAI chat wrapper."""
from __future__ import annotations

import logging
import sys
from typing import Any, Callable, Dict, List, Mapping, Optional, Tuple

import openai

from langchain.chat_models.base import BaseChatModel
from langchain.schema import (
    AIMessage,
    BaseMessage,
    ChatGeneration,
    ChatMessage,
    ChatResult,
    HumanMessage,
    SystemMessage,
)
from langchain.utils import get_from_dict_or_env
from logger import logger
from pydantic import BaseModel, Extra, Field, root_validator
from tenacity import (
    before_sleep_log,
    retry,
    retry_if_exception_type,
    stop_after_attempt,
    wait_exponential,
)

from env import settings
from ansi import ANSI, Color, Style


def _create_retry_decorator(llm: ChatOpenAI) -> Callable[[Any], Any]:
    import openai

    min_seconds = 4
    max_seconds = 10
    # Wait 2^x * 1 second between each retry starting with
    # 4 seconds, then up to 10 seconds, then 10 seconds afterwards
    return retry(
        reraise=True,
        stop=stop_after_attempt(llm.max_retries),
        wait=wait_exponential(multiplier=1, min=min_seconds, max=max_seconds),
        retry=(
            retry_if_exception_type(openai.error.Timeout)
            | retry_if_exception_type(openai.error.APIError)
            | retry_if_exception_type(openai.error.APIConnectionError)
            | retry_if_exception_type(openai.error.RateLimitError)
            | retry_if_exception_type(openai.error.ServiceUnavailableError)
        ),
        before_sleep=before_sleep_log(logger, logging.WARNING),
    )


async def acompletion_with_retry(llm: ChatOpenAI, **kwargs: Any) -> Any:
    """Use tenacity to retry the async completion call."""
    retry_decorator = _create_retry_decorator(llm)

    @retry_decorator
    async def _completion_with_retry(**kwargs: Any) -> Any:
        # Use OpenAI's async api https://github.com/openai/openai-python#async-api
        return await llm.client.acreate(**kwargs)

    return await _completion_with_retry(**kwargs)


def _convert_dict_to_message(_dict: dict) -> BaseMessage:
    role = _dict["role"]
    if role == "user":
        return HumanMessage(content=_dict["content"])
    elif role == "assistant":
        return AIMessage(content=_dict["content"])
    elif role == "system":
        return SystemMessage(content=_dict["content"])
    else:
        return ChatMessage(content=_dict["content"], role=role)


def _convert_message_to_dict(message: BaseMessage) -> dict:
    if isinstance(message, ChatMessage):
        message_dict = {"role": message.role, "content": message.content}
    elif isinstance(message, HumanMessage):
        message_dict = {"role": "user", "content": message.content}
    elif isinstance(message, AIMessage):
        message_dict = {"role": "assistant", "content": message.content}
    elif isinstance(message, SystemMessage):
        message_dict = {"role": "system", "content": message.content}
    else:
        raise ValueError(f"Got unknown type {message}")
    if "name" in message.additional_kwargs:
        message_dict["name"] = message.additional_kwargs["name"]
    return message_dict


def _create_chat_result(response: Mapping[str, Any]) -> ChatResult:
    generations = []
    for res in response["choices"]:
        message = _convert_dict_to_message(res["message"])
        gen = ChatGeneration(message=message)
        generations.append(gen)
    return ChatResult(generations=generations)


class ModelNotFoundException(Exception):
    """Exception raised when the model is not found."""

    def __init__(self, model_name: str):
        self.model_name = model_name
        super().__init__(
            f"\n\nModel {ANSI(self.model_name).to(Color.red())} does not exist.\nMake sure if you have access to the model.\n"
            + f"You can the model name with the environment variable {ANSI('MODEL_NAME').to(Style.bold())} on {ANSI('.env').to(Style.bold())}.\n"
            + "\nex) MODEL_NAME=gpt-4\n"
            + ANSI(
                "\nLooks like you don't have access to gpt-4 yet. Try using `gpt-3.5-turbo`."
                if self.model_name == "gpt-4"
                else ""
            ).to(Style.italic())
        )


class ChatOpenAI(BaseChatModel, BaseModel):
    """Wrapper around OpenAI Chat large language models.

    To use, you should have the ``openai`` python package installed, and the
    environment variable ``OPENAI_API_KEY`` set with your API key.

    Any parameters that are valid to be passed to the openai.create call can be passed
    in, even if not explicitly saved on this class.

    Example:
        .. code-block:: python

            from langchain.chat_models import ChatOpenAI
            openai = ChatOpenAI(model_name="gpt-3.5-turbo")
    """

    client: Any  #: :meta private:
    model_name: str = settings["MODEL_NAME"]
    """Model name to use."""
    model_kwargs: Dict[str, Any] = Field(default_factory=dict)
    """Holds any model parameters valid for `create` call not explicitly specified."""
    openai_api_key: Optional[str] = None
    max_retries: int = 6
    """Maximum number of retries to make when generating."""
    streaming: bool = False
    """Whether to stream the results or not."""
    n: int = 1
    """Number of chat completions to generate for each prompt."""
    max_tokens: int = 2048
    """Maximum number of tokens to generate."""

    class Config:
        """Configuration for this pydantic object."""

        extra = Extra.ignore

    def check_access(self) -> None:
        """Check that the user has access to the model."""

        try:
            openai.Engine.retrieve(self.model_name)
        except openai.error.InvalidRequestError:
            raise ModelNotFoundException(self.model_name)

    @root_validator(pre=True)
    def build_extra(cls, values: Dict[str, Any]) -> Dict[str, Any]:
        """Build extra kwargs from additional params that were passed in."""
        all_required_field_names = {field.alias for field in cls.__fields__.values()}

        extra = values.get("model_kwargs", {})
        for field_name in list(values):
            if field_name not in all_required_field_names:
                if field_name in extra:
                    raise ValueError(f"Found {field_name} supplied twice.")
                extra[field_name] = values.pop(field_name)
        values["model_kwargs"] = extra
        return values

    @root_validator()
    def validate_environment(cls, values: Dict) -> Dict:
        """Validate that api key and python package exists in environment."""
        openai_api_key = get_from_dict_or_env(
            values, "openai_api_key", "OPENAI_API_KEY"
        )
        try:
            import openai

            openai.api_key = openai_api_key
        except ImportError:
            raise ValueError(
                "Could not import openai python package. "
                "Please it install it with `pip install openai`."
            )
        try:
            values["client"] = openai.ChatCompletion
        except AttributeError:
            raise ValueError(
                "`openai` has no `ChatCompletion` attribute, this is likely "
                "due to an old version of the openai package. Try upgrading it "
                "with `pip install --upgrade openai`."
            )
        if values["n"] < 1:
            raise ValueError("n must be at least 1.")
        if values["n"] > 1 and values["streaming"]:
            raise ValueError("n must be 1 when streaming.")
        return values

    @property
    def _default_params(self) -> Dict[str, Any]:
        """Get the default parameters for calling OpenAI API."""
        return {
            "model": self.model_name,
            "max_tokens": self.max_tokens,
            "stream": self.streaming,
            "n": self.n,
            **self.model_kwargs,
        }

    def _create_retry_decorator(self) -> Callable[[Any], Any]:
        import openai

        min_seconds = 4
        max_seconds = 10
        # Wait 2^x * 1 second between each retry starting with
        # 4 seconds, then up to 10 seconds, then 10 seconds afterwards
        return retry(
            reraise=True,
            stop=stop_after_attempt(self.max_retries),
            wait=wait_exponential(multiplier=1, min=min_seconds, max=max_seconds),
            retry=(
                retry_if_exception_type(openai.error.Timeout)
                | retry_if_exception_type(openai.error.APIError)
                | retry_if_exception_type(openai.error.APIConnectionError)
                | retry_if_exception_type(openai.error.RateLimitError)
                | retry_if_exception_type(openai.error.ServiceUnavailableError)
            ),
            before_sleep=before_sleep_log(logger, logging.WARNING),
        )

    def completion_with_retry(self, **kwargs: Any) -> Any:
        """Use tenacity to retry the completion call."""
        retry_decorator = self._create_retry_decorator()

        @retry_decorator
        def _completion_with_retry(**kwargs: Any) -> Any:
            response = self.client.create(**kwargs)
            logger.debug("Response:\n\t%s", response)
            return response

        return _completion_with_retry(**kwargs)

    def _generate(
        self, messages: List[BaseMessage], stop: Optional[List[str]] = None
    ) -> ChatResult:
        message_dicts, params = self._create_message_dicts(messages, stop)
        logger.debug("Messages:\n")
        for item in message_dicts:
            for k, v in item.items():
                logger.debug(f"\t\t{k}: {v}")
            logger.debug("\t-------")
        logger.debug("===========")

        if self.streaming:
            inner_completion = ""
            role = "assistant"
            params["stream"] = True
            for stream_resp in self.completion_with_retry(
                messages=message_dicts, **params
            ):
                role = stream_resp["choices"][0]["delta"].get("role", role)
                token = stream_resp["choices"][0]["delta"].get("content", "")
                inner_completion += token
                self.callback_manager.on_llm_new_token(
                    token,
                    verbose=self.verbose,
                )
            message = _convert_dict_to_message(
                {"content": inner_completion, "role": role}
            )
            return ChatResult(generations=[ChatGeneration(message=message)])
        response = self.completion_with_retry(messages=message_dicts, **params)
        return _create_chat_result(response)

    def _create_message_dicts(
        self, messages: List[BaseMessage], stop: Optional[List[str]]
    ) -> Tuple[List[Dict[str, Any]], Dict[str, Any]]:
        params: Dict[str, Any] = {**{"model": self.model_name}, **self._default_params}
        if stop is not None:
            if "stop" in params:
                raise ValueError("`stop` found in both the input and default params.")
            params["stop"] = stop
        message_dicts = [_convert_message_to_dict(m) for m in messages]
        return message_dicts, params

    async def _agenerate(
        self, messages: List[BaseMessage], stop: Optional[List[str]] = None
    ) -> ChatResult:
        message_dicts, params = self._create_message_dicts(messages, stop)
        if self.streaming:
            inner_completion = ""
            role = "assistant"
            params["stream"] = True
            async for stream_resp in await acompletion_with_retry(
                self, messages=message_dicts, **params
            ):
                role = stream_resp["choices"][0]["delta"].get("role", role)
                token = stream_resp["choices"][0]["delta"].get("content", "")
                inner_completion += token
                if self.callback_manager.is_async:
                    await self.callback_manager.on_llm_new_token(
                        token,
                        verbose=self.verbose,
                    )
                else:
                    self.callback_manager.on_llm_new_token(
                        token,
                        verbose=self.verbose,
                    )
            message = _convert_dict_to_message(
                {"content": inner_completion, "role": role}
            )
            return ChatResult(generations=[ChatGeneration(message=message)])
        else:
            response = await acompletion_with_retry(
                self, messages=message_dicts, **params
            )
            return _create_chat_result(response)

    @property
    def _identifying_params(self) -> Mapping[str, Any]:
        """Get the identifying parameters."""
        return {**{"model_name": self.model_name}, **self._default_params}

    def get_num_tokens(self, text: str) -> int:
        """Calculate num tokens with tiktoken package."""
        # tiktoken NOT supported for Python 3.8 or below
        if sys.version_info[1] <= 8:
            return super().get_num_tokens(text)
        try:
            import tiktoken
        except ImportError:
            raise ValueError(
                "Could not import tiktoken python package. "
                "This is needed in order to calculate get_num_tokens. "
                "Please it install it with `pip install tiktoken`."
            )
        # create a GPT-3.5-Turbo encoder instance
        enc = tiktoken.encoding_for_model(self.model_name)

        # encode the text using the GPT-3.5-Turbo encoder
        tokenized_text = enc.encode(text)

        # calculate the number of tokens in the encoded text
        return len(tokenized_text)
feat: init 2023-03-17 15:55:15 +00:00			`"""OpenAI chat wrapper."""`
			`from __future__ import annotations`

			`import logging`
			`import sys`
			`from typing import Any, Callable, Dict, List, Mapping, Optional, Tuple`

feat: model_name as an env, and check accessability to the model (#22) 2023-04-07 11:52:55 +00:00			`import openai`

feat: init 2023-03-17 15:55:15 +00:00			`from langchain.chat_models.base import BaseChatModel`
			`from langchain.schema import (`
			`AIMessage,`
			`BaseMessage,`
			`ChatGeneration,`
			`ChatMessage,`
			`ChatResult,`
			`HumanMessage,`
			`SystemMessage,`
			`)`
			`from langchain.utils import get_from_dict_or_env`
stdout/stderr tracer (#12) * feat: stdout tracer * fix: lower temperature * fix: comment-out APPEND tool * feat: add what i should do * fix: add patch prompt example and write tool outputs written code * feat: stdout tracer * feat: test * fix: prompt * feat: rollback * fix: patch tool --------- Co-authored-by: adldotori <adldotori@gmail.com> 2023-04-05 03:37:20 +00:00			`from logger import logger`
feat: import order 2023-04-03 07:43:34 +00:00			`from pydantic import BaseModel, Extra, Field, root_validator`
			`from tenacity import (`
			`before_sleep_log,`
			`retry,`
			`retry_if_exception_type,`
			`stop_after_attempt,`
			`wait_exponential,`
			`)`
feat: init 2023-03-17 15:55:15 +00:00
feat: model_name as an env, and check accessability to the model (#22) 2023-04-07 11:52:55 +00:00			`from env import settings`
			`from ansi import ANSI, Color, Style`

feat: init 2023-03-17 15:55:15 +00:00
			`def _create_retry_decorator(llm: ChatOpenAI) -> Callable[[Any], Any]:`
			`import openai`

			`min_seconds = 4`
			`max_seconds = 10`
			`# Wait 2^x * 1 second between each retry starting with`
			`# 4 seconds, then up to 10 seconds, then 10 seconds afterwards`
			`return retry(`
			`reraise=True,`
			`stop=stop_after_attempt(llm.max_retries),`
			`wait=wait_exponential(multiplier=1, min=min_seconds, max=max_seconds),`
			`retry=(`
			`retry_if_exception_type(openai.error.Timeout)`
			`\| retry_if_exception_type(openai.error.APIError)`
			`\| retry_if_exception_type(openai.error.APIConnectionError)`
			`\| retry_if_exception_type(openai.error.RateLimitError)`
			`\| retry_if_exception_type(openai.error.ServiceUnavailableError)`
			`),`
			`before_sleep=before_sleep_log(logger, logging.WARNING),`
			`)`


			`async def acompletion_with_retry(llm: ChatOpenAI, **kwargs: Any) -> Any:`
			`"""Use tenacity to retry the async completion call."""`
			`retry_decorator = _create_retry_decorator(llm)`

			`@retry_decorator`
			`async def _completion_with_retry(**kwargs: Any) -> Any:`
			`# Use OpenAI's async api https://github.com/openai/openai-python#async-api`
			`return await llm.client.acreate(**kwargs)`

			`return await _completion_with_retry(**kwargs)`


			`def _convert_dict_to_message(_dict: dict) -> BaseMessage:`
			`role = _dict["role"]`
			`if role == "user":`
			`return HumanMessage(content=_dict["content"])`
			`elif role == "assistant":`
			`return AIMessage(content=_dict["content"])`
			`elif role == "system":`
			`return SystemMessage(content=_dict["content"])`
			`else:`
			`return ChatMessage(content=_dict["content"], role=role)`


			`def _convert_message_to_dict(message: BaseMessage) -> dict:`
			`if isinstance(message, ChatMessage):`
			`message_dict = {"role": message.role, "content": message.content}`
			`elif isinstance(message, HumanMessage):`
			`message_dict = {"role": "user", "content": message.content}`
			`elif isinstance(message, AIMessage):`
			`message_dict = {"role": "assistant", "content": message.content}`
			`elif isinstance(message, SystemMessage):`
			`message_dict = {"role": "system", "content": message.content}`
			`else:`
			`raise ValueError(f"Got unknown type {message}")`
			`if "name" in message.additional_kwargs:`
			`message_dict["name"] = message.additional_kwargs["name"]`
			`return message_dict`


			`def _create_chat_result(response: Mapping[str, Any]) -> ChatResult:`
			`generations = []`
			`for res in response["choices"]:`
			`message = _convert_dict_to_message(res["message"])`
			`gen = ChatGeneration(message=message)`
			`generations.append(gen)`
			`return ChatResult(generations=generations)`


feat: model_name as an env, and check accessability to the model (#22) 2023-04-07 11:52:55 +00:00			`class ModelNotFoundException(Exception):`
			`"""Exception raised when the model is not found."""`

			`def __init__(self, model_name: str):`
			`self.model_name = model_name`
			`super().__init__(`
			`f"\n\nModel {ANSI(self.model_name).to(Color.red())} does not exist.\nMake sure if you have access to the model.\n"`
			`+ f"You can the model name with the environment variable {ANSI('MODEL_NAME').to(Style.bold())} on {ANSI('.env').to(Style.bold())}.\n"`
			`+ "\nex) MODEL_NAME=gpt-4\n"`
			`+ ANSI(`
			"\nLooks like you don't have access to gpt-4 yet. Try using `gpt-3.5-turbo`."
			`if self.model_name == "gpt-4"`
			`else ""`
			`).to(Style.italic())`
			`)`


feat: init 2023-03-17 15:55:15 +00:00			`class ChatOpenAI(BaseChatModel, BaseModel):`
			`"""Wrapper around OpenAI Chat large language models.`

			To use, you should have the ``openai`` python package installed, and the
			environment variable ``OPENAI_API_KEY`` set with your API key.

			`Any parameters that are valid to be passed to the openai.create call can be passed`
			`in, even if not explicitly saved on this class.`

			`Example:`
			`.. code-block:: python`

			`from langchain.chat_models import ChatOpenAI`
			`openai = ChatOpenAI(model_name="gpt-3.5-turbo")`
			`"""`

			`client: Any #: :meta private:`
feat: model_name as an env, and check accessability to the model (#22) 2023-04-07 11:52:55 +00:00			`model_name: str = settings["MODEL_NAME"]`
feat: init 2023-03-17 15:55:15 +00:00			`"""Model name to use."""`
			`model_kwargs: Dict[str, Any] = Field(default_factory=dict)`
			"""Holds any model parameters valid for `create` call not explicitly specified."""
			`openai_api_key: Optional[str] = None`
			`max_retries: int = 6`
			`"""Maximum number of retries to make when generating."""`
			`streaming: bool = False`
			`"""Whether to stream the results or not."""`
			`n: int = 1`
			`"""Number of chat completions to generate for each prompt."""`
feat: import order 2023-04-03 07:43:34 +00:00			`max_tokens: int = 2048`
feat: init 2023-03-17 15:55:15 +00:00			`"""Maximum number of tokens to generate."""`

			`class Config:`
			`"""Configuration for this pydantic object."""`

			`extra = Extra.ignore`

feat: model_name as an env, and check accessability to the model (#22) 2023-04-07 11:52:55 +00:00			`def check_access(self) -> None:`
			`"""Check that the user has access to the model."""`

			`try:`
			`openai.Engine.retrieve(self.model_name)`
			`except openai.error.InvalidRequestError:`
			`raise ModelNotFoundException(self.model_name)`

feat: init 2023-03-17 15:55:15 +00:00			`@root_validator(pre=True)`
			`def build_extra(cls, values: Dict[str, Any]) -> Dict[str, Any]:`
			`"""Build extra kwargs from additional params that were passed in."""`
			`all_required_field_names = {field.alias for field in cls.__fields__.values()}`

			`extra = values.get("model_kwargs", {})`
			`for field_name in list(values):`
			`if field_name not in all_required_field_names:`
			`if field_name in extra:`
			`raise ValueError(f"Found {field_name} supplied twice.")`
			`extra[field_name] = values.pop(field_name)`
			`values["model_kwargs"] = extra`
			`return values`

			`@root_validator()`
			`def validate_environment(cls, values: Dict) -> Dict:`
			`"""Validate that api key and python package exists in environment."""`
			`openai_api_key = get_from_dict_or_env(`
			`values, "openai_api_key", "OPENAI_API_KEY"`
			`)`
			`try:`
			`import openai`

			`openai.api_key = openai_api_key`
			`except ImportError:`
			`raise ValueError(`
			`"Could not import openai python package. "`
			"Please it install it with `pip install openai`."
			`)`
			`try:`
			`values["client"] = openai.ChatCompletion`
			`except AttributeError:`
			`raise ValueError(`
			"`openai` has no `ChatCompletion` attribute, this is likely "
			`"due to an old version of the openai package. Try upgrading it "`
			"with `pip install --upgrade openai`."
			`)`
			`if values["n"] < 1:`
			`raise ValueError("n must be at least 1.")`
			`if values["n"] > 1 and values["streaming"]:`
			`raise ValueError("n must be 1 when streaming.")`
			`return values`

			`@property`
			`def _default_params(self) -> Dict[str, Any]:`
			`"""Get the default parameters for calling OpenAI API."""`
			`return {`
			`"model": self.model_name,`
			`"max_tokens": self.max_tokens,`
			`"stream": self.streaming,`
			`"n": self.n,`
			`**self.model_kwargs,`
			`}`

			`def _create_retry_decorator(self) -> Callable[[Any], Any]:`
			`import openai`

			`min_seconds = 4`
			`max_seconds = 10`
			`# Wait 2^x * 1 second between each retry starting with`
			`# 4 seconds, then up to 10 seconds, then 10 seconds afterwards`
			`return retry(`
			`reraise=True,`
			`stop=stop_after_attempt(self.max_retries),`
			`wait=wait_exponential(multiplier=1, min=min_seconds, max=max_seconds),`
			`retry=(`
			`retry_if_exception_type(openai.error.Timeout)`
			`\| retry_if_exception_type(openai.error.APIError)`
			`\| retry_if_exception_type(openai.error.APIConnectionError)`
			`\| retry_if_exception_type(openai.error.RateLimitError)`
			`\| retry_if_exception_type(openai.error.ServiceUnavailableError)`
			`),`
			`before_sleep=before_sleep_log(logger, logging.WARNING),`
			`)`

			`def completion_with_retry(self, **kwargs: Any) -> Any:`
			`"""Use tenacity to retry the completion call."""`
			`retry_decorator = self._create_retry_decorator()`

			`@retry_decorator`
			`def _completion_with_retry(**kwargs: Any) -> Any:`
feat: agent manager manage memory by key 2023-03-21 12:20:15 +00:00			`response = self.client.create(**kwargs)`
feat: code editor (#4) 2023-03-22 00:34:52 +00:00			`logger.debug("Response:\n\t%s", response)`
feat: agent manager manage memory by key 2023-03-21 12:20:15 +00:00			`return response`
feat: init 2023-03-17 15:55:15 +00:00
			`return _completion_with_retry(**kwargs)`

			`def _generate(`
			`self, messages: List[BaseMessage], stop: Optional[List[str]] = None`
			`) -> ChatResult:`
			`message_dicts, params = self._create_message_dicts(messages, stop)`
feat: code editor (#4) 2023-03-22 00:34:52 +00:00			`logger.debug("Messages:\n")`
feat: agent manager manage memory by key 2023-03-21 12:20:15 +00:00			`for item in message_dicts:`
			`for k, v in item.items():`
feat: code editor (#4) 2023-03-22 00:34:52 +00:00			`logger.debug(f"\t\t{k}: {v}")`
			`logger.debug("\t-------")`
			`logger.debug("===========")`
feat: init 2023-03-17 15:55:15 +00:00
			`if self.streaming:`
			`inner_completion = ""`
			`role = "assistant"`
			`params["stream"] = True`
			`for stream_resp in self.completion_with_retry(`
			`messages=message_dicts, **params`
			`):`
			`role = stream_resp["choices"][0]["delta"].get("role", role)`
			`token = stream_resp["choices"][0]["delta"].get("content", "")`
			`inner_completion += token`
			`self.callback_manager.on_llm_new_token(`
			`token,`
			`verbose=self.verbose,`
			`)`
			`message = _convert_dict_to_message(`
			`{"content": inner_completion, "role": role}`
			`)`
			`return ChatResult(generations=[ChatGeneration(message=message)])`
			`response = self.completion_with_retry(messages=message_dicts, **params)`
			`return _create_chat_result(response)`

			`def _create_message_dicts(`
			`self, messages: List[BaseMessage], stop: Optional[List[str]]`
			`) -> Tuple[List[Dict[str, Any]], Dict[str, Any]]:`
			`params: Dict[str, Any] = {{"model": self.model_name}, self._default_params}`
			`if stop is not None:`
			`if "stop" in params:`
			raise ValueError("`stop` found in both the input and default params.")
			`params["stop"] = stop`
			`message_dicts = [_convert_message_to_dict(m) for m in messages]`
			`return message_dicts, params`

			`async def _agenerate(`
			`self, messages: List[BaseMessage], stop: Optional[List[str]] = None`
			`) -> ChatResult:`
			`message_dicts, params = self._create_message_dicts(messages, stop)`
			`if self.streaming:`
			`inner_completion = ""`
			`role = "assistant"`
			`params["stream"] = True`
			`async for stream_resp in await acompletion_with_retry(`
			`self, messages=message_dicts, **params`
			`):`
			`role = stream_resp["choices"][0]["delta"].get("role", role)`
			`token = stream_resp["choices"][0]["delta"].get("content", "")`
			`inner_completion += token`
			`if self.callback_manager.is_async:`
			`await self.callback_manager.on_llm_new_token(`
			`token,`
			`verbose=self.verbose,`
			`)`
			`else:`
			`self.callback_manager.on_llm_new_token(`
			`token,`
			`verbose=self.verbose,`
			`)`
			`message = _convert_dict_to_message(`
			`{"content": inner_completion, "role": role}`
			`)`
			`return ChatResult(generations=[ChatGeneration(message=message)])`
			`else:`
			`response = await acompletion_with_retry(`
			`self, messages=message_dicts, **params`
			`)`
			`return _create_chat_result(response)`

			`@property`
			`def _identifying_params(self) -> Mapping[str, Any]:`
			`"""Get the identifying parameters."""`
			`return {{"model_name": self.model_name}, self._default_params}`

			`def get_num_tokens(self, text: str) -> int:`
			`"""Calculate num tokens with tiktoken package."""`
			`# tiktoken NOT supported for Python 3.8 or below`
			`if sys.version_info[1] <= 8:`
			`return super().get_num_tokens(text)`
			`try:`
			`import tiktoken`
			`except ImportError:`
			`raise ValueError(`
			`"Could not import tiktoken python package. "`
			`"This is needed in order to calculate get_num_tokens. "`
			"Please it install it with `pip install tiktoken`."
			`)`
			`# create a GPT-3.5-Turbo encoder instance`
			`enc = tiktoken.encoding_for_model(self.model_name)`

			`# encode the text using the GPT-3.5-Turbo encoder`
			`tokenized_text = enc.encode(text)`

			`# calculate the number of tokens in the encoded text`
			`return len(tokenized_text)`