langchain/libs/experimental/langchain_experimental/rl_chain/metrics.py

from collections import deque
from typing import TYPE_CHECKING, Dict, List, Union

if TYPE_CHECKING:
    import pandas as pd


class MetricsTrackerAverage:
    def __init__(self, step: int):
        self.history: List[Dict[str, Union[int, float]]] = [{"step": 0, "score": 0}]
        self.step: int = step
        self.i: int = 0
        self.num: float = 0
        self.denom: float = 0

    @property
    def score(self) -> float:
        return self.num / self.denom if self.denom > 0 else 0

    def on_decision(self) -> None:
        self.denom += 1

    def on_feedback(self, score: float) -> None:
        self.num += score or 0
        self.i += 1
        if self.step > 0 and self.i % self.step == 0:
            self.history.append({"step": self.i, "score": self.score})

    def to_pandas(self) -> "pd.DataFrame":
        import pandas as pd

        return pd.DataFrame(self.history)


class MetricsTrackerRollingWindow:
    def __init__(self, window_size: int, step: int):
        self.history: List[Dict[str, Union[int, float]]] = [{"step": 0, "score": 0}]
        self.step: int = step
        self.i: int = 0
        self.window_size: int = window_size
        self.queue: deque = deque()
        self.sum: float = 0.0

    @property
    def score(self) -> float:
        return self.sum / len(self.queue) if len(self.queue) > 0 else 0

    def on_decision(self) -> None:
        pass

    def on_feedback(self, value: float) -> None:
        self.sum += value
        self.queue.append(value)
        self.i += 1

        if len(self.queue) > self.window_size:
            old_val = self.queue.popleft()
            self.sum -= old_val

        if self.step > 0 and self.i % self.step == 0:
            self.history.append({"step": self.i, "score": self.sum / len(self.queue)})

    def to_pandas(self) -> "pd.DataFrame":
        import pandas as pd

        return pd.DataFrame(self.history)
proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`from collections import deque`
			`from typing import TYPE_CHECKING, Dict, List, Union`
resolving linting and formatting errors 2023-08-18 11:09:30 +00:00
			`if TYPE_CHECKING:`
			`import pandas as pd`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00

proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`class MetricsTrackerAverage:`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00			`def __init__(self, step: int):`
proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`self.history: List[Dict[str, Union[int, float]]] = [{"step": 0, "score": 0}]`
			`self.step: int = step`
			`self.i: int = 0`
			`self.num: float = 0`
			`self.denom: float = 0`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00
			`@property`
			`def score(self) -> float:`
proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`return self.num / self.denom if self.denom > 0 else 0`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00
			`def on_decision(self) -> None:`
proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`self.denom += 1`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00
proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`def on_feedback(self, score: float) -> None:`
			`self.num += score or 0`
			`self.i += 1`
			`if self.step > 0 and self.i % self.step == 0:`
			`self.history.append({"step": self.i, "score": self.score})`
Imported changes from repo VowpalWabbit/rl_chain into rl_chain directory 2023-08-18 06:02:01 +00:00
fix lock, imports, deps, test w deps, typo, formatting 2023-08-18 09:45:21 +00:00			`def to_pandas(self) -> "pd.DataFrame":`
			`import pandas as pd`

proper embeddings and rolling window average 2023-09-01 00:14:41 +00:00			`return pd.DataFrame(self.history)`


			`class MetricsTrackerRollingWindow:`
			`def __init__(self, window_size: int, step: int):`
			`self.history: List[Dict[str, Union[int, float]]] = [{"step": 0, "score": 0}]`
			`self.step: int = step`
			`self.i: int = 0`
			`self.window_size: int = window_size`
			`self.queue: deque = deque()`
			`self.sum: float = 0.0`

			`@property`
			`def score(self) -> float:`
			`return self.sum / len(self.queue) if len(self.queue) > 0 else 0`

			`def on_decision(self) -> None:`
			`pass`

			`def on_feedback(self, value: float) -> None:`
			`self.sum += value`
			`self.queue.append(value)`
			`self.i += 1`

			`if len(self.queue) > self.window_size:`
			`old_val = self.queue.popleft()`
			`self.sum -= old_val`

			`if self.step > 0 and self.i % self.step == 0:`
			`self.history.append({"step": self.i, "score": self.sum / len(self.queue)})`

			`def to_pandas(self) -> "pd.DataFrame":`
			`import pandas as pd`

			`return pd.DataFrame(self.history)`