langchain/tests/unit_tests/evaluation/criteria/test_eval_chain.py

"""Test the criteria eval chain."""


from langchain.evaluation.criteria.eval_chain import (
    _SUPPORTED_CRITERIA,
    CriteriaEvalChain,
)
from langchain.evaluation.schema import StringEvaluator
from tests.unit_tests.llms.fake_llm import FakeLLM


def test_resolve_criteria() -> None:
    assert CriteriaEvalChain.resolve_criteria("helpfulness") == {
        "helpfulness": _SUPPORTED_CRITERIA["helpfulness"]
    }
    assert CriteriaEvalChain.resolve_criteria(["correctness"]) == {
        "correctness": _SUPPORTED_CRITERIA["correctness"]
    }


def test_criteria_eval_chain() -> None:
    chain = CriteriaEvalChain.from_llm(
        llm=FakeLLM(
            queries={"text": "The meaning of life\nY"}, sequential_responses=True
        ),
        criteria={"my criterion": "my criterion description"},
    )
    result = chain.evaluate_strings(
        prediction="my prediction", reference="my reference", input="my input"
    )
    assert result["reasoning"] == "The meaning of life"


def test_implements_string_protocol() -> None:
    assert isinstance(CriteriaEvalChain, StringEvaluator)
Update String Evaluator (#6615) - Add protocol for `evaluate_strings` - Move the criteria evaluator out so it's not restricted to being applied on traced runs 2023-06-26 21:16:14 +00:00			`"""Test the criteria eval chain."""`


			`from langchain.evaluation.criteria.eval_chain import (`
Permit Constitutional Principles (#6807) In the criteria evaluator. 2023-06-27 07:23:54 +00:00			`_SUPPORTED_CRITERIA,`
Update String Evaluator (#6615) - Add protocol for `evaluate_strings` - Move the criteria evaluator out so it's not restricted to being applied on traced runs 2023-06-26 21:16:14 +00:00			`CriteriaEvalChain,`
			`)`
			`from langchain.evaluation.schema import StringEvaluator`
			`from tests.unit_tests.llms.fake_llm import FakeLLM`


			`def test_resolve_criteria() -> None:`
Permit Constitutional Principles (#6807) In the criteria evaluator. 2023-06-27 07:23:54 +00:00			`assert CriteriaEvalChain.resolve_criteria("helpfulness") == {`
			`"helpfulness": _SUPPORTED_CRITERIA["helpfulness"]`
			`}`
			`assert CriteriaEvalChain.resolve_criteria(["correctness"]) == {`
			`"correctness": _SUPPORTED_CRITERIA["correctness"]`
			`}`
Update String Evaluator (#6615) - Add protocol for `evaluate_strings` - Move the criteria evaluator out so it's not restricted to being applied on traced runs 2023-06-26 21:16:14 +00:00

			`def test_criteria_eval_chain() -> None:`
			`chain = CriteriaEvalChain.from_llm(`
			`llm=FakeLLM(`
			`queries={"text": "The meaning of life\nY"}, sequential_responses=True`
			`),`
			`criteria={"my criterion": "my criterion description"},`
			`)`
			`result = chain.evaluate_strings(`
			`prediction="my prediction", reference="my reference", input="my input"`
			`)`
			`assert result["reasoning"] == "The meaning of life"`


			`def test_implements_string_protocol() -> None:`
			`assert isinstance(CriteriaEvalChain, StringEvaluator)`