cleanup

2024-11-16 00:12:59 +00:00 · 2023-04-02 23:47:30 -04:00 · 2023-04-02 23:47:30 -04:00 · e88370e0f1
commit e88370e0f1
parent f2f507f7fd
3 changed files with 5 additions and 4 deletions
--- a/reflexion.py
+++ b/reflexion.py
@ -34,8 +34,10 @@ def run_reflexion(

            # if solved, exit early
            if is_passing:
-                is_solved = True
-                num_success += 1
+                is_passing = exe.evaluate(
+                    item["entry_point"], cur_func_impl, item["test"], timeout=10)
+                is_solved = is_passing
+                num_success += int(is_passing)
                break

            # use self-reflection to iteratively improve
--- a/reflexion_ucs.py
+++ b/reflexion_ucs.py
@ -74,7 +74,7 @@ def run_reflexion_ucs(
            # if solved, exit--pass_at_k 1 early
            if is_passing:
                debug_print("solved at first attempt")
-                is_solved = exe.evaluate(item["prompt"], cur_func_impl, item["test"])
+                is_solved = exe.evaluate(item["entry_point"], cur_func_impl, item["test"])
                num_success += 1 if is_solved else 0
                break

--- a/simple.py
+++ b/simple.py
@ -15,7 +15,6 @@ def run_simple(
        log_path: str,
        verbose: bool
    ) -> None:
-    # someone implement more languages
    exe = executor_factory(language)
    gen = generator_factory(language)