local mode and model choosing done

1 year ago · c170360a8d
parent 91d3e54248
commit c170360a8d
3 changed files with 36 additions and 34 deletions
--- a/datachad/database.py
+++ b/datachad/database.py
@ -1,4 +1,3 @@
 import os
 import re
 import deeplake
@ -16,12 +15,14 @@ def get_dataset_path() -> str:
    # to get a string that can be used to create a new dataset
    dataset_name = re.sub(r"\W+", "-", st.session_state["data_source"])
    dataset_name = re.sub(r"--+", "- ", dataset_name).strip("-")
    # we need to differntiate between differently chunked datasets
    dataset_name += (
        f"-{st.session_state['chunk_size']}-{st.session_state['chunk_overlap']}"
    )
    if st.session_state["mode"] == MODES.LOCAL:
        if not os.path.exists(DATA_PATH):
            os.makedirs(DATA_PATH)
        dataset_path = str(DATA_PATH / dataset_name)
    else:
-        dataset_path = f"hub://{st.session_state['activeloop_org_name']}/{dataset_name}-{st.session_state['chunk_size']}"
+        dataset_path = f"hub://{st.session_state['activeloop_org_name']}/{dataset_name}"
    return dataset_path
--- a/datachad/models.py
+++ b/datachad/models.py
@ -59,33 +59,34 @@ class MODELS(Enum):
 def get_model() -> BaseLanguageModel:
-    match st.session_state["model"].name:
+    with st.spinner("Loading Model..."):
-        case MODELS.GPT35TURBO.name:
+        match st.session_state["model"].name:
-            model = ChatOpenAI(
+            case MODELS.GPT35TURBO.name:
-                model_name=st.session_state["model"].name,
+                model = ChatOpenAI(
-                temperature=st.session_state["temperature"],
+                    model_name=st.session_state["model"].name,
-                openai_api_key=st.session_state["openai_api_key"],
+                    temperature=st.session_state["temperature"],
-            )
+                    openai_api_key=st.session_state["openai_api_key"],
-        case MODELS.GPT4.name:
+                )
-            model = ChatOpenAI(
+            case MODELS.GPT4.name:
-                model_name=st.session_state["model"].name,
+                model = ChatOpenAI(
-                temperature=st.session_state["temperature"],
+                    model_name=st.session_state["model"].name,
-                openai_api_key=st.session_state["openai_api_key"],
+                    temperature=st.session_state["temperature"],
-            )
+                    openai_api_key=st.session_state["openai_api_key"],
-        case MODELS.GPT4ALL.name:
+                )
-            model = GPT4All(
+            case MODELS.GPT4ALL.name:
-                model=st.session_state["model"].path,
+                model = GPT4All(
-                n_ctx=st.session_state["model_n_ctx"],
+                    model=st.session_state["model"].path,
-                backend="gptj",
+                    n_ctx=st.session_state["model_n_ctx"],
-                temp=st.session_state["temperature"],
+                    backend="gptj",
-                verbose=True,
+                    temp=st.session_state["temperature"],
-            )
+                    verbose=True,
-        # Added models need to be cased here
+                )
-        case _default:
+            # Added models need to be cased here
-            msg = f"Model {st.session_state['model']} not supported!"
+            case _default:
-            logger.error(msg)
+                msg = f"Model {st.session_state['model']} not supported!"
-            st.error(msg)
+                logger.error(msg)
-            exit
+                st.error(msg)
                exit
    return model
--- a/requirements.txt
+++ b/requirements.txt
@ -1,8 +1,8 @@
 streamlit==1.22.0
 streamlit-chat==0.0.2.2
-deeplake==3.4.1
+deeplake==3.5.2
 openai==0.27.6
-langchain==0.0.173
+langchain==0.0.178
 tiktoken==0.4.0
 unstructured==0.6.5
 pdf2image==1.16.3
@ -11,4 +11,4 @@ beautifulsoup4==4.12.2
 bs4==0.0.1
 python-dotenv==1.0.0
 sentence-transformers==2.2.2
-pygpt4all==1.1.0
+pygpt4all==0.2.3