Skip to content

Griptape Docs

Huggingface hub prompt driver

Huggingface hub prompt driver

`HuggingFaceHubPromptDriver`

Bases: BasePromptDriver

Attributes:

Name	Type	Description
`api_token`	`str`	Hugging Face Hub API token.
`use_gpu`	`str`	Use GPU during model run.
`params`	`dict`	Custom model run parameters.
`model`	`str`	Hugging Face Hub model name.
`client`	`InferenceClient`	Custom `InferenceApi`.
`tokenizer`	`HuggingFaceTokenizer`	Custom `HuggingFaceTokenizer`.

Source code in griptape/drivers/prompt/huggingface_hub_prompt_driver.py

@define
class HuggingFaceHubPromptDriver(BasePromptDriver):
    """
    Attributes:
        api_token: Hugging Face Hub API token.
        use_gpu: Use GPU during model run.
        params: Custom model run parameters.
        model: Hugging Face Hub model name.
        client: Custom `InferenceApi`.
        tokenizer: Custom `HuggingFaceTokenizer`.

    """

    api_token: str = field(kw_only=True, metadata={"serializable": True})
    max_tokens: int = field(default=250, kw_only=True, metadata={"serializable": True})
    params: dict = field(factory=dict, kw_only=True, metadata={"serializable": True})
    model: str = field(kw_only=True, metadata={"serializable": True})
    client: InferenceClient = field(
        default=Factory(
            lambda self: import_optional_dependency("huggingface_hub").InferenceClient(
                model=self.model, token=self.api_token
            ),
            takes_self=True,
        ),
        kw_only=True,
    )
    tokenizer: HuggingFaceTokenizer = field(
        default=Factory(
            lambda self: HuggingFaceTokenizer(
                tokenizer=import_optional_dependency("transformers").AutoTokenizer.from_pretrained(self.model),
                max_output_tokens=self.max_tokens,
            ),
            takes_self=True,
        ),
        kw_only=True,
    )

    def try_run(self, prompt_stack: PromptStack) -> TextArtifact:
        prompt = self.prompt_stack_to_string(prompt_stack)

        response = self.client.text_generation(
            prompt, return_full_text=False, max_new_tokens=self.max_output_tokens(prompt), **self.params
        )

        return TextArtifact(value=response)

    def try_stream(self, prompt_stack: PromptStack) -> Iterator[TextArtifact]:
        prompt = self.prompt_stack_to_string(prompt_stack)

        response = self.client.text_generation(
            prompt, return_full_text=False, max_new_tokens=self.max_output_tokens(prompt), stream=True, **self.params
        )

        for token in response:
            yield TextArtifact(value=token)

`api_token: str = field(kw_only=True, metadata={'serializable': True})` `class-attribute` `instance-attribute`

`client: InferenceClient = field(default=Factory(lambda self: import_optional_dependency('huggingface_hub').InferenceClient(model=self.model, token=self.api_token), takes_self=True), kw_only=True)` `class-attribute` `instance-attribute`

`max_tokens: int = field(default=250, kw_only=True, metadata={'serializable': True})` `class-attribute` `instance-attribute`

`model: str = field(kw_only=True, metadata={'serializable': True})` `class-attribute` `instance-attribute`

`params: dict = field(factory=dict, kw_only=True, metadata={'serializable': True})` `class-attribute` `instance-attribute`

`tokenizer: HuggingFaceTokenizer = field(default=Factory(lambda self: HuggingFaceTokenizer(tokenizer=import_optional_dependency('transformers').AutoTokenizer.from_pretrained(self.model), max_output_tokens=self.max_tokens), takes_self=True), kw_only=True)` `class-attribute` `instance-attribute`

`try_run(prompt_stack)`

Source code in griptape/drivers/prompt/huggingface_hub_prompt_driver.py

def try_run(self, prompt_stack: PromptStack) -> TextArtifact:
    prompt = self.prompt_stack_to_string(prompt_stack)

    response = self.client.text_generation(
        prompt, return_full_text=False, max_new_tokens=self.max_output_tokens(prompt), **self.params
    )

    return TextArtifact(value=response)

`try_stream(prompt_stack)`

Source code in griptape/drivers/prompt/huggingface_hub_prompt_driver.py

def try_stream(self, prompt_stack: PromptStack) -> Iterator[TextArtifact]:
    prompt = self.prompt_stack_to_string(prompt_stack)

    response = self.client.text_generation(
        prompt, return_full_text=False, max_new_tokens=self.max_output_tokens(prompt), stream=True, **self.params
    )

    for token in response:
        yield TextArtifact(value=token)