Skip to content

Griptape Docs

Bedrock titan tokenizer

Bedrock titan tokenizer

`BedrockTitanTokenizer`

Bases: SimpleTokenizer

Source code in griptape/tokenizers/bedrock_titan_tokenizer.py

@define()
class BedrockTitanTokenizer(SimpleTokenizer):
    DEFAULT_CHARACTERS_PER_TOKEN = 6  # https://docs.aws.amazon.com/bedrock/latest/userguide/model-customization-prepare.html#model-customization-prepare-finetuning
    MODEL_PREFIXES_TO_MAX_INPUT_TOKENS = {"amazon": 4096}
    MODEL_PREFIXES_TO_MAX_OUTPUT_TOKENS = {"amazon": 8000}

    model: str = field(kw_only=True)
    characters_per_token: int = field(default=DEFAULT_CHARACTERS_PER_TOKEN, kw_only=True)
    stop_sequences: list[str] = field(default=Factory(lambda: ["User:"]), kw_only=True)

`DEFAULT_CHARACTERS_PER_TOKEN = 6` `class-attribute` `instance-attribute`

`MODEL_PREFIXES_TO_MAX_INPUT_TOKENS = {'amazon': 4096}` `class-attribute` `instance-attribute`

`MODEL_PREFIXES_TO_MAX_OUTPUT_TOKENS = {'amazon': 8000}` `class-attribute` `instance-attribute`

`characters_per_token: int = field(default=DEFAULT_CHARACTERS_PER_TOKEN, kw_only=True)` `class-attribute` `instance-attribute`

`model: str = field(kw_only=True)` `class-attribute` `instance-attribute`

`stop_sequences: list[str] = field(default=Factory(lambda: ['User:']), kw_only=True)` `class-attribute` `instance-attribute`