Skip to content

Griptape Docs

Amazon bedrock titan embedding driver

Amazon bedrock titan embedding driver

`AmazonBedrockTitanEmbeddingDriver`

Bases: BaseEmbeddingDriver

Attributes:

Name	Type	Description
`model`	`str`	Embedding model name. Defaults to DEFAULT_MODEL.
`tokenizer`	`BedrockTitanTokenizer`	Optionally provide custom `BedrockTitanTokenizer`.
`session`	`Session`	Optionally provide custom `boto3.Session`.
`bedrock_client`	`Any`	Optionally provide custom `bedrock-runtime` client.

Source code in griptape/drivers/embedding/amazon_bedrock_titan_embedding_driver.py

@define
class AmazonBedrockTitanEmbeddingDriver(BaseEmbeddingDriver):
    """
    Attributes:
        model: Embedding model name. Defaults to DEFAULT_MODEL.
        tokenizer: Optionally provide custom `BedrockTitanTokenizer`.
        session: Optionally provide custom `boto3.Session`.
        bedrock_client: Optionally provide custom `bedrock-runtime` client.
    """

    DEFAULT_MODEL = "amazon.titan-embed-text-v1"

    model: str = field(default=DEFAULT_MODEL, kw_only=True, metadata={"serializable": True})
    session: boto3.Session = field(default=Factory(lambda: import_optional_dependency("boto3").Session()), kw_only=True)
    tokenizer: BedrockTitanTokenizer = field(
        default=Factory(lambda self: BedrockTitanTokenizer(model=self.model), takes_self=True), kw_only=True
    )
    bedrock_client: Any = field(
        default=Factory(lambda self: self.session.client("bedrock-runtime"), takes_self=True), kw_only=True
    )

    def try_embed_chunk(self, chunk: str) -> list[float]:
        payload = {"inputText": chunk}

        response = self.bedrock_client.invoke_model(
            body=json.dumps(payload), modelId=self.model, accept="application/json", contentType="application/json"
        )
        response_body = json.loads(response.get("body").read())

        return response_body.get("embedding")

`DEFAULT_MODEL = 'amazon.titan-embed-text-v1'` `class-attribute` `instance-attribute`

`bedrock_client: Any = field(default=Factory(lambda self: self.session.client('bedrock-runtime'), takes_self=True), kw_only=True)` `class-attribute` `instance-attribute`

`model: str = field(default=DEFAULT_MODEL, kw_only=True, metadata={'serializable': True})` `class-attribute` `instance-attribute`

`session: boto3.Session = field(default=Factory(lambda: import_optional_dependency('boto3').Session()), kw_only=True)` `class-attribute` `instance-attribute`

`tokenizer: BedrockTitanTokenizer = field(default=Factory(lambda self: BedrockTitanTokenizer(model=self.model), takes_self=True), kw_only=True)` `class-attribute` `instance-attribute`

`try_embed_chunk(chunk)`

Source code in griptape/drivers/embedding/amazon_bedrock_titan_embedding_driver.py

def try_embed_chunk(self, chunk: str) -> list[float]:
    payload = {"inputText": chunk}

    response = self.bedrock_client.invoke_model(
        body=json.dumps(payload), modelId=self.model, accept="application/json", contentType="application/json"
    )
    response_body = json.loads(response.get("body").read())

    return response_body.get("embedding")