PicoCode/ai/llama_embeddings.py at 082203265254c45909c7627fe608ae49bd46ff6d · CodeAtCode/PicoCode · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
"""
LlamaIndex-compatible embeddings using OpenAI API.
Replaces the custom EmbeddingClient with llama-index's embedding abstraction.
"""
from typing import List, Optional
from llama_index.core.embeddings import BaseEmbedding
from llama_index.core.bridge.pydantic import PrivateAttr
from openai import OpenAI

from utils.config import CFG
from utils.logger import get_logger

logger = get_logger(__name__)


class OpenAICompatibleEmbedding(BaseEmbedding):
    """
    LlamaIndex-compatible embedding model using OpenAI-compatible API.
    Works with any OpenAI-compatible endpoint (OpenAI, Azure, local servers, etc.)
    """

    _client: OpenAI = PrivateAttr()
    _model: str = PrivateAttr()

    def __init__(
        self,
        api_key: Optional[str] = None,
        api_base: Optional[str] = None,
        model: Optional[str] = None,
        **kwargs
    ):
        """
        Initialize the embedding model.

        Args:
            api_key: OpenAI API key (defaults to config)
            api_base: API base URL (defaults to config)
            model: Model name (defaults to config)
        """
        super().__init__(**kwargs)

        # Get config values
        self._client = OpenAI(
            api_key=api_key or CFG.get("api_key"),
            base_url=api_base or CFG.get("api_url")
        )
        self._model = model or CFG.get("embedding_model") or "text-embedding-3-small"

        logger.info(f"Initialized OpenAICompatibleEmbedding with model: {self._model}")

    @classmethod
    def class_name(cls) -> str:
        return "OpenAICompatibleEmbedding"

    async def _aget_query_embedding(self, query: str) -> List[float]:
        """Get query embedding asynchronously."""
        return self._get_query_embedding(query)

    async def _aget_text_embedding(self, text: str) -> List[float]:
        """Get text embedding asynchronously."""
        return self._get_text_embedding(text)

    def _get_query_embedding(self, query: str) -> List[float]:
        """Get embedding for a query."""
        return self._get_text_embedding(query)

    def _get_text_embedding(self, text: str) -> List[float]:
        """Get embedding for a text."""
        try:
            # Clean the text
            text = text.replace("\n", " ").strip()
            if not text:
                logger.warning("Empty text provided for embedding")
                return []

            # Call OpenAI API
            response = self._client.embeddings.create(
                input=[text],
                model=self._model
            )

            if response.data and len(response.data) > 0:
                embedding = response.data[0].embedding
                logger.debug(f"Generated embedding with dimension: {len(embedding)}")
                return embedding
            else:
                logger.error("No embedding returned from API")
                return []

        except Exception as e:
            logger.exception(f"Failed to generate embedding: {e}")
            return []

    def _get_text_embeddings(self, texts: List[str]) -> List[List[float]]:
        """Get embeddings for multiple texts."""
        embeddings = []
        for text in texts:
            embedding = self._get_text_embedding(text)
            embeddings.append(embedding)
        return embeddings