API Reference

Protocols

`ChunkerProtocol`

Splits documents into chunks for embedding and indexing.

def chunk(
    text: str,
    chunk_size: int,
    overlap: int
) -> list[str]

`ContextCompressorProtocol`

Compresses retrieved context to fit within token limits.

async def compress(
    query: str,
    context: str,
    max_tokens: int
) -> str

`RerankerProtocol`

Re-ranks retrieved documents by relevance.

async def rerank(
    query: str,
    documents: list[str],
    top_k: int
) -> list[tuple[str, float]]

Classes

`Chunk`

A chunk of text with metadata.

Attributes: text: The chunk text content source: Source document identifier start_index: Starting character position in original document end_index: Ending character position in original document chunk_index: Sequential index of this chunk metadata: Optional metadata dictionary

`ChunkingConfig`

Configuration for chunking.

Example

config = ChunkingConfig( … strategy=ChunkingStrategy.FIXED_SIZE, … chunk_size=1000, … overlap=200 … )

`Context`

Retrieved context for RAG generation.

Example

context = Context( … query=“What is Lexigram?”, … documents=[doc1, doc2], … metadata={“retrieval_time”: 0.123} … )

`IngestionConfig`

Configuration for document ingestion stage.

`PipelineBuilder`

Builder for constructing RAG pipelines with fluent API.

The builder provides a convenient way to configure and build pipelines programmatically or from configuration files.

def __init__() -> Any

Initialize the pipeline builder.

def with_name(name: str) -> PipelineBuilder

Set pipeline name.

Parameters

Parameter	Type	Description
`name`	str	Pipeline name

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_description(description: str) -> PipelineBuilder

Set pipeline description.

Parameters

Parameter	Type	Description
`description`	str	Pipeline description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_ingestion(**kwargs: Any) -> PipelineBuilder

Configure ingestion stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_query_processing(**kwargs: Any) -> PipelineBuilder

Configure query processing stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_retrieval(**kwargs: Any) -> PipelineBuilder

Configure retrieval stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_context_optimization(**kwargs: Any) -> PipelineBuilder

Configure context optimization stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_synthesis(**kwargs: Any) -> PipelineBuilder

Configure synthesis stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_quality_assurance(**kwargs: Any) -> PipelineBuilder

Configure quality assurance stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_post_processing(**kwargs: Any) -> PipelineBuilder

Configure post-processing stage.

Parameters

Parameter	Type	Description

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_error_strategy(
    strategy: ErrorStrategy,
    max_retries: int = 3,
    retry_delay: float = 1.0
) -> PipelineBuilder

Configure global error handling.

Parameters

Parameter	Type	Description
`strategy`	ErrorStrategy	Default error handling strategy
`max_retries`	int	Maximum number of retries
`retry_delay`	float	Initial delay between retries

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_stages(stages: list[PipelineStageType]) -> PipelineBuilder

Set the ordered list of pipeline stages.

Parameters

Parameter	Type	Description
`stages`	list[PipelineStageType]	List of stages

Returns

Type	Description
PipelineBuilder	Self for chaining

def with_custom_stage(stage: PipelineStageProtocol) -> PipelineBuilder

Add a custom pipeline stage.

Parameters

Parameter	Type	Description
`stage`	PipelineStageProtocol	Custom pipeline stage

Returns

Type	Description
PipelineBuilder	Self for chaining

def from_dict(config_dict: dict[str, Any]) -> PipelineBuilder

Load configuration from dictionary.

Parameters

Parameter	Type	Description
`config_dict`	dict[str, Any]	Configuration dictionary

Returns

Type	Description
PipelineBuilder	Self for chaining

async def from_yaml(yaml_path: str | Path) -> PipelineBuilder

Load configuration from YAML file.

Parameters

Parameter	Type	Description
`yaml_path`	str \| Path	Path to YAML configuration file

Returns

Type	Description
PipelineBuilder	Self for chaining

def retrieve(
    strategy: str = 'hybrid',
    top_k: int = 10,
    **kwargs: Any
) -> PipelineBuilder

Configure retrieval with high-level parameters.

Parameters

Parameter	Type	Description
`strategy`	str	Retrieval strategy name (``"hybrid"``, ``"dense"``, ``"sparse"``).
`top_k`	int	Number of chunks to retrieve. **kwargs: Additional retrieval parameters.

def rerank(
    strategy: str = 'cross-encoder',
    top_k: int = 5,
    **kwargs: Any
) -> PipelineBuilder

Configure context optimization / reranking.

Parameters

Parameter	Type	Description
`strategy`	str	Reranking strategy name.
`top_k`	int	Number of chunks to keep after reranking. **kwargs: Additional reranking parameters.

def synthesize(
    strategy: str = 'abstractive',
    model: str | None = None,
    **kwargs: Any
) -> PipelineBuilder

Configure synthesis with high-level parameters.

Parameters

Parameter	Type	Description
`strategy`	str	Synthesis strategy (``"abstractive"``, ``"extractive"``).
`model`	str \| None	LLM model identifier for generation. **kwargs: Additional synthesis parameters.

def with_citations(required: bool = True) -> PipelineBuilder

Enable citation tracking in the pipeline.

Parameters

Parameter	Type	Description
`required`	bool	Whether citations are required (pipeline fails without them if set to ``True``).

def with_evaluation(
    evaluator: RAGEvaluatorProtocol | None = None,
    every_n: int = 1
) -> PipelineBuilder

Enable automatic evaluation of pipeline outputs.

Parameters

Parameter	Type	Description
`evaluator`	RAGEvaluatorProtocol \| None	Optional pre-built evaluator instance.
`every_n`	int	Evaluate every n-th request (default: every request).

def with_timeout(**stage_timeouts: float) -> PipelineBuilder

Set per-stage timeouts (in seconds).

Keyword arguments map stage names to their timeout values

builder.with_timeout(retrieval=10.0, synthesis=30.0)

Parameters

Parameter	Type	Description

def with_working_memory(memory: WorkingMemoryProtocol) -> PipelineBuilder

Attach working memory for context enrichment.

Parameters

Parameter	Type	Description
`memory`	WorkingMemoryProtocol	Working memory instance.

def build() -> RAGPipeline

Build the RAG pipeline.

Returns

Type	Description
RAGPipeline	Configured RAG pipeline

Raises

Exception	Description
ValueError	If configuration is invalid

`PipelineConfig`

Complete pipeline configuration.

def from_dict(
    cls,
    config_dict: dict[str, Any]
) -> PipelineConfig

Create configuration from dictionary.

def to_dict() -> dict[str, Any]

Convert configuration to dictionary.

`RAGAnswerSynthesizedHook`

Payload fired after the synthesis stage produces a final answer.

Attributes: pipeline_name: Name or identifier of the pipeline that synthesised the answer.

`RAGConfig`

Configuration for RAG (Retrieval Augmented Generation) pipeline.

Example

config = RAGConfig( … vector_store_type=“chroma”, … collection_name=“pet_knowledge”, … top_k=5, … enable_citations=True … )

`RAGDocumentsRetrievedHook`

Payload fired after the retrieval stage returns candidate chunks.

Attributes: chunk_count: Number of chunks returned by the retrieval step.

`RAGModule`

Retrieval-Augmented Generation (RAG) pipeline integration.

Call configure to register the RAG pipeline, strategy registries, and supporting services (knowledge graph, HyDE, compression, reasoning) for injection.

Usage

from lexigram.ai.rag.config import RAGConfig

@module(
    imports=[
        RAGModule.configure(RAGConfig(chunk_size=512))
    ]
)
class AppModule(Module):
    pass

Error Handling

RAG pipeline failures surface as typed exceptions that can be caught
directly or handled via the Result pattern::

    from lexigram.ai.rag.exceptions import (
        RAGError,           # base — catch-all
        PreprocessingError, # document preprocessing failure
        RetrievalError,     # retrieval / vector-store failure
        SynthesisError,     # response synthesis failure
        ChunkingError,      # document chunking failure
    )

Exports: RAGPipelineProtocol, RetrievalStrategyProtocol, RAGError, PreprocessingError, RetrievalError, SynthesisError, ChunkingError

def configure(
    cls,
    config: RAGConfig | None = None
) -> DynamicModule

Create a RAGModule with explicit configuration.

Parameters

Parameter	Type	Description
`config`	RAGConfig \| None	RAGConfig or ``None`` to use defaults (reads from environment variables).

Returns

Type	Description
DynamicModule	A DynamicModule descriptor.

def stub(
    cls,
    config: RAGConfig | None = None
) -> DynamicModule

Create a RAGModule suitable for unit and integration testing.

Uses in-memory or no-op implementations with minimal side effects.

Parameters

Parameter	Type	Description
`config`	RAGConfig \| None	Optional config override. Uses safe test defaults when None.

Returns

Type	Description
DynamicModule	A DynamicModule descriptor.

`RAGPipeline`

Main RAG pipeline that orchestrates all stages.

This class provides a simple interface for executing the complete RAG pipeline with configurable stages and error handling.

def __init__(
    config: PipelineConfig,
    stages: list[PipelineStageProtocol],
    evaluator: RAGEvaluatorProtocol | None = None,
    working_memory: WorkingMemoryProtocol | None = None
)

Initialize the RAG pipeline.

Parameters

Parameter	Type	Description
`config`	PipelineConfig	Pipeline configuration
`stages`	list[PipelineStageProtocol]	List of pipeline stages
`evaluator`	RAGEvaluatorProtocol \| None	Optional evaluator implementing RAGEvaluatorProtocol for automatic per-request quality evaluation. Evaluation frequency is controlled by auto_evaluate_every_n.
`working_memory`	WorkingMemoryProtocol \| None	Optional working memory for context enrichment.

async def run(
    query: str,
    documents: list[str] | None = None,
    document_paths: list[str] | None = None,
    metadata: dict[str, Any] | None = None
) -> PipelineContext

Execute the RAG pipeline.

Parameters

Parameter	Type	Description
`query`	str	User query
`documents`	list[str] \| None	Optional list of document content strings
`document_paths`	list[str] \| None	Optional list of document file paths
`metadata`	dict[str, Any] \| None	Optional custom metadata

Returns

Type	Description
PipelineContext	Pipeline context with results

async def execute(context: RAGContext) -> Result[RAGResponse, RAGError]

Execute the RAG pipeline per the contract protocol.

Parameters

Parameter	Type	Description
`context`	RAGContext	Pipeline context with query and optional config/filters.

Returns

Type	Description
Result[RAGResponse, RAGError]	Ok(RAGResponse) on success, Err(RAGError) on failure.

async def run_parallel(
    query: str,
    stages: list[PipelineStageProtocol] | None = None,
    **kwargs: Any
) -> PipelineContext

Execute pipeline stages in parallel.

Parameters

Parameter	Type	Description
`query`	str	User query
`stages`	list[PipelineStageProtocol] \| None	Stages to execute in parallel (default: all stages) **kwargs: Additional context parameters

Returns

Type	Description
PipelineContext	Pipeline context with results

`RAGPipelineStartedHook`

Payload fired when a RAG pipeline begins processing a query.

Attributes: pipeline_name: Name or identifier of the pipeline that started.

`RAGProvider`

Registers RAG pipeline services and strategy registries with the DI container.

def __init__(config: RAGConfig | None = None) -> None

async def register(container: ContainerRegistrarProtocol) -> None

async def boot(container: BootContainerProtocol) -> None

Boot RAG provider — wire optional integrations.

async def shutdown() -> None

async def health_check(timeout: float = 5.0) -> HealthCheckResult

Check RAG provider health — verifies embedding service and vector store.

Returns

Type	Description
HealthCheckResult	HealthCheckResult with status ``healthy`` when all configured dependencies are reachable, or ``degraded``/``unhealthy`` otherwise.

`RerankResult`

Result of a reranking operation.

Attributes: documents: Reranked documents (most relevant first). scores: Relevance scores (parallel to documents). original_count: Number of documents passed to reranker. reranked_count: Number of documents returned (may be < original if top_k applied). model_name: Name of the reranking model used. metadata: Additional reranking metadata.

`RerankingStrategyRegistry`

Registry of reranking strategy handlers.

Reranking strategies reorder documents after initial retrieval using cross-encoders, LLM-based scoring, or fusion techniques.

Uses a handler-based dispatch pattern where handlers implement can_handle(strategy: str) and create_and_rerank() methods.

Usage

registry = RerankingStrategyRegistry()
registry.register(FlashRankStrategyHandler())
handler = registry.get("flashrank")
result = await handler.create_and_rerank(strategy="flashrank", ...)

def __init__() -> None

Initialize an empty handler registry.

def with_defaults(cls) -> RerankingStrategyRegistry

Create a RerankingStrategyRegistry with default handlers.

Returns

Type	Description
RerankingStrategyRegistry	A RerankingStrategyRegistry with no default handlers. Handlers are registered conditionally by the provider.

def register(handler: object) -> None

Parameters

Parameter	Type	Description
`handler`	object	A handler instance with can_handle(strategy) method.

def get(strategy: str) -> object | None

Get a handler that can handle the given strategy.

Parameters

Parameter	Type	Description
`strategy`	str	Strategy name to look up.

Returns

Type	Description
object \| None	First handler where can_handle(strategy) is True, or None.

`RetrievalCompletedEvent`

Emitted when the retrieval stage of a RAG pipeline completes.

Consumed by: quality metrics, retrieval analytics, feedback loops.

`RetrievalConfig`

Configuration for retrieval stage.

`RetrievalStrategyRegistry`

Registry of retrieval strategy implementations.

Strategies take a query and a set of candidate documents and return an ordered subset ranked by relevance.

Usage

registry = RetrievalStrategyRegistry.with_defaults()
strategy = registry.instantiate("mmr", lambda_param=0.7)
results = await strategy.retrieve(query, candidates, top_k=5)

def __init__() -> None

def with_defaults(cls) -> RetrievalStrategyRegistry

Create a registry pre-loaded with built-in strategies.

Registered keys: - "vector": VectorRetrievalStrategy - "mmr": MMRRetrievalStrategy

Returns

Type	Description
RetrievalStrategyRegistry	A new registry instance with default strategies registered.

`SynthesisCompletedEvent`

Emitted when the synthesis stage of a RAG pipeline completes.

Consumed by: quality metrics, answer analytics, audit.

`SynthesisConfig`

Configuration for response synthesis.

Attributes: strategy: Synthesis strategy to use max_context_length: Maximum context length in tokens max_response_length: Maximum response length in tokens include_citations: Whether to include citations output_format: Desired output format quality_check: Whether to run quality checks min_confidence: Minimum confidence threshold metadata: Additional configuration metadata

Functions

`create_chunker`

def create_chunker(
    strategy: ChunkingStrategy = ChunkingStrategy.FIXED_SIZE,
    config: ChunkingConfig | None = None,
    **kwargs: Any
) -> AbstractChunker

Create a chunker instance for the given strategy.

Convenience wrapper around ChunkingStrategyRegistry.

Parameters

Parameter	Type	Description
`strategy`	ChunkingStrategy	Which chunking strategy to use.
`config`	ChunkingConfig \| None	Optional chunking configuration. **kwargs: Additional keyword arguments forwarded to the chunker constructor (override config defaults).

Returns

Type	Description
AbstractChunker	A configured Chunker instance.

Raises

Exception	Description
ValueError	If no chunker is registered for the given strategy.

Exceptions

`RAGError`

Base exception for RAG errors.