Ditto · Parallel Models, One Result

Edge-native LLM orchestration

Parallel Models One Result

Run multiple Cloudflare AI models simultaneously. Merge every output with consensus so your responses stay typed, validated, and ready for production flows.

Run bun add ditto-ai

ditto-example.ts

import { dittoClient } from "ditto-ai";

const ditto = dittoClient({
  endpoint: "/llm",
});

const result = await ditto({
  prompt: "Summarize this email...",
  strategy: "consensus",
  models: [
    "@cf/meta/llama-3.1-8b-instruct",
    "@cf/meta/mistral-7b"
  ],
});

Parallel Execution

Run multiple Cloudflare AI models simultaneously at the edge with low latency.

⊕

Consensus Merging

Blend every response into one reliable output with configurable merge rules.

◇

Type-Safe Results

Validate every payload with Effect.Schema or Zod so responses stay structured.

Architecture

Edge-Native Parallel Orchestration

Send a request once. Ditto orchestrates parallel model calls on Cloudflare's edge, waits for all responses, and merges them with consensus.

Durable Object

Per-request job orchestrator

Parallel RPC Calls

All models invoked simultaneously

Consensus Merge

Intent detection + confidence scoring

Workers edge
Durable Objects edge
Effect edge

Merge Strategies

Consensus · Cooperative

Consensus: All models answer in parallel, then merge results. Cooperative: Models build sequentially, each seeing previous outputs for multi-step workflows.

Use Cases

Email Summarization

Extract structured action items with multiple models for accuracy.

Content Moderation

Consensus reduces false positives before you block a user post.

Data Extraction

Parse PDFs into validated JSON with auto retry on schema drift.

Ready to build?

Drop Ditto into your Worker and start orchestrating LLMs.

Ship from the edge. Merge every response with proof you can log.

Read Docs GitHub

Test Ditto right here

Merged Result

Structured Payload

Performance Timings

Individual Model Responses