AI Speculative Decoding - Graph View

Technique where a smaller draft model generates candidate tokens that a larger model verifies in parallel to speed up inference.