Inference Benchmark: TTFT vs E2E Latency

Contact us Log in

Contact us Log in Sign up

Loading...

Inference Benchmark: TTFT vs E2E Latency

Profile	Telnyx E2E	Together E2E	Fireworks E2E	Telnyx Throughput	Together Throughput
1k input, 1k output	8,331 ms	36,362 ms	11,453 ms	152 tok/s	33 tok/s
10k input, 1k output	8,990 ms	41,094 ms	10,604 ms	145 tok/s	29 tok/s
100k input, 1k output	11,065 ms	49,838 ms	13,924 ms	124 tok/s	27 tok/s

Profile	Telnyx	Together	Fireworks
1k in, 100 out	109	81	44
1k in, 1k out	94	62	36
10k in, 100 out	113	89	51
10k in, 1k out	83	57	32
100k in, 100 out	84	71	59
100k in, 1k out	82	53	39

Profile	Telnyx E2E	Together E2E	Fireworks E2E
1k in, 100 out	1,754 ms	1,901 ms	1,242 ms
1k in, 1k out	10,212 ms	28,304 ms	11,026 ms
10k in, 1k out	10,878 ms	14,458 ms	9,582 ms
100k in, 1k out	13,741 ms	23,960 ms	12,602 ms

Provider	Outlier cells (max > 5x median)	Worst single event
Together	15	206-second mid-stream stall (GLM-5.1)
Telnyx	4	36.7s E2E on MiniMax 100k input (median: 2.3s)
Fireworks	3	12.1s TTFT on Kimi 100k input (median: 1.2s)

If you care about...	Choose...	Why
MiniMax-M2.7 performance	Telnyx	3-6x faster E2E, 3-6x throughput vs Together
GLM-5.1 throughput	Telnyx	2x throughput advantage vs Fireworks at all profiles
Voice AI and real-time	Telnyx	Kimi K2.6 has lowest TTFT on our platform + regional availability + data sovereignty
Production reliability	Telnyx or Fireworks	Together had 15 outlier cells vs 4 and 3
Long-output workloads	Telnyx	TTFT advantage doesn't carry through to E2E on competitors
Regional availability	Telnyx	Serverless in US, EU, APAC (Dubai + São Paulo coming)
Data sovereignty	Telnyx	In-region compute by default; competitors are US-concentrated
Kimi K2.6 TTFT vs E2E	Fireworks	Fireworks leads raw TTFT, Telnyx is within 10-15% on E2E; voice AI ecosystem tilts toward Telnyx