Inference Benchmark: TTFT vs E2E Latency