Scan API(LLM x2) Performance Test - VU 700

이코에코(Eco²) Context/Performance 2026. 1. 27. 15:49

Date: 2026-01-27 15:36 KST (06:36 UTC)
Test Type: k6 Scan Polling Test
Target VUs: 700
OpenAI Tier: 4 (TPM 4,000,000)
Snapshot: https://grafana.dev.growbin.app/d/scan-sse-pipeline/f09f93a1-scan-sse-pipeline-event-bus?from=2026-01-27T06:32:35.036Z&to=2026-01-27T06:37:41.547Z&timezone=browser&refresh=10s

Grafana

grafana.dev.growbin.app

Executive Summary

동영상 서비스가 종료되어 해당 콘텐츠를 재생할 수 없습니다.

VU 700 테스트에서 99.2% 성공률을 달성하였습니다. Tier 4 TPM 한도(4M) 내에서 안정적으로 처리되었습니다.

성공률	99.2%	-0.5%	PASS
실패 건수	11	+7	PASS
HTTP 429 에러	0	-	정상
E2E P95	122.3s	+13%	FAIL (SLA)
Throughput	329.1 req/m	-8%	-

1. Test Configuration

test_info:
  target_vus: 700
  test_script: k6-scan-polling-test.js
  endpoint: https://api.dev.growbin.app/api/v1/scan
  timestamp: 2026-01-27T06:36:39.323Z
  poll_timeout: 300s
  max_poll_attempts: 150
  openai_tier: 4

Test Timeline

Test Start	06:33:39	15:33:39	Ramp-up 시작
Worker Scale-up	06:34:00	15:34:00	1 → 3 replicas
Steady State	06:34:09	15:34:09	VU 700 도달
Test End	06:36:39	15:36:39	JSON 결과 저장

2. Test Results

2.1 Throughput & Success Rate

Total Submitted	1,496	1,408	1,592	+6.3%
Total Completed	1,313	1,401	1,494	-6.3%
Total Failed	11	4	53	+7
Success Rate	99.2%	99.7%	96.6%	-0.5%
Reward Rate	0.0%	0.0%	0.0%	-
Throughput	329.1 req/m	358.6 req/m	378.7 req/m	-8.2%

2.2 Latency Distribution

Scan Submit P95	444ms	360ms	+23%	< 500ms	PASS
Poll P95	1,283ms	922ms	+39%	< 500ms	FAIL
E2E P95	122.3s	108.3s	+13%	< 30s	FAIL
E2E Average	89.9s	73.0s	+23%	< 20s	FAIL

2.3 Polling Statistics

Total Poll Requests	57,955	47,727	+21%
Avg Polls per Task	39.7	33.9	+17%
Poll Interval	~2s	~2s	-

3. Error Analysis

3.1 Error Summary

HTTP 429 (Rate Limit)	0	정상
Rate Limit Retries	0	정상
Quota Exhausted	0	정상
Answer Failed	0	정상
Vision Failed	0	정상

3.2 Failure Breakdown (11건)

Polling Timeout	~11	100%	E2E > 300s
Rate Limit	0	0%	Tier 4 TPM 4M 내
Quota 소진	0	0%	Auto-recharge
Total	11	100%	-

3.3 TPM Usage Analysis

VU 700 TPM Estimation:
├─ Completed tasks: 1,313
├─ Estimated tokens/task: ~5,000
├─ Total tokens (3min): ~6,565,000
├─ TPM Average: ~2,188,000 tokens/min
├─ TPM Limit: 4,000,000 (Tier 4)
└─ Usage: 55% of limit (Safe Zone)

4. Infrastructure Metrics

4.1 KEDA Scaling Events

06:34:00	scan-worker	1 → 3	scan.vision queue > 10
06:34:30	scan-api	1 → 2	CPU threshold
06:38:00	scan-worker	3 → 1	All metrics below target

4.2 RabbitMQ Queue Depth

scan.vision	179	358	-50%
scan.rule	393	331	+19%
scan.answer	383	280	+37%
scan.reward	147	160	-8%

4.3 Worker Resource Usage

scan-worker-wtxmw	0.88 cores	952MB	k8s-worker-ai
scan-worker-6vl6n	0.88 cores	496MB	k8s-worker-ai-2
scan-worker-vlxd7	0.88 cores	500MB	-
scan-worker-canary	0.86 cores	926MB	k8s-worker-ai

4.4 Redis Memory Usage

rfr-cache	225MB	167MB	+35%
rfr-streams	63MB	58MB	+9%

5. VU Progression Summary

5.1 VU별 성능 비교 (Tier 4)

600	1,408	1,401	4	99.7%	108.3s
700	1,496	1,313	11	99.2%	122.3s
1000	1,592	1,494	53	96.6%	166.7s

5.2 운영 권장 범위 (Tier 4 기준)

Green Zone	50-400	99.9%+	< 65s	< 40%
Yellow Zone	400-600	99.5%+	65-110s	40-55%
Orange Zone	600-700	99%+	110-125s	55-60%
Red Zone	700-1000	96%+	125-170s	60-70%

6. Comparison with Previous Tests

6.1 Tier 3 vs Tier 4 at High VU

성공률	92.5%	99.2%	96.6%
Rate Limit 에러	1,017	0	0
E2E P95	175.4s	122.3s	166.7s
Throughput	301.1 req/m	329.1 req/m	378.7 req/m

6.2 Key Insight

VU 700 Tier 4가 VU 1000 Tier 3보다 우수한 성능
Rate Limit 해소로 안정적인 처리 가능
E2E 레이턴시 SLA(30s)는 여전히 미달

7. Recommendations

7.1 현재 상태 평가

Rate Limit	정상	TPM 55% 사용
Quota	정상	Auto-recharge 작동
성공률	양호	99.2% > 95% SLA
레이턴시	초과	E2E P95 122.3s > 30s

7.2 VU 800/900 테스트 예상

800	~98.5%	~65%	Medium
900	~97.5%	~72%	Medium-High

8. Appendix

8.1 Raw Test Output

{
  "test_info": {
    "target_vus": 700,
    "duration_seconds": 1769495559.918264
  },
  "results": {
    "total_submitted": 1496,
    "total_completed": 1313,
    "total_failed": 11,
    "success_rate": "99.2%",
    "reward_rate": "0.0%"
  },
  "latency": {
    "scan_submit_p95": "444ms",
    "poll_p95": "1283ms",
    "e2e_p95": "122.3s",
    "e2e_avg": "89.9s"
  },
  "polling": {
    "total_poll_requests": 57955,
    "avg_polls_per_task": "39.7"
  },
  "throughput": {
    "requests_per_minute": "329.1 req/m"
  }
}

8.2 Prometheus Query Reference

# Time Range
start: 2026-01-27T06:33:39Z
end: 2026-01-27T06:36:39Z

# Worker CPU
sum(rate(container_cpu_usage_seconds_total{namespace="scan",pod=~"scan-worker.*"}[1m])) by (pod)

# Worker Memory
sum(container_memory_working_set_bytes{namespace="scan",pod=~"scan-worker.*"}) by (pod) / 1024 / 1024

# Queue Depth
rabbitmq_queue_messages{queue=~"scan.*"}

8.3 Related Files

Test Script: e2e-tests/performance/k6-scan-polling-test.js
Result JSON: k6-scan-polling-vu700-2026-01-27T06-36-39-323Z.json
VU 600 Report: docs/blogs/tests/2026-01-27-scan-load-test-vu600.md
VU 1000 Tier 4 Report: docs/blogs/tests/2026-01-27-scan-load-test-vu1000-tier4.md

9. Conclusion

VU 700 테스트 결과 요약

성공률	99.2% (PASS)
Rate Limit	0건 (Tier 4 정상)
실패 원인	Polling Timeout (11건)
TPM 사용률	~55% (Safe Zone)

'이코에코(Eco²) Context > Performance' 카테고리의 다른 글

Scan API(LLM x2) Performance Test - VU 900 (0)	2026.01.27
Scan API(LLM x2) Performance Test - VU 800 (0)	2026.01.27
Scan API(LLM x2) Performance Test - VU 1000 (Tier 4) (0)	2026.01.27
Scan API(LLM x2) Performance Test - VU 1000 (Tier 3) (0)	2026.01.27
Scan API(LLM x2) Performance Test - VU 600 (0)	2026.01.27

ABOUT ME

mango_fr 개발기 mango_fr 개발기

Executive Summary

1. Test Configuration

Test Timeline

2. Test Results

2.1 Throughput & Success Rate

2.2 Latency Distribution

2.3 Polling Statistics

3. Error Analysis

3.1 Error Summary

3.2 Failure Breakdown (11건)

3.3 TPM Usage Analysis

4. Infrastructure Metrics

4.1 KEDA Scaling Events

4.2 RabbitMQ Queue Depth

4.3 Worker Resource Usage

4.4 Redis Memory Usage

5. VU Progression Summary

5.1 VU별 성능 비교 (Tier 4)

5.2 운영 권장 범위 (Tier 4 기준)

6. Comparison with Previous Tests

6.1 Tier 3 vs Tier 4 at High VU

6.2 Key Insight

7. Recommendations

7.1 현재 상태 평가

7.2 VU 800/900 테스트 예상

8. Appendix

8.1 Raw Test Output

8.2 Prometheus Query Reference

8.3 Related Files

9. Conclusion

VU 700 테스트 결과 요약

'이코에코(Eco²) Context > Performance' 카테고리의 다른 글

티스토리툴바

ABOUT ME

Executive Summary

1. Test Configuration

Test Timeline

2. Test Results

2.1 Throughput & Success Rate

2.2 Latency Distribution

2.3 Polling Statistics

3. Error Analysis

3.1 Error Summary

3.2 Failure Breakdown (11건)

3.3 TPM Usage Analysis

4. Infrastructure Metrics

4.1 KEDA Scaling Events

4.2 RabbitMQ Queue Depth

4.3 Worker Resource Usage

4.4 Redis Memory Usage

5. VU Progression Summary

5.1 VU별 성능 비교 (Tier 4)

5.2 운영 권장 범위 (Tier 4 기준)

6. Comparison with Previous Tests

6.1 Tier 3 vs Tier 4 at High VU

6.2 Key Insight

7. Recommendations

7.1 현재 상태 평가

7.2 VU 800/900 테스트 예상

8. Appendix

8.1 Raw Test Output

8.2 Prometheus Query Reference

8.3 Related Files

9. Conclusion

VU 700 테스트 결과 요약

'이코에코(Eco²) Context > Performance' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바