오픈AI가 엔비디아의 일부 하드웨어가 특정 유형의 문제에서 응답 생성 속도가 기대에 못 미친다고 보고, 대체 칩을 물색해 왔다는 보도가 나왔다. 보도에 따르면 오픈AI는 AMD, Cerebras, Groq 등과 접점을 넓히며 추론 컴퓨팅의 일부를 다른 아키텍처로 전환하는 시나리오도 검토 중인 것으로 전해졌다. 이는 ‘훈련’보다 추론의 비용, 지연시간, 메모리 병목이 서비스 품질과 원가를 좌우하는 국면으로 바뀌었음을 보여준다. 동시에 대형 AI 랩이 특정 벤더 락인을 줄이기 위해 혼합 조달·혼합 클러스터를 상시 옵션으로 두는 흐름을 강화하는 신호로 읽힌다.
오픈AI, 엔비디아 일부 칩에 ‘추론 성능’ 불만


