엔비디아 윈도우용 AI 성능 최적화 선언, AI 연산 가속하는 드라이버 배포
엔비디아 윈도우용 AI 성능 최적화 선언, AI 연산 가속하는 드라이버 배포
마이크로소프트 빌드 컨퍼런스에 참가한 엔비디아가 지포스 RTX AI PC와 RTX 워크스테이션에서 최고의 AI 성능을 제공하겠다며 윈도우용 AI 성능 최적화 및 통합을 발표했다.
그 첫 번째 결과물로 발표된 게임 레디 드라이버 555.85는 LLM 기반 인공지능 서비스에 사용되는 ONNX(ONNX Runtime, ORT)와 DirectML을 보다 빠르게 처리할 수 있으며 최대 3배까지 처리 능력이 향상되는 것으로 소개됐다.
물론, 엔비디아 자체 프레임워크인 텐서RT 만큼 추론 속도를 가속화 할 순 없겠지만 기존 보다 빠른 처리가 가능해졌고 이를 통해 보다 다양한 윈도우 기반 AI 서비스를 이용할 수 있게 됐다.
이와 함께 WebNN에 대한 최적화 작업도 병행되어 Stable Diffusion, SD Turbo 및 Whisper와 같은 인기 모델을 WebGPU 대비 최대 4배 더 빠르게 실행할 수 있게 됐다는 설명이다.
댓글
댓글 쓰기