본문 바로가기

New Features

Intel은 AMD와 경쟁하고 GPU 전투에 참여하여 6nm 프로세서를 만들었습니다.

반응형

8 월 중순에 종료 된 Intel 2020 Architecture Day 이벤트에서 Intel은 Tiger Lake SoC, Xe GPU, SuperFin 트랜지스터 프로세스, FPGA 로드맵, 하나의 API 프레임 워크 등 일련의 최신 기술 개발을 발표했습니다. 이러한 기술과 제품은 6 단계를 포함합니다. 기술, 아키텍처, 스토리지, 상호 연결, 보안 및 소프트웨어. 이것은 또한 인텔 수석 아키텍트 Raja Koduri가 홍보 해 온 인텔 풀 스택 소프트웨어 및 하드웨어 아키텍처입니다. Xe GPU는 인텔이 최근 몇 년간 집중해온 차세대 GPU 아키텍처입니다. Intel의 이전 통합 GPU와 달리 Xe는 기본 GPU 아키텍처에 가깝기 때문에 다양한 응용 분야 및 시나리오에 대해 다양한 GPU 제품을 도출 할 수 있습니다. 이번에 출시 된 Xe GPU 제품 시리즈는 통합 그래픽과 보급형 디스크리트 그래픽에 중점을 둔 XeLP부터 게임 및 데스크탑 성능에 최적화 된 Xe HPG, 주로 데이터 센터에서 사용되는 Xe HP, AI 다음으로 고성능 컴퓨팅을위한 Xe HPC 시리즈 4 개가 있습니다.

특히이 4 가지 유형의 Xe GPU는 Intel의 자체 10nm 공정과 이번에 출시 된 차세대 10nm SuperFin 공정뿐 아니라 다른 Foundry 공정에서도 테이프 아웃 생산을 위해 서로 다른 반도체 제조 공정을 사용할 것입니다. . 기자 회견에서 직접적인 이름은 없었지만 TSMC가 6 나노 공정으로 인텔로부터 수십만 개의 칩을 주문했다는 소식은 오랫동안 공개 된 "비밀"이었습니다. 올해의 HotChips 컨퍼런스에서 인텔은 Xe 아키텍처에 대해 심도있는 소개를했습니다. 인텔은 Xe GPU에 대한 높은 기대치를 가지고 있음을 알 수 있습니다. Xe의 등장은 Intel의 고성능 GPU 분야 진출을 공식적으로 발표했으며 Intel의 Scalar (CPU), Vector (GPU), Matrix (ASIC) 및 Spatial (FPGA) 4 가지 컴퓨팅 유형 칩의 전체 커버리지를 완료했습니다.

1. Xe 아키텍처의 주요 기능 :

Xe에 대한 세 가지 주요 디자인 아이디어는 소프트웨어 우선, 확장 및 새로운 응용 프로그램입니다. 이는 Xe가 독립된 제품으로 보이지 않지만 인텔의 전체 하드웨어 제품 포트폴리오 및 통합 소프트웨어 개발 환경과 협력하여 설계 될 것임을 보여줍니다. Raja는 동일한 소프트웨어 스택과 동일한 마이크로 아키텍처 디자인을 사용하여 여러 Xe 제품의 빠른 확장을 달성하기를 희망한다고 반복해서 강조했으며, 이는 후속 기사에서 여러 번 언급 될 것입니다. Intel의 11 세대 통합 디스플레이에서 각 EU에는 산술 연산을위한 8 개의 파이프 라인이 있습니다. 더 높은 산술 연산 성능을 얻기 위해 XeLP는 EU의 산술 연산 파이프 라인을 16 개 라인으로 두 배로 늘 렸습니다. 이러한 산술 연산 파이프 라인은 고정 소수점, 단 정밀도 부동 소수점 및 배정 밀도 부동 소수점 연산을 수행 할 수있을뿐만 아니라 복잡한 수학 연산과 선택적 행렬 연산의 확장도 수행 할 수 있습니다. 각 파이프 라인의 폭이 이전 세대에 비해 증가되어 INT16 및 INT32의 성능이 두 배가되었습니다. 실제로 구현 프로세스를 단순화하기 위해 XeLP는 이전 세대 통합 디스플레이의 두 EU 장치를 병합하고 스레드 관리 모듈을 공유합니다. 스토리지 시스템 측면에서 XeLP는 L1 캐시를 재 설계하고 L3 캐시의 용량을 16MB로 늘 렸습니다. 또한 그래픽 카드 메모리의 대역폭이 두 배가되었습니다.

2. XeLP 게임 성능

XeLP의 주요 시장 포지셔닝은 통합 그래픽과 보급형 개별 그래픽입니다. 그럼에도 불구하고 XeLP는 게임 성능도 최적화했습니다. 다음은 XeLP에서 실행되는 게임의 일부 스크린 샷입니다. 예를 들어 XeLP는 1080p, 30FPS 및 전체 효과에서 원활하게 실행되도록 Battlefield 5를 지원할 수 있습니다. 특정 최적화 측면에서 첫 번째는 동일한 성능을 유지하면서 전력 소비를 크게 줄이는 것입니다. 예를 들어, 다음 그림은 Battlefield 1을 실행할 때 Intel의 이전 세대 GPU 및 XeLP의 사진과 전력 소비를 보여줍니다. 비슷한 화질의 경우 이전 세대 GPU는 25W를 소비하고 XeLP는 15 와트. 또한 XeLP는 프레임 속도를 개선하여 프레임 드롭을 크게 방지 할 수있어 아래 그림의 탱크 크롤러 부분에서 볼 수 있듯이 이미지 품질을 더욱 섬세하게 만듭니다. 이로 인해 동일한 전력 소비 조건에서 XeLP는 안정적인 프레임 수를 보장하면서 더 높은 품질의 영상 효과를 제공 할 수 있습니다. 다음 그림은 이전 세대 GPU 및 XeLP의 렌더링 기능과 이미지 품질을 비교합니다. XeLP의 세부적인 성능 기능은 그림자 묘사 및 차체 세부 묘사와 같은 이전 세대 GPU보다 훨씬 우수하다는 것을 알 수 있습니다.

 

3. AI 컴퓨팅 최적화 :

Intel의 최신 Tiger Lake 아키텍처에는 Willow Core라는 새로운 CPU 코어 유닛과 XeLP의 중앙 집중식 디스플레이 버전이 포함되어 있습니다. Tiger Lake와 Willow Core에 대한 자세한 기술적 해석은 다음 기사에서 자세히 소개합니다. 여기서 언급하고 싶은 것은 Tiger Lake의 XeLP도 AI 운영을위한 특정 아키텍처 최적화 기능을 가지고 있다는 것입니다. OpenVINO 툴킷 및 Intel의 DL Boost 기술과 결합하면 AI 추론의 컴퓨팅 성능이 크게 향상 될 수 있습니다. 아래 그림과 같이 이미지 향상을 위해 Gigapixel AI를 실행할 때 XeLP는 이전 2 세대 GPU에 비해 ​​컴퓨팅 성능이 기하 급수적으로 증가했습니다.

4. 멀티미디어 및 디스플레이 최적화 :

XeLP는 멀티미디어 및 디스플레이를 최적화하며 주요 청중은 수많은 비디오 및 이미지 콘텐츠 제작자입니다. 이 영역에서 최적화를위한 세 가지 주요 방향이 있습니다. 즉, 더 많은 픽셀, 더 많은 색상 및 더 낮은 전력 소비를 제공합니다. 특히 XeLP는 4K / 8K 60 프레임 비디오, Dolby Vision HDR 등과 같은 일련의 초 고화질 비디오 표준을 지원하고 최대 2의 성능 향상을 달성하는 멀티미디어 엔진 (Media Engine)을 통합합니다. 코덱 처리량 측면에서 시간. XeLP의 디스플레이 엔진에서 4 픽셀 처리 파이프 라인이 통합되어 XeLP는 DisplayPort1.4, HDMI2.0, USB4 Type-C, 8K UHD, HDR10 및 Dolby Vision Play를 포함한 다양한 비디오 인터페이스를 지원합니다. 고화질 비디오. 멀티미디어 엔진 및 디스플레이 엔진의 특정 아키텍처 세부 사항에 대해서는 Knowledge Planet에 업로드 된 HotChips2020에 대한 Xe의 슬라이드를 참조 할 수 있습니다.

5. Xe GPU 소프트웨어 스택 :

이전 통합 그래픽 시리즈와 비교하여 Xe GPU는 소프트웨어 기반 아키텍처에 많은 변화를 가져 왔습니다. 세 가지 주요 사항이 있습니다 :보다 효율적인 컴파일러, 새로운 DirectX11 드라이버 및 GPU 프로필 (아래 그림 참조). 또한 Xe는 Instant Game Tuning이라고하는 특정 게임에 대한 대상 최적화도 지원합니다. 이 최적화 방법은 자동으로 수행되며 추가 드라이버 업데이트가 필요하지 않습니다.

6. Xe GPU 제품 라인 및 제조 공정 :

위에서 소개 한 XeLP는 주로 TigerLake SoC에서 통합 GPU로 판매됩니다. 그러나 XeLP에는 두 가지 다른 제품 형태가 있습니다. 하나는 DG1이고 다른 하나는 SG1입니다. 그중 DG1은 인텔 최초의 개별 그래픽 제품으로 주로 모바일 플랫폼을 기반으로 한 비디오 및 이미지 콘텐츠 제작자를 대상으로합니다. SG1은 XeLP 아키텍처를 기반으로하는 또 다른 개별 그래픽 제품으로, 주로 데이터 센터의 멀티미디어 콘텐츠 처리 및 관련 애플리케이션을 지향합니다. 데이터 센터의 광범위한 애플리케이션 시나리오를 위해 Xe는 XeHP라는 GPU 제품을 특별히 담당합니다. XeLP와 비교하여 XeHP는 GPU의 전반적인 성능을 향상시키기 위해 특별히 데이터 센터에 맞게 마이크로 아키텍처를 최적화했습니다. 예를 들어 XeHP의 EU 수는 수십 개의 XeLP에서 수천 개로 직접 증가했습니다. 작동 주파수는 XeLP의 두 배입니다. 메모리 대역폭과 IPC도 통합 그래픽보다 10 배 더 높습니다. 또한 XeHP는 배정 밀도 부동 소수점 숫자 및 AI 관련 수학 연산을위한 향상된 하드웨어 지원과 같은 수학 연산 단위를 특별히 설계했습니다. 더 흥미롭게도 XeHP는 타일 수를 직접 늘림으로써 성능이 선형 적으로 증가 할 수 있습니다. 예를 들어, XeHP는 현재 1, 2, 4 개의 타일을 포함한 세 가지 패키징 형태를 가지고 있으며, 각각은 완전한 Xe GPU 칩입니다.

반응형