AVX-512는 무엇이며 인텔이 이를 없애는 이유는 무엇입니까?

AVX-512는 무엇이며 인텔이 이를 없애는 이유는 무엇입니까?

장치의 CPU는 초당 수백만 건의 계산을 수행하고 컴퓨터가 작동하는 방식을 담당합니다. CPU와 함께 작동하는 ALU(산술 처리 장치)는 수학적 작업을 담당하고 CPU 마이크로코드에 의해 구동됩니다.





이제 그 CPU 마이크로코드는 정적이 아니며 개선할 수 있으며 그러한 개선 중 하나는 Intel의 AVX-512 명령어 세트입니다. 그러나 Intel은 AVX-512를 종료하여 CPU에서 해당 기능을 영원히 제거할 예정입니다. 하지만 왜? 인텔이 AVX-512를 없애는 이유는 무엇입니까?





MAKEUSEOF 오늘의 비디오

ALU는 어떻게 작동합니까?

AVX-512 명령어 세트를 알기 전에 ALU가 어떻게 작동하는지 이해하는 것이 중요합니다.





지하실에 있는 라우터 위층에 약한 신호

이름에서 알 수 있듯이 산술 처리 장치는 수학적 작업을 수행하는 데 사용됩니다. 이러한 작업에는 더하기, 곱하기 및 부동 소수점 계산과 같은 연산이 포함됩니다. 이러한 작업을 수행하기 위해 ALU는 CPU의 클록 신호에 의해 구동되는 애플리케이션별 디지털 회로를 사용합니다.

따라서 CPU의 클럭 속도는 ALU에서 명령이 처리되는 속도를 정의합니다. 따라서 CPU가 5GHz 클럭 주파수에서 실행되는 경우 ALU는 1초에 50억 개의 명령을 처리할 수 있습니다. 이러한 이유로 클럭 속도가 증가할수록 CPU 성능이 향상됩니다.



  마더보드의 칩셋

즉, CPU 클럭 속도가 증가하면 CPU에서 발생하는 열량이 증가합니다. 이러한 이유로 고급 사용자는 시스템을 오버클럭할 때 액체 질소를 사용합니다. 불행히도 고주파수에서 이러한 온도 증가는 CPU 제조업체가 특정 임계값 이상으로 클럭 주파수를 증가시키는 것을 방지합니다.

그렇다면 차세대 프로세서는 이전 버전에 비해 어떻게 더 나은 성능을 제공합니까? 글쎄, CPU 제조업체는 성능을 향상시키기 위해 병렬 개념을 사용합니다. 이 병렬 처리는 CPU의 계산 능력을 향상시키기 위해 여러 처리 코어가 사용되는 멀티코어 아키텍처를 사용하여 달성할 수 있습니다.





성능을 향상시키는 또 다른 방법은 SIMD 명령어 세트를 사용하는 것입니다. 간단히 말해서 단일 명령 다중 데이터 명령을 사용하면 ALU가 서로 다른 데이터 포인트에서 동일한 명령을 실행할 수 있습니다. 이러한 유형의 병렬 처리는 CPU의 성능을 향상시키며 AVX-512는 특정 작업을 수행할 때 CPU의 성능을 높이는 데 사용되는 SIMD 명령입니다.

데이터가 ALU에 어떻게 도달합니까?

이제 ALU가 작동하는 방식에 대한 기본적인 이해가 있으므로 데이터가 ALU에 도달하는 방법을 이해해야 합니다.





  빈 배경의 하드 드라이브

ALU에 도달하려면 데이터가 다른 스토리지 시스템을 통해 이동해야 합니다. 이 데이터 여정은 컴퓨팅 시스템의 메모리 계층 구조를 기반으로 합니다. 이 계층 구조에 대한 간략한 개요는 다음과 같습니다.

  • 보조 메모리: 컴퓨팅 장치의 보조 메모리는 영구 저장 장치로 구성됩니다. 이 장치는 데이터를 영구적으로 저장할 수 있지만 CPU만큼 빠르지는 않습니다. 이로 인해 CPU는 보조 스토리지 시스템에서 직접 데이터에 액세스할 수 없습니다.
  • 기본 메모리: 기본 스토리지 시스템은 RAM(Random Access Memory)으로 구성됩니다. 이 스토리지 시스템은 보조 스토리지 시스템보다 빠르지만 데이터를 영구적으로 저장할 수는 없습니다. 따라서 시스템에서 파일을 열면 하드 드라이브에서 RAM으로 이동합니다. 즉, RAM조차도 CPU에 비해 ​​충분히 빠르지 않습니다.
  • 캐시 메모리: 캐시 메모리는 CPU에 내장되어 있으며 컴퓨터에서 가장 빠른 메모리 시스템입니다. 이 메모리 시스템은 세 부분으로 나뉩니다. L1, L2 및 L3 캐시 . ALU에서 처리해야 하는 모든 데이터는 하드 드라이브에서 RAM으로 이동한 다음 캐시 메모리로 이동합니다. 즉, ALU는 캐시에서 직접 데이터에 액세스할 수 없습니다.
  • CPU 레지스터: 컴퓨팅 장치의 CPU 레지스터는 크기가 매우 작으며 컴퓨터 아키텍처에 따라 이러한 레지스터는 32비트 또는 64비트의 데이터를 저장할 수 있습니다. 데이터가 이러한 레지스터로 이동하면 ALU가 데이터에 액세스하여 당면한 작업을 수행할 수 있습니다.

AVX-512란 무엇이며 어떻게 작동합니까?

AVX 512 명령어 세트는 AVX의 두 번째 반복이며 2013년 Intel 프로세서에 적용되었습니다. Advanced Vector Extensions의 약자인 AVX 명령어 세트는 Intel의 Xeon Phi(Knights Landing) 아키텍처에 처음 도입되었으며 나중에 Intel의 서버에 적용되었습니다. Skylake-X CPU의 프로세서.

또한 AVX-512 명령어 세트는 Cannon Lake 아키텍처를 사용하는 소비자 기반 시스템에 적용되었으며 나중에 Ice Lake 및 Tiger Lake 아키텍처에서 지원되었습니다.

이 명령어 세트의 주요 목표는 데이터 압축, 이미지 처리 및 암호화 계산과 관련된 작업을 가속화하는 것이었습니다. 이전 반복에 비해 두 배의 연산 능력을 제공하는 AVX-512 명령어 세트는 상당한 성능 향상을 제공합니다.

그렇다면 인텔은 AVX-512 아키텍처를 사용하여 CPU 성능을 어떻게 두 배로 높일 수 있었습니까?

앞서 설명했듯이 ALU는 CPU 레지스터에 있는 데이터에만 액세스할 수 있습니다. 고급 벡터 확장 명령어 세트는 이러한 레지스터의 크기를 늘립니다.

이러한 크기 증가로 인해 ALU는 단일 명령에서 여러 데이터 포인트를 처리할 수 있어 시스템 성능이 향상됩니다.

레지스터 크기 측면에서 AVX-512 명령어 세트는 32개의 512비트 레지스터를 제공하며 이는 이전 AVX 명령어 세트와 비교할 때 두 배입니다.

인텔이 AVX-512를 종료하는 이유는 무엇입니까?

앞서 설명했듯이 AVX-512 명령어 세트는 몇 가지 계산상의 이점을 제공합니다. 실제로 TensorFlow와 같은 인기 있는 라이브러리는 명령어 세트를 사용하여 명령어 세트를 지원하는 CPU에서 더 빠른 계산을 제공합니다.

온라인으로 셔츠를 사기 가장 좋은 곳

그렇다면 인텔이 최신 Alder Lake 프로세서에서 AVX-512를 비활성화하는 이유는 무엇입니까?

음, Alder Lake 프로세서는 Intel에서 제조한 구형 프로세서와 다릅니다. 이전 시스템은 동일한 아키텍처에서 실행되는 코어를 사용했지만 Alder Lake 프로세서는 두 개의 다른 코어를 사용합니다. Alder Lake CPU의 이러한 코어는 P 및 E 코어 다양한 아키텍처로 구동됩니다.

P 코어는 Golden Cove 마이크로아키텍처를 사용하는 반면 E 코어는 Gracemont 마이크로 아키텍처를 사용합니다. 아키텍처의 이러한 차이점으로 인해 특정 명령이 한 아키텍처에서는 실행될 수 있지만 다른 아키텍처에서는 실행되지 않을 때 스케줄러가 올바르게 작동하지 않습니다.

Alder Lake 프로세서의 경우 AVX-512 명령 세트가 그러한 예 중 하나입니다. P 코어에는 명령을 처리할 하드웨어가 있지만 E 코어에는 없기 때문입니다.

이러한 이유로 Alder Lake CPU는 AVX-512 명령어 세트를 지원하지 않습니다.

즉, AVX-512 명령은 Intel이 물리적으로 융합하지 않은 특정 Alder Lake CPU에서 실행할 수 있습니다. 동일한 작업을 수행하려면 사용자가 BIOS 중에 E-코어를 비활성화해야 합니다.

외장 하드 드라이브 Mac을 파티션하는 방법

AVX-512가 소비자 칩셋에 필요합니까?

AVX-512 명령어 세트는 CPU 레지스터의 크기를 늘려 성능을 향상시킵니다. 이러한 성능 향상을 통해 CPU는 숫자를 더 빠르게 처리할 수 있으므로 사용자는 더 빠른 속도로 비디오/오디오 압축 알고리즘을 실행할 수 있습니다.

즉, 이러한 성능 향상은 프로그램에 정의된 명령어가 AVX-512 명령어 세트에서 실행되도록 최적화된 경우에만 관찰할 수 있습니다.

이러한 이유로 AVX-512와 같은 명령어 세트 아키텍처는 서버 워크로드에 더 적합하며 소비자급 칩셋은 AVX-512와 같은 복잡한 명령어 세트 없이도 작동할 수 있습니다.