이전 아키텍처인 페르미의 목표가 원시 성능(특히 컴퓨팅 및 테셀레이션)을 높이는 것이었다면, 엔비디아가 케플러 아키텍처에서 목표로 한 것은 전반적인 성능 향상을 추구하면서도 와트당 성능을 높이는 것이었다.[4] 엔비디아가 이 목표를 달성한 주요 방법은 통합 클럭의 사용이었다. 이전 GPU 설계에서 발견된 셰이더 클럭을 포기함으로써, 유사한 수준의 성능을 달성하는 데 더 많은 코어가 필요함에도 불구하고 효율성이 향상된다. 이는 코어가 전력 효율적이기 때문일 뿐만 아니라(엔비디아의 수치에 따르면 두 개의 케플러 코어가 하나의 페르미 코어 전력의 약 90%를 사용함), 클럭 속도 감소가 해당 영역에서 전력 소비를 50% 줄여주기 때문이다.[5]
케플러는 또한 바인드리스 텍스처(bindless textures)라고 알려진 새로운 형태의 텍스처 처리를 도입했다. 이전에는 GPU가 텍스처를 참조하기 전에 CPU가 텍스처를 고정 크기 테이블의 특정 슬롯에 바인딩해야 했다. 이로 인해 두 가지 제한이 있었다. 하나는 테이블의 크기가 고정되어 있어 이 테이블(128개)에 들어갈 수 있는 만큼만 동시에 텍스처를 사용할 수 있다는 것이었다. 두 번째는 CPU가 불필요한 작업을 수행했다는 것이다. CPU는 각 텍스처를 로드하고, 메모리에 로드된 각 텍스처를 바인딩 테이블의 슬롯에 바인딩해야 했다.[4] 바인드리스 텍스처를 사용하면 두 가지 제한이 모두 제거된다. GPU는 메모리에 로드된 모든 텍스처에 액세스할 수 있어 사용 가능한 텍스처 수가 증가하고 바인딩으로 인한 성능 저하가 없어진다.
마지막으로, 케플러를 통해 엔비디아는 메모리 클럭을 6 GHz로 높일 수 있었다. 이를 달성하기 위해 엔비디아는 완전히 새로운 메모리 컨트롤러와 버스를 설계해야 했다. GDDR5의 이론적인 7 GHz 한계에는 미치지 못하지만, 페르미의 메모리 컨트롤러 속도인 4 GHz보다 훨씬 높다.[5]
케플러의 이름은 독일의 수학자, 천문학자, 점성술사인 요하네스 케플러의 이름을 따서 지어졌다.
케플러 아키텍처는 SMX라고 불리는 새로운 스트리밍 멀티프로세서 아키텍처를 사용한다. SMX는 전체 GPU가 이중 펌프 "셰이더 클럭"이 아닌 단일 "코어 클럭"을 사용하므로 케플러의 전력 효율성의 핵심 방법이다.[5] SMX가 단일 통합 클럭을 사용하면 두 개의 케플러 CUDA 코어가 하나의 페르미 CUDA 코어 전력의 90%를 소비한다는 사실로 인해 GPU 전력 효율이 증가한다. 결과적으로 SMX는 사이클당 전체 워프를 실행하기 위해 추가 처리 장치가 필요하다. 케플러는 또한 경쟁력을 유지하기 위해 원시 GPU 성능을 높여야 했다. 그 결과, CUDA 코어는 CUDA 어레이당 16개에서 32개로 두 배 증가했고, 3개의 CUDA 코어 어레이가 6개의 CUDA 코어 어레이가 되었으며, 1개의 로드/저장 및 1개의 SFU 그룹이 2개의 로드/저장 및 2개의 SFU 그룹이 되었다. GPU 처리 자원도 두 배가 되었다. 2개의 워프 스케줄러에서 4개의 워프 스케줄러로, 4개의 디스패치 유닛이 8개가 되었고, 레지스터 파일은 성능 향상을 위해 64K 엔트리로 두 배 증가했다. GPU 처리 유닛 및 자원의 두 배 증가로 다이 공간 사용이 증가하면서 폴리모프 엔진의 기능은 두 배가 되지 않고 향상되어 4사이클 대신 2사이클에 다각형을 생성할 수 있게 되었다.[6] 케플러를 통해 엔비디아는 전력 효율성뿐만 아니라 면적 효율성에도 노력했다. 따라서 엔비디아는 다이 공간을 절약하기 위해 SMX에 8개의 전용 FP64 CUDA 코어를 사용하기로 결정했으며, 모든 케플러 CUDA 코어가 FP64를 지원하지는 않지만 여전히 FP64 기능을 제공한다. 엔비디아가 케플러에서 개선한 결과는 GPU 그래픽 성능 향상을 포함하며 FP64 성능은 낮아졌다.
새로운 명령어 스케줄러
복잡한 하드웨어 스케줄러를 간단한 소프트웨어 스케줄러로 대체함으로써 추가 다이 영역이 확보되었다. 소프트웨어 스케줄링을 통해 워프 스케줄링은 엔비디아의 컴파일러로 이동했으며, GPU 수학 파이프라인은 이제 고정된 지연 시간을 가지므로 스레드 수준 병렬성 외에도 명령어 수준 병렬성 및 슈퍼스칼라 실행을 포함한다. 명령어는 정적으로 스케줄링되므로 수학 파이프라인의 지연 시간이 이미 알려져 있으므로 워프 내부의 스케줄링은 중복된다. 이로 인해 다이 면적 공간 및 전력 효율이 증가했다.[5][7][4]
GPU 부스트
GPU 부스트는 CPU의 터보 부스팅과 거의 유사한 새로운 기능이다. GPU는 항상 "기본 클럭"이라고 불리는 최소 클럭 속도로 작동하도록 보장된다. 이 클럭 속도는 최대 부하에서도 GPU가 TDP 사양 내에 유지되도록 설정된다.[4] 그러나 부하가 낮을 때는 TDP를 초과하지 않고 클럭 속도를 높일 여지가 있다. 이러한 시나리오에서 GPU 부스트는 GPU가 미리 정의된 전력 목표(기본적으로 170W)에 도달할 때까지 클럭 속도를 점차적으로 높인다.[5] 이 접근 방식을 통해 GPU는 동적으로 클럭을 높이거나 낮추어 TDP 사양 내에서 가능한 최대 속도를 제공한다.
전력 목표와 GPU가 취할 클럭 증가 단계의 크기는 모두 타사 유틸리티를 통해 조정할 수 있으며 케플러 기반 카드를 오버클럭하는 수단을 제공한다.[4]
케플러 GPU에만 제공되는 TXAA는 게임 엔진에 직접 구현하도록 설계된 엔비디아의 새로운 안티에일리어싱 방법이다. TXAA는 MSAA 기술과 맞춤형 해결 필터를 기반으로 한다. 이 디자인은 깜박임 또는 시간 안티에일리어싱으로 알려진 게임의 주요 문제를 해결한다. TXAA는 움직이는 장면을 부드럽게 처리하여 게임 내 장면이 모든 에일리어싱 및 깜박임에서 제거되도록 보장한다.[10]
NVENC는 인텔의 퀵 싱크 비디오 및 AMD의 VCE와 유사하게 비디오 인코딩을 수행하는 엔비디아의 SIP 블록이다. NVENC는 코덱을 가져와 H.264 기반 콘텐츠를 디코딩, 전처리 및 인코딩할 수 있는 전력 효율적인 고정 기능 파이프라인이다. NVENC 사양 입력 형식은 H.264 출력으로 제한된다. 그러나 NVENC는 제한된 형식을 통해 최대 4096×4096 해상도로 인코딩을 수행할 수 있다.[11]
인텔의 퀵 싱크와 마찬가지로 NVENC는 현재 독점 API를 통해 노출되지만, 엔비디아는 CUDA를 통해 NVENC 사용을 제공할 계획이다.[11]
새로운 드라이버 기능
GTX 680과 함께 출시된 R300 드라이버에서 엔비디아는 적응형 VSync라는 새로운 기능을 도입했다. 이 기능은 수직 동기화의 제한을 해결하기 위한 것으로, 프레임 속도가 60FPS 아래로 떨어지면 수직 동기화 속도가 30FPS로 감소하고 필요에 따라 60의 추가 요인으로 감소하면서 끊김 현상이 발생한다. 그러나 프레임 속도가 60FPS 미만일 때는 모니터가 준비되는 대로 프레임을 표시할 수 있으므로 수직 동기화가 필요하지 않다. 이 문제를 해결하기 위해(화면 찢어짐에 대한 수직 동기화의 이점을 유지하면서) 드라이버 제어판에서 적응형 VSync를 켤 수 있다. 프레임 속도가 60FPS 이상이면 VSync를 활성화하고, 프레임 속도가 낮아지면 비활성화한다. 엔비디아는 이로 인해 전반적으로 더 부드러운 디스플레이를 얻을 수 있다고 주장한다.[4]
이 기능은 GTX 680과 함께 처음 출시되었지만, 업데이트된 드라이버를 설치하는 이전 엔비디아 카드 사용자도 이 기능을 사용할 수 있다.[4]
동적 슈퍼 해상도 (DSR)는 2014년 10월 엔비디아 드라이버 출시와 함께 페르미 및 케플러 GPU에 추가되었다. 이 기능은 장면을 더 높고 상세한 해상도로 렌더링(업스케일링)하고 모니터의 기본 해상도에 맞게 축소(다운샘플링)하여 표시되는 그림의 품질을 높이는 것을 목표로 한다.[12] 이러한 기능은 AMD의 가상 슈퍼 해상도 (VSR)와 유사하다.
엔비디아는 2018년 3월 마지막 Release 390 드라이버인 391.35가 출시된 후 32비트 운영 체제용 32비트 드라이버 출시를 중단했다.[36]
케플러 노트북 GPU는 2019년 4월 레거시 지원으로 전환되었으며 2020년 4월에 중요 보안 업데이트를 중단했다.[37] 이 변경으로 여러 노트북 지포스 6xxM GPU가 영향을 받았으며, 나머지 GPU는 2019년 1월부터 이미 지원이 중단된 저가형 페르미 GPU였다.[38]
엔비디아는 Release 470 드라이버 이후 윈도우 7 및 윈도우 8.1 운영 체제에 대한 드라이버 지원을 레거시 상태로 전환하고 2024년 9월까지 이들 운영 체제에 대한 중요 보안 업데이트를 계속 제공할 것이라고 발표했다.[39]
엔비디아는 모든 나머지 케플러 데스크톱 GPU가 2021년 9월부터 레거시 지원으로 전환되며 2024년 9월까지 중요 보안 업데이트를 지원할 것이라고 발표했다.[40] 모든 나머지 지포스 6xx GPU가 이 변경으로 영향을 받게 된다.