SWEV
쓰루풋과 레이턴시, 그리고 새로운 인텔 CPU 본문
쓰루풋? 레이턴시?
컴퓨터의 성능을 보는 기준은 여러가지가 있지만, 크게 나눠 보면 둘 중 하나일 것이다. 하나는 쓰루풋이고, 하나는 레이턴시이다. 둘 다 평소에 잘 쓰이지 않는 단어인데다가 보통 이야기 하는 컴퓨터 속도의 단위들처럼 한눈에 보이지 않는 개념이기 때문에 약간의 설명이 필요하다.
△ 어벤져스에서 토니 스타크가 말하길, 자비스의 쓰루풋 성능은 600 테라 플롭스란다.
쓰루풋(Throughput)을 사전에서 찾아보면 단위시간 당 처리량 정도의 의미가 뜬다. 다시 말하면, '한꺼번에 얼마나 많은 일을 해낼 수 있는가' 정도로 생각할 수 있고, 차로 치면 최고속도나 최대 적재량 정도로 봐도 된다. 쓰루풋이 성능이 좋은 컴퓨터는 복잡한 인코딩이나 렌더링, 엑셀 매크로, 수치연산, 시뮬레이션 등의 일을 같은 시간에 더 많이 처리할 수 있다. 쓰루풋 성능의 단위엔 여러가지가 있지만 MB/s나 GB/s 그리고 Mbps정도를 제일 많이 볼 수 있을 것이다. 테라 플롭스도 단위도 영화나 뉴스에서 드물지 않게 볼 수 있다.
△ AIDA64의 메모리/캐쉬 벤치마크 결과 페이지. 파란 영역이 쓰루풋, 빨간 영역이 레이턴시다.
레이턴시(Latency)를 사전에서 찾아보면 잠복 내지는 숨어있는 정도의 뜻이 나온다. 컴퓨터나 IT 업계에서의 레이턴시는 뜻이 약간 달라지는데, '데이터를 요청하여 나올때 까지 걸리는 대기 시간'이란 뜻이다. 원래는 Latency Time이 맞는 표현이겠지만 대충 줄여서들 쓰다보니 그냥 줄어든 표현이 표준으로 굳어버렸다. 레이턴시가 좋은 컴퓨터는 사용자가 컴퓨터를 조작할 때 반응이 재빠르다. 네이버 창을 켜도 순식간에 뜨고, 포토샵 같은 무거운 프로그램도 금방 금방 켜진다. 레이턴시의 단위는 ms나 ns 정도가 가장 자주 쓰인다.
짐을 싣고 나르는 일에 비유를 하면 쓰루풋과 레이턴시의 차이가 조금 더 와닿을 것이다. 쓰루풋이 좋은 일꾼은 한 번에 더 많은 양의 짐을 들어 나를 수 있다. 반면 레이턴시가 좋은 일꾼은 동작이 재빠르다. 짐을 올려놓고 내려놓는 과정에서 시간을 낭비하지 않는다. 당연한 이야기지만, 어느 한쪽만을 고를 문제가 아니다. 자동차의 성능을 이야기 할 때 최고속도와 가속력 모두가 중요하듯이 컴퓨터의 쓰루풋과 레이턴시는 모두 중요하다.
그러나 여기엔 맹점이 있다. 요즘의 거의 모든 컴퓨터는 일상적인 작업 환경에서 충분히 레이턴시 성능이 좋다는게 문제다. 하다못해 컴퓨터를 작게 축소한 물건인 스마트폰도 그렇다. 3G에서 LTE로 통신 규격이 바뀌면서 인터넷의 레이턴시 성능이 매우 많이 좋아졌다. 간단하게 생각해보자. 당신이 쓰는 스마트폰에서 인터넷 페이지 로딩이 예전처럼 몇초씩 기다리고 버벅거리진 않을 것이다.
컴퓨터의 경우엔 SSD가 대중화되면서 사용자가 느끼는 레이턴시 성능이 크게 좋아진다. 다시 말하면, 2015년 기준으로 가장 싼 컴퓨터를 사더라도 레이턴시 성능이 느리다고 느끼는 일은 없을거란 이야기다. 그렇기에 80만원 이상의 컴퓨터를 조립해서 Core i5급 CPU와 GeForce GTX급의 그래픽카드를 쓰는 것은 철저히 쓰루풋 성능을 위해 투자하는 일이라고 볼 수 있다.
MB/s : Mega Bytes per Second, 초당 몇 MB를 전송 하느냐이다. 100MB/s면 CD 한 장 보내는데 7초 밖에 걸리지 않는다.
GB/s : Giga Bytes per Second, 초당 몇 GB를 전송하느냐이다. 1GB/s면 1024MB/s와 같다.
Mbps : Mega bits per Second, 초당 몇 Mb를 전송하느냐인데, 컴퓨터에서 B는 바이트고 b는 bit이기 때문에 Mbps 수치를 8로 나누면 MB/s와 같다. 우리가 흔히 쓰는 광랜의 속도인 100Mbps는 12.5MB/s인 셈. 스마트폰의 LTE는 최대 75Mbps까지 지원하기 때문에 대충 초당 10MB 조금 안되는 수준이라고 보면 된다.
Tera Flops : Tera Flops, Tera Floating-Point Operations per Second, 초당 몇 조(兆) 번의 연산을 처리할 수 있느냐의 단위이다. 위에서 토니 스타크가 600조 연산이 가능하다고 말한 대사의 원문을 들어보면 600 테라 플롭스라고 말하고 있다.
ms : milli second, 1/1000 초이다.
ns : nano second, 1/1,000,000,000 초이다.
1,2,3,4
△ 이 여자랑은 별 관계 없는 이야기.
인텔이 코어 2 브랜드를 버리고 코어 i 브랜드로 옮겨간지도 꽤 많은 시간이 흘렀다. 코어 i 시리즈는 현재 4세대까지 제품이 나와있지만 2세대나 3세대 사용자들 대부분이 4세대로 옮겨 갈 생각이 없다. 2세대는 1세대 제품보다 대충 30% 넘게 빨라서 바꾸면 다른게 느껴졌지만 3/4세대는 그 이전 제품들 보다 대단히 빠르지 않았기 때문이다. 잘 쳐줘야 몇몇 상황에서 15% 정도, 보통은 7~10%정도 빠른 정도다. 특히 클럭이 몇년째 크게 올라가지 않고 클럭당 성능에도 변화가 없다보니 쓰루풋 성능상으로는 매년 변화가 지지부진이다.
덕분에 2011년도에 샌디브릿지를 사서 오버클럭한 사람들은 최신 하스웰 CPU들을 봐도 별 생각이 없다. 어차피 레이턴시 성능이야 제일 싼 셀러론을 쓰든 제일 비싼 i7을 쓰든 충분히 빠르니 차이를 못느끼고 쓰루풋 성능은 몇 년째 크게 달라지지 않았으니까.
△ 2개의 Xeon E5 CPU를 달 수 있는 eVGA의 SR-X 메인보드.
상황이 이렇다보니 몇몇 매니아들은 더 뛰어난 쓰루풋 성능을 위해 눈을 돌렸다. 본디 서버용으로 개발된 CPU인 Xeon E5 시리즈를 쓰거나 Xeon의 개인용 버전인 Core i7 Extreme CPU를 사다가 쓰기 시작한 것이다. Xeon E5 CPU는 무지하게 비싼 CPU였지만 최대 18개의 코어를 쓸 수 있기 때문에 쓰루풋 성능이 무지 뛰어났다. 거기에 Xeon E5는 최대 2개의 CPU를 같이 쓸 수 있어서 36개의 코어를 가진 PC를 조립할 수 있다. i7 CPU는 4개의 코어라는 인텔의 제한에 묶여있는 상황이라 Xeon E5 듀얼 시스템은 i7 시스템과 비교하기 민망할 정도로 쓰루풋 성능이 좋다. 그렇지만 제온 E5나 i7 익스트림 CPU는 도저히 많이 팔릴 수가 없는 물건이다. 비싸고, 전기 요금이 신경쓰일 정도로 소모전력이 크다.
요약하자면, 인텔의 데스크탑 CPU 라인업이 몇년간 크게 발전이 없었다는 이야기다. 예전엔 30~40만원을 가지고 CPU를 매년 산다고 쳤을 때, 새로 산 CPU는 작년에 산 CPU보다 최소 20%는 더 빠른 쓰루풋 성능이 나왔는데 요즘엔 잘쳐줘야 몇몇 특수한 상황에서 10% 빠른 수준이니 매니아 입장에서 답답할 수 밖에. 펜티엄 2나 3가 시장에서 팔리던 시절엔 매년 2배씩 클럭이 올라가던 시절도 있었고, 코어 2 듀오를 두 개 묶어 코어 2 쿼드가 나왔듯이 쓸 수 있는 코어 갯수가 두 배씩 늘어나던 시절도 있었다. 그런데 지금은 전혀 아니다. 적어도 제온은 매년 코어 숫자가 증가하고 있지만 일반 사용자용 CPU는 코어수도, CPU 클럭도 크게 변함이 없다. 인텔이 개인사용자용으로 내놓는 최상의 CPU인 i7 익스트림도 마찬가지다. 그렇다고 제온을 쓰자니 비싸기도 비싼데다가 잡기능이 많아서 나같이 컴퓨터를 단순하게 쓰는 사람 입장에선 영 손이 가지 않는다. 소나타가 발전이 없어서 카탈로그를 살펴보니 소나타 위에 그랜져는 없고 페라리가 있는 꼴이다.
브로드웰과 스카이레이크의 등장
한동안 인텔은 CPU를 더 빠르게 만드는 일 보다는 더 적은 전기를 먹게 만드는 일에 집중했다. 그리고 그런 저전력화 바람의 선두에 서있는 두 CPU가 아톰과 코어 M 시리즈인데 아톰은 몇년 전만 해도 말도 안되게 느려서 화를 참아가며 쓰는 물건이었지만 지금은 이게 아톰인가 싶을 정도로 빠르다. 코어 M시리즈는 꼴랑 5W 정도의 전력만 쓰면서도 60W 정도를 쓰던 코어 2 듀오보다도 빠르다. 코어 M은 브로드웰을 바탕으로 전기를 최대한 덜 먹게 만든 물건이다. 지난 몇 년간의 저전력화 노력은 5세대인 브로드웰에 와서 확실하게 꽃을 피워냈다.
그렇다면 이젠 성능을 끌어 올리는 일에 집중할 차례인데, 이 역할은 6세대 i시리즈인 스카이레이크가 맡게 된다. 그리고 최근에 유출된 코어 i시리즈 6세대 CPU의 성능 측정 값이 꽤 괜찮아서 가져와 봤다.
△ 드디어 쓰루풋 성능이 크게 좋아졌다.
CPU의 성능을 측정하는 프로그램은 숱하게 많지만 개중에서도 내가 제일 관심있게 보는 성능은 씨네벤치 결과이다. 씨네벤치는 CPU의 쓰루풋 성능을 가장 빠르게 측정할 수 있는데, 테스트에 10분도 걸리지 않으면서도 결과값은 꽤 정확하다. '산구라'라는 별명이 붙을 정도로 스펙에 정비례하는 성능이 나와 벤치마크 값에 의미가 없는 산드라와도 다르고 다른 변수가 너무 많이 끼어들어서 순수하게 한 부품의 성능을 뽑아보기는 힘든 PC마크와도 많이 다르다. 그리고 무엇보다도 테스트 결과 점수가 아주 보기 편하게 되어있어서 서로 다른 CPU들간의 성능을 비교하기도 편하다.
위의 이미지에 올라간 스카이레이크 코어 i7 6700K는 클럭이 같은 4790K과 비교해서 15%가량 더 빠른 것으로 측정됐다. 4790K를 가지고 6700K의 성능을 따라잡으려면 대충 4.8Ghz까지는 오버클럭 해야 한다. 당연히 쉽지 않다. 그리고 6700K의 성능은 헥사코어인 5820K의 성능마저 턱끝까지 따라잡았다. 이 정도면 간만에 큰 성능 변화를 보여준 셈이다.
이만하면 인텔 스카이레이크를 기다릴만 하다. 지금 샌디브릿지 계열 CPU를 쓰고 있고 슬슬 뭔가 변화를 주고 싶은 나같은 사람이라면 특히 그렇다. 샌디브릿지와 Z68 칩셋은 아주 좋은 조합이고 충분히 빠르지만 바이오스를 대체하는 EFI 설계가 너무 낡아서 EFI로 윈도를 깔아도 부팅이 빨라지지 않는데다 NVMe같은 최신 저장장치 인터페이스를 쓸 수도 없다. 그리고 솔직히 4년 동안 컴퓨터를 끈 적이 손에 꼽을 수준인데 메인보드가 언제 고장날지 몰라 나는 언제나 불안불안하다. AMD의 ZEN과 비교해 보고 새 시스템을 짤 궁리를 해봐야겠다.