비트(Bit)
Binary Digit를 줄인 말. 정보라고 취급할 수 있는 가공된 데이터(자료)들을 나타내는 최소 단위이며, 컴퓨터 용량이나 프로그램 처리능력의 최소 단위로 사용한다. 2의 X제곱에서 이 X가 바로 비트를 나타낸다. 또한 8비트=1바이트인데, 이는 컴퓨터가 문자 데이터를 8개의 비트 단위로 묶어 한 번에 처리하기 때문이다. ASCII 코드는 한 문자당 최대 7비트(128가지)의 문자를, EBCDIC 코드는 한 문자당 최대 8비트(256가지)의 문자를 표현할 수 있다.
인터넷 광고에서 흔히 쓰이는 초당 100Mbps니 하는 것도 역시 bit 단위다. 착각하지 말자. 100Mbps라고 하면, 즉 8로 나누면 12.5MBps 이니 1초에 100 메가바이트가 전송되는것이 아니라 최대 12.5메가바이트를 전송 할수있다는 뜻. 이론상 수치라서 보통 가정집에서 10메가바이트 정도가 나오고, 환경이 좋다면 11~11.8메가바이트가 가능하다. 대략 8~10으로 나누면 편하다.
바이트 (Byte)
Byte. 컴퓨터의 저장 단위로, 컴퓨터가 조작하는 정보의 최소 처리 단위다. 컴퓨터에서 정보의 최소 단위는 이진법의 한 자리수로 표현되는 비트(Bit)지만, 비트 하나로는 0 또는 1이라는 2가지 표현밖에 할 수 없으므로, 일정한 단위로 묶어서 바이트(Byte)라고 칭하고 정보를 표현하는 기본 단위로 삼고 있다.
1개당 2개의 정보를 표시 가능한 비트를 8개 묶은 1옥텟으로 2의 8제곱, 즉 256 종류의 정보를 나타낼 수 있어 숫자와 영문자를 모두 표현할 수 있고 남는 공간에 특수문자까지 할당할 수 있다. 7비트보다 다루기 편하기 때문에 1옥텟=1바이트인 CPU가 나온 이래로 1옥텟이 사실상 표준 1바이트로 컴퓨터 세상을 평정했다.
한글은 여러 자모를 조합해 한 글자를 형성하기 때문에 당연히 256자로는 어림도 없다. 공인된 글자 수만도 2500자가 넘으므로 1바이트(256자)로는 이를 모두 표현할 수 없다. 때문에 한글은 한 글자가 최소 2바이트(256 x 256 = 65536자)다. 또한 한글 완성형 중에는 한글 한 글자가 3바이트인 경우도 있다.
킬로바이트 (Kilobyte)
1KB = 8,192bit
컴퓨터 데이터의 양 단위중 하나로 bit의 8,192배이다.
바이트의 1024배로서 메가바이트의 1024분의 1의 용량이기도하다.
주로 MS-DOS 시절때 많이 볼수 있었고 현재도 이미지, 텍스트 파일에서 흔히 볼 수 있는 용량이다.
프로그래밍 파일에서 자주 보이는 용량이기도 하다.
메가바이트 (Megabyte)
컴퓨터 데이터의 용량 단위. 1KB의 1024(210)배이다. 이름의 유래는 SI 접두어의 메가.
그러나 2진수를 쓰는 컴퓨터의 특징상 각종 성능 따위가 2배씩 느는 일이 많고 2진수로 처리하는 것이 성능상 이득이므로 관용적으로 1MB를 1024KB로, 즉 1048576(2^20) Byte로 부르는 경우가 많다.
혼란을 피하기 위해 MiB[메비바이트]라는 단위를 쓰기도 한다. (1 MiB = 1024 KiB = 1048576 Byte) 리눅스 등의 운영체제를 쓰다 보면 볼 수 있다. 용량을 분명히 해야 할 경우 SI 접두어를 지키고 이진 접두어를 쓴 단위와 구별하여 사용한다.
보통 메모장 기준 텍스트 분량으로만 몇십만 자를 넘어가서 1MB만 해도 상당한 분량이 된다. 그림 파일 같은 경우는 용량이 크기 때문에 컬러냐 흑백이냐 또는 사이즈에 따라 그 양이 달라진다.
기가바이트 (Gigabyte)
1,000메가바이트(IEEE1541-2002의 국제표준)가 1기가바이트와 같으며 일반적인 하드 디스크 드라이브의 용량 단위로 표기된다. byte에 10억(109)을 뜻하는 기가를 붙여 만든 용어인데 230 바이트에 왜 10억을 뜻하는 접두사 "기가"가 붙었는지 궁금한 사람도 있을 것이다. 사실 상용 하드디스크의 용량 계산은 실제와 차이가 있는데, 자세한 건 기억장치/표기 용량과 실제를 참조.
줄임 기호로는 GB라고 쓰는데 뒤의 B를 소문자 b로 쓰면 기가비트(Gb)가 되므로 주의해야 한다. 참고로 100기가 혹은 100GB로 쓰면 될 것을 100G로 표기하는 것을 종종 볼 수 있다. 대부분 뜻은 통하므로 큰 문제는 아니지만 GB인지 Gb인지 구분이 불가할 수 있으니 주의하자. 그리고 G는 중력가속도의 단위이기도 하다.
테라바이트 (Terabyte)
기가바이트 다음 단위로. 1테라바이트는 1024기가바이트이다. 현재까지 일반적으로 구할 수 있는 저장장치중에선 가장 큰 용량 단위이다.
페타바이트 (Petabyte)
10 15승ㅇ을 의미하는 SI 접두어인 페타와 컴퓨터 데이터의 표시 단위인 바이트가 합쳐진 자료량을 의미한다.
1024 테라바이트와 같다. 기가로 환산시 1,048,576 기가에 달한다.
엑사바이트 (Exabyte)
1 EiB = 1,152,921,504,606,846,976 bytes
페타바이트의 1024배로 엑사바이트(Exabyte, EB)는 1018 를 의미하는 SI 접두어인 엑사와 컴퓨터 데이터의 표시단위인 바이트가 합쳐진 자료량을 의미하는 단위이다.
기가로 환산시 무려 약 10억기가바이트라는 어마어마한 데이터량을 자랑하며 테라로 환산해도 약 100만 테라바이트에 육박한다. 고화질 영화 약 5억개...
64비트 컴퓨터가 이론적으로 가질 수 있는 램의 최대 용량은 16 EiB이다. 비슷한 숫자 개념에 대해 잠시 언급하자면, TOP 500 에 오른 세계 슈퍼컴퓨터의 성능 총합이 1 엑사플롭스를 돌파하여, 1.22엑사플롭스를 기록했다.
2013년 기준으로 구글의 데이터 센터가 보유한 디스크 총 용량이 10 엑사바이트이며, 추가적으로 5 엑사바이트 용량의 테이프가 백업 스페이스로 구성되어 있다고 한다.
그러나 2013년 이후 유튜브나 구글포토 등 클라우드 환경이 급속도로 커지기 시작했으므로 구글이 보유한 데이터센터 디스크 용량도 폭발적으로 증가했을것으로 보인다.
2020년 11월, 구글이 구글포토의 저장용량 무제한 정책을 폐지한다고 밝혔다. 그와 동시에 구글 포토에 저장된 사진 개수가 총 4조장에 육박한다고 밝혔는데 단순 산술로 1장에 5메가바이트 정도만 차지한다고 하더라도 20엑사바이트이다.
그 외 유튜브나 사진자료 외의 클라우드 디스크까지 합한다면 현재는 30엑사바이트는 족히 넘을 것으로 보인다.
제타바이트 (Zettabyte)
제타바이트(Zettabyte, ZB)는 10의 21승을 의미하는 SI 접두어인 제타와 컴퓨터 데이터의 표시단위인 바이트가 합쳐진 자료량을 의미하는 단위이다. 이전 단위는 엑사바이트, 다음 단위는 요타바이트이다.
1ZB=1,000,000,000,000,000,000,000 바이트
1ZiB=1,180,591,620,717,411,303,424 바이트
미국의 리서치 기업 IDC(International Data Corporation)에 의하면 2018년을 기준으로 인류가 지금까지 생산해 낸 모든 데이터의 총합이 33 제타바이트를 넘겼으며, 2025년까지 175 제타바이트를 기록할 것이라고 예측했다.
요타바이트 (Yottabyte)
Yottabyte. YB
현재까지 만들어진 컴퓨터의 저장 단위 중 가장 큰 단위다. 이름은 SI 접두어 요타에서 따왔다.
요타바이트는 1,000,000,000,000,000,000,000,000[1]바이트, 이며 1YiB=1,208,925,819,614,629,174,706,176바이트에 해당하는 수치다. 테라로 환산하면 약 1조 테라바이트라는 크기를 가진다.
이 기사에선 2025년경에 글로벌 데이터의 총합이 요타바이트에 도달할 것이라고 한다.
요타바이트보다 큰 단위로는 SI 단위계 접두어에 따라 브론토바이트, 락시아바이트, 에르키스틴바이트, 큐타바이트, 엑스싸인트, 지옵바이트, 옴니바이트, 멀티바이트 등으로 확장할 수 있겠으나 현재는 이런 큰 단위의 존재의의가 없어 저장용량의 단위로써 정식 채택되진 않았다. 그래서 비록 이런 단위들이 정말 채택된다고 해도 과연 언제 실용화될 지는 미지수이다. 론나와 퀘카[2]가 브론토 등의 단위를 대신해 쓰일 것 같다.[3]