[컴퓨터 구조] 0과 1로 표현하는 데이터

ComputerScience/컴퓨터 구조

ruu++ 2024. 4. 21. 03:13

컴퓨터는 0과 1로 데이터를 표현합니다. 그러므로 사용하는 프로그래머 및 개발자는 이 세계에 익숙해지며,
숙지해야 할 필요가 있습니다. 데이터 단위부터 이진수와 16진수를 어떻게 다루는지 살펴보고자 합니다.

데이터 단위

1bit
- 0과 1을 표현하는 방법을 1bit라고 말합니다
- 1비트의 표현 가능 갯수 2, 2비트의 표현 가능 갯수 4, 3비트의 표현 가능 갯수 8
- 2의 bit 제곱의 표현할 수 있는 정보를 가집니다.
- 더 자세하게 알고 싶다면 해당 문서를 참고하세요. 컴퓨터의 동작원리 트랜지스터
1byte
- bit가 8개로 묶으면 byte입니다.
- 2의 8 제곱이므로 256가지를 표현할 수 있습니다.
1kilobtye
- 바이트를 1000개를 묶은 단위를 kb라고 말합니다.
magabyte
- 키로바이트를 1000개로 묶은 단위입니다.
terabyte
- 키로 바이트를 1000개로 묶은 단위입니다.

위에서 말하다 싶이 컴퓨터는 0과 1로 이뤄진 묶음으로 데이터를 다룹니다.

컴퓨터는 2의 보수를 통해 음수와 양수를 표현합니다.

부호비트(Most Significant Bit : MSB) 숫자체계에서 보통 2진수의 맨앞 비트를 양수를 판별하기 위한 부호로 사용합니다.
실제 프로그래밍 언어들은 맨 앞의 비트는 음, 양수를 위해서 사용합니다. 참고자료: 프로그래밍 언어에서 2의 보수

사람이 언어를 컴퓨터가 읽을 수 있도록 문자 집합을 제공합니다.

아스키 코드는 단어당 1byte로 1비트의 에러 검출을 위한 패러티 비트(parity bit) 와 7비트의 표현 가능 비트를 가졌습니다.
128개의 문자를 표현가능합니다.
하나의 단어에 1byte를 차지한다는 것을 안다는 것이 제일 중요합니다!!.

한글을 지원하는 문자 집합을 제공합니다.
ASCII(아스키코드)의 표현 가능한 문자 수로는 한글을 표현하기에 턱 없이 부족하여, 등장한 인코딩 방식입니다.

UTF는 유니코드(문자 집합)를 사용하여 통일된 표준 인코딩 방식을 말합니다.
다국어를 지원하기 위해서 각 나라의 인코딩을 모두 알아야 하는 번거로움을 해결하기 위해 등장한 것이 유니코드입니다.

1110XXXX 10XXXXXX 10XXXXXX 에서 1001 0100 1110 0100 값을 대입하여 11101001 10010011 10100100₍₂₎ 라는 값을 가지게 됩니다.

긴 글 읽어주셔서 감사합니다!