자료형(data type) - 문자는 프로그램에서 정수로 표현함.
어떤 문자를 컴퓨터 내부에서 표현하기 위해 특정 정수 값을 정의
'A' 는 65
'A'를 65로 변환하는 과정은 인코딩
65를 'A'로 변환하는 과정은 디코딩
문자세트 : 각 문자를 얼마로 표현할 것인지 코드 값을 모아둔 것을 문자세트(charater set)라 함
(ex. ASKII, euc-kr, utf-8, utf-16)
컴퓨터는 숫자밖에 모르기 때문에, 이 숫자를 문자로 바꿔줌.
자바에서는 문자를 나타내기 위해 전세계 표준인 UNICODE를 사용
utf-16 인코딩을 사용 (모든 문자를 2바이트로 표시)
용어 정리
character set: 문자를 숫자로 변환한 값의 세트
encoding: 문자가 숫자로 변환되는 것
decoding: 숫자에서 다시 문자로 변환되는 것
ASKII code: 알파벳과 숫자 특수 문자등을 1바이트에 표현하는데 사용하는 문자세트
UNICODE: 전 세계 표준으로 만든 문자 세트
UTF-8: 1바이트에서 4바이트까지 다양하게 문자를 표현할 수 있음
UTF-16: 2바이트로 문자를 표현
'개념 창고 > JAVA' 카테고리의 다른 글
자바 변하지 않는 상수와 리터럴, 변수의 형 변환 (0) | 2022.06.07 |
---|---|
자바 논리형 자료형 없이 변수 사용하기 (0) | 2022.06.07 |
자바 실수형 (0) | 2022.06.07 |
자바 자료형 (0) | 2022.06.07 |
JAVA 변수 (0) | 2022.06.07 |