unicode.org 에서 표현 가능한 문자 찾기(UTF8)


##배경##

기존 DB(KSC5601 사용)에서 특정한자가 표현이 되지 않아 KSC5601의 문자표(코드표)를 찾아본 결과 해당 한자는 표현이 되지 않는 것으로 판명되었다.

KSC5601의 Superset인 MSWIN949 캐릭터셋도 표현이 안되었고, AL32UTF8에서 표현이 되는지 찾아보기로 하였다.

현재 DBMS의 버전은 10gR2(10.2.0.2.0)

1. ORACLE DBMS의 유니코드 버전 사용현황 확인

오라클 데이터베이스의 유니코드 캐릭터셋 (문서 ID 1608282.1)

캐릭터셋 이름

RDBMS 버전

유니코드 버전

AL24UTFFSS

7.2-8.1

1.1

UTF8

8.0-12c

2.1 (8.0-8.1.6) , 3.0 (8.1.7-12.1)

UTFE

8.0-12c

2.1 (8.0-8.1.6) , 3.0 (8.1.7-12.1)

AL32UTF8*

9.0-12c

3.0 (9.0), 3.1 (9.2), 3.2 (10.1), 4.01
(10.2), 5.0 (11.1 and 11.2), 6.1 (12.1).

AL16UTF16**

9.0-12c

3.0 (9.0), 3.1 (9.2), 3.2 (10.1), 4.01
(10.2), 5.0 (11.1 and 11.2), 6.1 (12.1).

10gR2 버전에서 AL32UTF8 사용시 유니코드 버전은 4.01 사용중으로 확인

2. 해당 한자(문자)의 유니코드 찾기

http://www.koreanhistory.or.kr/ 사이트에서 해당 한자 검색

해당 한자의 유니코드는 7888


3. unicode.org에서 확인

http://www.unicode.org/ 에서 The Unicode Standard – Code Charts 클릭

위에서 찾은 유니코드 7888 입력

위에서 찾았던 유니코드 4.1에 해당하는 PDF 선택

해당 한자를 검색 


## 캐릭터셋 문자표 참고

KSC5601 문자표 : http://cs.sungshin.ac.kr/~shim/demo/codetable.htm

MSWIN949 문자표 : http://blog.naver.com/ilovelucifer/123476069


Comments

comments

haisins

오라클 DBA 박용석 입니다. haisins@gmail.com 으로 문의 주세요.

댓글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다